Standardabweichung in R

Als statistische Programmiersprache bietet R die Standardfunktion sd(' '), um die Standardabweichung der Werte zu berechnen.

Was ist die Standardabweichung?

‘Die Standardabweichung misst die Streuung der Werte’.
Je höher die Abweichung, desto weiter ist die Streuung der Werte.
Je niedriger die Abweichung, desto enger ist die Streuung der Werte.
Einfach ausgedrückt wird die Formel so definiert: Die Abweichung ist die Quadratwurzel der ‘Varianz’.

Bedeutung der Standardabweichung

  • Die Standardabweichung wandelt negative Zahlen durch Quadrieren in positive Zahlen um.
  • Sie zeigt größere Abweichungen, sodass Sie diese besonders betrachten können.
  • Sie zeigt die zentrale Tendenz, was in der Analyse eine sehr nützliche Funktion ist.
  • Sie spielt eine wichtige Rolle in Finanzen, Wirtschaft, Analysen und Messungen.

Bevor wir ins Thema einsteigen, merken Sie sich diese Definition!

Varianz – Sie wird als die quadrierten Abweichungen zwischen dem beobachteten Wert und dem erwarteten Wert definiert.

Standardabweichung in R für Werte in einer Liste finden

In dieser Methode erstellen wir eine Liste x und fügen einige Werte hinzu. Dann können wir die Abweichung dieser Werte in der Liste berechnen.

 
 x <- c(34,56,87,65,34,56,89)    #erstellt die Liste 'x' mit einigen Werten

 sd(x)  #berechnet die Standardabweichung der Werte in der Liste 'x'

[/dm_code_snippet]

Ausgabe —> 22.28175

Jetzt können wir versuchen, bestimmte Werte aus der Liste y zu extrahieren, um die Abweichung zu berechnen.

 
 y <- c(34,65,78,96,56,78,54,57,89)  #erstellt eine Liste 'y' mit einigen Werten
 
data1 <- y[1:5] #extrahiert bestimmte Werte anhand ihres Indexes

sd(data1) #berechnet die Standardabweichung für indizierte oder extrahierte Werte aus der Liste.

[/dm_code_snippet]

Ausgabe —> 23.28519

Standardabweichung für Werte in einer CSV-Datei finden

In dieser Methode importieren wir eine CSV-Datei, um die Abweichung in R für die darin gespeicherten Werte zu berechnen.

 
readfile <- read.csv('testdata1.csv')  #liest eine CSV-Datei ein

data2 <- readfile$Values      #holt Werte, die im Header 'Values' gespeichert sind

sd(data2)                              #berechnet die Standardabweichung  

[/dm_code_snippet]

Ausgabe —> 17.88624

Hohe und niedrige Abweichung

Im Allgemeinen liegen die Werte bei einer niedrigen Standardabweichung sehr nahe am Durchschnittswert, während die Werte bei einer hohen Abweichung weit vom Durchschnittswert entfernt sind.

Wir können dies mit einem Beispiel veranschaulichen.

 
x <- c(79,82,84,96,98) mean(x) --->  82.22222
sd(x)
--->  10.58038

[/dm_code_snippet]

Um diese Werte in einem Balkendiagramm in R darzustellen, führen Sie den folgenden Code aus.

 
install.packages("ggplot2")

library(ggplot2)

values <- data.frame(marks=c(79,82,84,96,98), students=c(0,1,2,3,4,))
head(values)                  #zeigt die Werte an
x <- ggplot(values, aes(x=marks, y=students))+geom_bar(stat='identity')
x                             #zeigt das Diagramm an

[/dm_code_snippet]

Veranschaulichung einer hohen Standardabweichung

 
y <- c(23,27,30,35,55,76,79,82,84,94,96) mean(y) ---> 61.90909
sd(y)
---> 28.45507

[/dm_code_snippet]

Fazit

Das Finden der Standardabweichung der Werte in R ist einfach. R bietet die Funktion sd(' '), um sie zu berechnen. Sie können eine Liste von Werten erstellen oder eine CSV-Datei importieren, um die Abweichung zu berechnen.

Wichtig: Vergessen Sie nicht, die Abweichung zu berechnen, indem Sie einige Werte aus einer Datei oder Liste durch Indexierung extrahieren, wie oben gezeigt.

Nutzen Sie das Kommentarfeld, um Fragen zur Funktion sd(' ') in R zu stellen. Viel Spaß beim Lernen!

Kostenlosen Account erstellen

Registrieren Sie sich jetzt und erhalten Sie Zugang zu unseren Cloud Produkten.

Das könnte Sie auch interessieren: