Standardabweichung in R
Als statistische Programmiersprache bietet R die Standardfunktion sd(' ')
, um die Standardabweichung der Werte zu berechnen.
Was ist die Standardabweichung?
‘Die Standardabweichung misst die Streuung der Werte’.
Je höher die Abweichung, desto weiter ist die Streuung der Werte.
Je niedriger die Abweichung, desto enger ist die Streuung der Werte.
Einfach ausgedrückt wird die Formel so definiert: Die Abweichung ist die Quadratwurzel der ‘Varianz’.
Bedeutung der Standardabweichung
- Die Standardabweichung wandelt negative Zahlen durch Quadrieren in positive Zahlen um.
- Sie zeigt größere Abweichungen, sodass Sie diese besonders betrachten können.
- Sie zeigt die zentrale Tendenz, was in der Analyse eine sehr nützliche Funktion ist.
- Sie spielt eine wichtige Rolle in Finanzen, Wirtschaft, Analysen und Messungen.
Bevor wir ins Thema einsteigen, merken Sie sich diese Definition!
Varianz – Sie wird als die quadrierten Abweichungen zwischen dem beobachteten Wert und dem erwarteten Wert definiert.
Standardabweichung in R für Werte in einer Liste finden
In dieser Methode erstellen wir eine Liste x
und fügen einige Werte hinzu. Dann können wir die Abweichung dieser Werte in der Liste berechnen.
x <- c(34,56,87,65,34,56,89) #erstellt die Liste 'x' mit einigen Werten sd(x) #berechnet die Standardabweichung der Werte in der Liste 'x'
[/dm_code_snippet]
Ausgabe —> 22.28175
Jetzt können wir versuchen, bestimmte Werte aus der Liste y
zu extrahieren, um die Abweichung zu berechnen.
y <- c(34,65,78,96,56,78,54,57,89) #erstellt eine Liste 'y' mit einigen Werten data1 <- y[1:5] #extrahiert bestimmte Werte anhand ihres Indexes sd(data1) #berechnet die Standardabweichung für indizierte oder extrahierte Werte aus der Liste.
[/dm_code_snippet]
Ausgabe —> 23.28519
Standardabweichung für Werte in einer CSV-Datei finden
In dieser Methode importieren wir eine CSV-Datei, um die Abweichung in R für die darin gespeicherten Werte zu berechnen.
readfile <- read.csv('testdata1.csv') #liest eine CSV-Datei ein data2 <- readfile$Values #holt Werte, die im Header 'Values' gespeichert sind sd(data2) #berechnet die Standardabweichung
[/dm_code_snippet]
Ausgabe —> 17.88624
Hohe und niedrige Abweichung
Im Allgemeinen liegen die Werte bei einer niedrigen Standardabweichung sehr nahe am Durchschnittswert, während die Werte bei einer hohen Abweichung weit vom Durchschnittswert entfernt sind.
Wir können dies mit einem Beispiel veranschaulichen.
x <- c(79,82,84,96,98) mean(x) ---> 82.22222 sd(x) ---> 10.58038
[/dm_code_snippet]
Um diese Werte in einem Balkendiagramm in R darzustellen, führen Sie den folgenden Code aus.
install.packages("ggplot2") library(ggplot2) values <- data.frame(marks=c(79,82,84,96,98), students=c(0,1,2,3,4,)) head(values) #zeigt die Werte an x <- ggplot(values, aes(x=marks, y=students))+geom_bar(stat='identity') x #zeigt das Diagramm an
[/dm_code_snippet]
Veranschaulichung einer hohen Standardabweichung
y <- c(23,27,30,35,55,76,79,82,84,94,96) mean(y) ---> 61.90909 sd(y) ---> 28.45507
[/dm_code_snippet]
Fazit
Das Finden der Standardabweichung der Werte in R ist einfach. R bietet die Funktion sd(' ')
, um sie zu berechnen. Sie können eine Liste von Werten erstellen oder eine CSV-Datei importieren, um die Abweichung zu berechnen.
Wichtig: Vergessen Sie nicht, die Abweichung zu berechnen, indem Sie einige Werte aus einer Datei oder Liste durch Indexierung extrahieren, wie oben gezeigt.
Nutzen Sie das Kommentarfeld, um Fragen zur Funktion sd(' ')
in R zu stellen. Viel Spaß beim Lernen!