Standardabweichung und Standardfehler sind vielleicht die beiden am wenigsten verstandenen Statistiken, die häufig in Datentabellen angezeigt werden. Der folgende Artikel soll ihre Bedeutung erklären und einen zusätzlichen Einblick geben, wie sie in der Datenanalyse verwendet werden.
Standardabweichung und Standardfehler sind vielleicht die beiden am wenigsten verstandenen Statistiken, die häufig in Datentabellen angezeigt werden. Der folgende Artikel soll ihre Bedeutung erklären und einen zusätzlichen Einblick geben, wie sie in der Datenanalyse verwendet werden. Beide Statistiken werden typischerweise zusammen mit dem Mittelwert einer Variablen angezeigt, und in gewissem Sinne sprechen sie beide über den Mittelwert. Sie werden oft auch als „Standardabweichung des Mittelwerts“ und „Standardfehler des Mittelwerts“ bezeichnet. Sie sind jedoch nicht austauschbar und stellen sehr unterschiedliche Konzepte dar.
Standardabweichung
Die Standardabweichung (oft abgekürzt als „Std Dev“ oder „SD“) gibt einen Hinweis darauf, wie weit die einzelnen Antworten auf eine Frage vom Mittelwert abweichen oder „abweichen“. Die SD sagt dem Forscher, wie weit die Antworten gestreut sind – sind sie um den Mittelwert konzentriert oder weit & verstreut? Haben alle Befragten Ihr Produkt in der Mitte der Skala bewertet, oder haben einige es geliebt und einige es gehasst?
Angenommen, Sie haben die Befragten gebeten, Ihr Produkt für eine Reihe von Eigenschaften auf einer 5-Punkte-Skala zu bewerten. Der Mittelwert für eine Gruppe von zehn Befragten (unten mit „A“ bis „J“ bezeichnet) für „gutes Preis-Leistungs-Verhältnis“ war 3,2 mit einem SD von 0,4 und der Mittelwert für „Zuverlässigkeit des Produkts“ war 3,4 mit einem SD von 2,1. Auf den ersten Blick (wenn man nur die Mittelwerte betrachtet) scheint es, dass die Zuverlässigkeit höher bewertet wurde als der Wert. Aber die höhere SD für die Zuverlässigkeit könnte darauf hinweisen (wie in der Verteilung unten gezeigt), dass die Antworten sehr polarisiert waren, wobei die meisten Befragten keine Probleme mit der Zuverlässigkeit hatten (bewerteten das Attribut mit einer „5“), aber ein kleinerer, aber wichtiger Teil der Befragten hatte ein Zuverlässigkeitsproblem und bewertete das Attribut mit „1“. Die Betrachtung des Mittelwerts allein sagt nur einen Teil der Geschichte aus, doch allzu oft ist es das, worauf sich Forscher konzentrieren. Es ist wichtig, die Verteilung der Antworten zu berücksichtigen, und die SD bietet ein wertvolles beschreibendes Maß dafür.
Beantworter: | Guter Wert für das Geld: |
Produkt Zuverlässigkeit: |
A | 3 | 1 |
B | 3 | 1 |
C | 3 | 1 | D | 3 | 1 |
E | 4 | 5 |
F | 4 | 5 |
G | 3 | 5 | H | 3 | 5 |
I | 3 | 5 |
J | 3 | 5 |
Mittelwert | 3.2 | 3.4 |
Std Dev | 0.4 | 2.1 |
Zwei sehr unterschiedliche Verteilungen von Antworten auf einer 5-Punkte-Bewertungsskala können denselben Mittelwert ergeben. Betrachten Sie das folgende Beispiel, das die Antwortwerte für zwei verschiedene Ratings zeigt. Im ersten Beispiel (Bewertung „A“) ist die Standardabweichung gleich Null, weil ALLE Antworten genau dem Mittelwert entsprachen. Die einzelnen Antworten wichen überhaupt nicht vom Mittelwert ab. Bei Rating „B“ ist die Standardabweichung höher, obwohl der Gruppenmittelwert der gleiche ist (3,0) wie bei der ersten Verteilung. Die Standardabweichung von 1,15 zeigt, dass die einzelnen Antworten im Durchschnitt* etwas mehr als 1 Punkt vom Mittelwert entfernt waren.
Respondent: | Bewertung „A“ | Bewertung „B“ |
A | 3 | 1 |
B | 3 | 2 |
C | 3 | 2 |
D | 3 | 3 |
E | 3 | 3 |
F | 3 | 3 |
G | 3 | 3 |
H | 3 | 4 |
I | 3 | 4 |
J | 3 | 5 |
Mittelwert | 3.0 | 3.0 |
Std Dev | 0.00 | 1.15 |
Eine andere Möglichkeit, die Standardabweichung zu betrachten, besteht darin, die Verteilung als ein Histogramm der Antworten darzustellen. Eine Verteilung mit einer niedrigen SD würde als hohe schmale Form dargestellt werden, während eine große SD durch eine breitere Form angezeigt würde.
Die SD gibt im Allgemeinen nicht „richtig oder falsch“ oder „besser oder schlechter“ an – eine niedrigere SD ist nicht unbedingt wünschenswerter. Sie wird als rein deskriptive Statistik verwendet. Sie beschreibt die Verteilung in Bezug auf den Mittelwert.
*Technischer Hinweis: Die Standardabweichung als „durchschnittliche Abweichung“ zu betrachten, ist eine hervorragende Möglichkeit, ihre Bedeutung konzeptionell zu verstehen. Sie wird jedoch nicht tatsächlich als Durchschnitt berechnet (wenn es so wäre, würden wir sie „durchschnittliche Abweichung“ nennen). Stattdessen wird sie „standardisiert“, eine etwas komplexe Methode zur Berechnung des Wertes mit Hilfe der Summe der Quadrate. Für praktische Zwecke ist die Berechnung nicht wichtig. Die meisten Tabellierungsprogramme, Tabellenkalkulationen oder andere Datenverwaltungsprogramme werden die SD für Sie berechnen. Wichtiger ist es, zu verstehen, was die Statistik aussagt.
Standardfehler
Der Standardfehler („Std Err“ oder „SE“), ist ein Hinweis auf die Zuverlässigkeit des Mittelwertes. Ein kleiner SE ist ein Hinweis darauf, dass der Stichprobenmittelwert ein genaueres Abbild des tatsächlichen Populationsmittelwertes ist. Ein größerer Stichprobenumfang führt normalerweise zu einem kleineren SE (während der SD nicht direkt vom Stichprobenumfang beeinflusst wird).
Bei den meisten Umfragen wird eine Stichprobe aus einer Population gezogen. Aus den Ergebnissen dieser Stichprobe werden dann Rückschlüsse auf die Grundgesamtheit gezogen. Wenn eine zweite Stichprobe gezogen wurde, werden die Ergebnisse wahrscheinlich nicht genau mit der ersten Stichprobe übereinstimmen. Wenn der Mittelwert für ein Rating-Attribut bei einer Stichprobe 3,2 war, könnte er bei einer zweiten Stichprobe desselben Umfangs 3,4 sein. Wenn wir eine unendliche Anzahl von Stichproben (mit gleichem Umfang) aus unserer Grundgesamtheit ziehen würden, könnten wir die beobachteten Mittelwerte als eine Verteilung darstellen. Wir könnten dann einen Mittelwert aller unserer Stichprobenmittelwerte berechnen. Dieser Mittelwert würde dem wahren Populationsmittelwert entsprechen. Wir können auch die Standardabweichung der Verteilung der Stichprobenmittelwerte berechnen. Die Standardabweichung dieser Verteilung der Stichprobenmittelwerte ist der Standardfehler jedes einzelnen Stichprobenmittelwertes. Anders ausgedrückt: Der Standardfehler ist die Standardabweichung des Populationsmittelwerts.
Stichprobe: | Mittelwert |
1.1 | 3.2 | 2. | 3.4 | 3. | 3.3 | 4. | 3.2 | 5. | 3.1 |
. | |
. | . |
. | . |
Mittelwert | 3.3 |
Std Dev | 0.13 |
Denken Sie darüber nach. Wenn die SD dieser Verteilung uns hilft zu verstehen, wie weit ein Stichprobenmittelwert vom wahren Populationsmittelwert entfernt ist, dann können wir dies nutzen, um zu verstehen, wie genau jeder einzelne Stichprobenmittelwert in Bezug auf den wahren Mittelwert ist. Das ist die Essenz des Standardfehlers. In Wirklichkeit haben wir nur eine einzige Stichprobe aus unserer Grundgesamtheit gezogen, aber wir können dieses Ergebnis verwenden, um die Zuverlässigkeit unseres beobachteten Stichprobenmittelwerts abzuschätzen.
In der Tat sagt uns der SE, dass wir zu 95 % sicher sein können, dass unser beobachteter Stichprobenmittelwert plus oder minus ungefähr 2 (eigentlich 1,96) Standardfehler vom Grundgesamtheitsmittelwert abweicht.
Die folgende Tabelle zeigt die Verteilung der Antworten unserer ersten (und einzigen) Stichprobe, die für unsere Forschung verwendet wurde. Der SE von 0,13 ist relativ klein und gibt uns einen Hinweis darauf, dass unser Mittelwert relativ nahe am wahren Mittelwert der Grundgesamtheit liegt. Die Fehlerspanne (bei 95 % Konfidenz) für unseren Mittelwert ist (ungefähr) doppelt so hoch (+/- 0,26) und sagt uns, dass der wahre Mittelwert höchstwahrscheinlich zwischen 2,94 und 3,46 liegt.
Antwort: | Bewertung: |
A | 3 |
B | 3 |
C | 3 |
D | 3 |
E | 4 |
F | 4 |
G | 3 | H | 3 | I | 3 | J | 3 | Mittelwert | 3.2 |
Std Err | 0.13 |
Zusammenfassung
Viele Forscher verstehen den Unterschied zwischen Standardabweichung und Standardfehler nicht, obwohl sie üblicherweise in die Datenanalyse einbezogen werden. Während die tatsächlichen Berechnungen für Standardabweichung und Standardfehler sehr ähnlich aussehen, stellen sie zwei sehr unterschiedliche, aber komplementäre Maße dar. SD sagt uns etwas über die Form unserer Verteilung, wie nah die einzelnen Datenwerte am Mittelwert liegen. SE sagt uns, wie nahe unser Stichprobenmittelwert am wahren Mittelwert der Gesamtpopulation liegt. Zusammen helfen sie, ein vollständigeres Bild zu liefern, als es der Mittelwert allein vermag.