Standardfehler

Exakter WertEdit

Wenn eine statistisch unabhängige Stichprobe von n {\displaystyle n}

$n$

Beobachtungen x 1 , x 2 , … , x n {\displaystyle x_{1},x_{2},\ldots ,x_{n}}

$x_{1},x_{2},\ldots ,x_{n}$

werden aus einer statistischen Grundgesamtheit mit einer Standardabweichung von σ {\displaystyle \sigma }

$\sigma$

, dann ist der aus der Stichprobe x berechnete Mittelwert ¯ {\displaystyle {\bar {x}}

${\bar {x}}$

einen zugehörigen Standardfehler auf den Mittelwert σ x ¯ {\displaystyle {\sigma }_{\bar {x}}}

${\sigma }_{\bar {x}$

gegeben durch: σ x ¯ = σ n {\displaystyle {\sigma }_{\bar {x}}\ ={\frac {\sigma }{\sqrt {n}}}}

${\sigma }_{\bar {x}} ={\frac {\sigma }{\sqrt {n}}}$

Praktisch bedeutet dies, dass beim Versuch, den Wert eines Populationsmittelwertes zu schätzen, aufgrund des Faktors 1 / n {\displaystyle 1/{\sqrt {n}}

$1/{\sqrt {n}}$

, die Verringerung des Fehlers der Schätzung um den Faktor 2 die Erfassung von viermal so vielen Beobachtungen in der Stichprobe erfordert; die Verringerung um den Faktor 10 erfordert hundertmal so viele Beobachtungen.

EstimateEdit

Die Standardabweichung σ \displaystyle \sigma }

$\sigma$

der zu untersuchenden Grundgesamtheit ist nur selten bekannt. Daher wird der Standardfehler des Mittelwerts üblicherweise geschätzt, indem man σ {\displaystyle \sigma }

$\sigma$

durch die Stichprobenstandardabweichung σ x {\displaystyle \sigma _{x}}

$\sigma _{x}$

stattdessen: σ x ¯ ≈ σ x n {\displaystyle {\sigma }_{\bar {x}}\ \approx {\frac {\sigma _{x}}{\sqrt {n}}}}

${\sigma }_{\bar {x}} \approx {\frac {\sigma _{x}}{\sqrt {n}}}$

Da es sich hierbei nur um einen Schätzer für den wahren „Standardfehler“ handelt, sind andere Schreibweisen üblich, wie:

σ x ¯ ^ = σ x n {\displaystyle {\displaystyle {\sigma _{\bar {x}}}}={\frac {\sigma _{x}}{\sqrt {n}}}}

${\widehat {\sigma _{\bar {x}}}}={\frac {\sigma _{x}}{\sqrt {n}}}$

oder alternativ s x ¯ = s n {\displaystyle \operatorname {s} _{\bar {x}}\ ={\frac {s}{\sqrt {n}}}}

$\operatorname {s} _{\bar {x}}\ ={\frac {s}{\sqrt {n}}}$

Eine häufige Quelle der Verwirrung entsteht, wenn nicht klar zwischen der Standardabweichung der Grundgesamtheit ( σ {\displaystyle \sigma }

$\sigma$

) und der Standardabweichung der Stichprobe ( σ x {\displaystyle \sigma _{x}}

$\sigma _{x}$

), die Standardabweichung des Mittelwertes selbst ( σ x ¯ {\displaystyle \sigma _{\bar {x}}}

$\sigma _{\bar {x}$

, was der Standardfehler ist), und der Schätzer der Standardabweichung des Mittelwerts ( σ x ¯ ^ {\displaystyle \sigma _{\bar {x}}}}}

${\widehat {\sigma _{\bar {x}}}}$

, der die am häufigsten berechnete Größe ist und umgangssprachlich auch oft als Standardfehler bezeichnet wird).

Genauigkeit des SchätzersBearbeiten

Wenn der Stichprobenumfang klein ist, führt die Verwendung der Standardabweichung der Stichprobe anstelle der wahren Standardabweichung der Grundgesamtheit zu einer systematischen Unterschätzung der Standardabweichung der Grundgesamtheit und damit auch des Standardfehlers. Bei n = 2 liegt die Unterschätzung bei etwa 25 %, bei n = 6 jedoch nur bei 5 %. Gurland und Tripathi (1971) liefern eine Korrektur und Gleichung für diesen Effekt. Sokal und Rohlf (1981) geben eine Gleichung für den Korrekturfaktor für kleine Stichproben von n < 20 an. Siehe unverzerrte Schätzung der Standardabweichung für eine weitere Diskussion.

AbleitungBearbeiten

Der Standardfehler des Mittelwerts kann aus der Varianz einer Summe unabhängiger Zufallsvariablen abgeleitet werden, wenn man die Definition der Varianz und einige einfache Eigenschaften davon berücksichtigt. Wenn x 1 , x 2 , … , x n {\displaystyle x_{1},x_{2},\ldots ,x_{n}}

$x_{1},x_{2},\ldots ,x_{n}$

sind n {\displaystyle n}

$n$

unabhängige Beobachtungen aus einer Grundgesamtheit mit Mittelwert x ¯ {\displaystyle {\bar {x}}

${\bar {x}}$

und Standardabweichung σ {\displaystyle \sigma }

$\sigma$

, dann können wir die Summe T = ( x 1 + x 2 + ⋯ + x n ) {\displaystyle T=(x_{1}+x_{2}+\cdots +x_{n})}

$T=(x_{1}+x_{2}+\cdots +x_{n})$

Was aufgrund der Bienaymé-Formel eine Varianz

Var ( T ) = ( Var ( x 1 ) + Var ( x 2 ) + ⋯ + Var ( x n ) ) = n σ 2 . {\displaystyle \operatorname {Var} (T)={\big (}\Operatorname {Var} (x_{1})+\operatorname {Var} (x_{2})+\cdots +\operatorname {Var} (x_{n}){\big )}=n\sigma ^{2}.}

$\operatorname {Var} (T)={\big (}\operatorname {Var} (x_{1})+\operatorname {Var} (x_{2})+\cdots +\operatorname {Var} (x_{n}){\big )}=n\sigma ^{2}.$

Der Mittelwert dieser Messungen x ¯ {\displaystyle {\bar {x}}

${\bar {x}}$

ist einfach gegeben durch x ¯ = T / n {\displaystyle {\bar {x}}=T/n}

${\bar {x}}=T/n$

Die Varianz des Mittelwertes ist dann

Var ( T n ) = 1 n 2 Var ( T ) = 1 n 2 n σ 2 = σ 2 n . {\displaystyle \operatorname {Var} \(T)={\frac {T}{n}}\right)={\frac {1}{n^{2}}}}Operatorname {Var} (T)={\frac {1}{n^{2}}}n\sigma ^{2}={\frac {\sigma ^{2}}{n}}.}

$\operatorname {Var} \left({\frac {T}{n}}\right)={\frac {1}{n^{2}}}\operatorname {Var} (T)={\frac {1}{n^{2}}}n\sigma ^{2}={\frac {\sigma ^{2}}{n}}.$

Der Standardfehler ist per Definition die Standardabweichung von x ¯ {\displaystyle {\bar {x}}}

${\bar {x}}$

, die einfach die Quadratwurzel der Varianz ist: σ x ¯ = σ 2 n = σ n {\displaystyle \sigma _{\bar {x}}={\sqrt {\frac {\sigma ^{2}}{n}}}={\frac {\sigma }{\sqrt {n}}}}

$\sigma _{\bar {x}}={\sqrt {\frac {\sigma ^{2}}{n}}}={\frac {\sigma }{\sqrt {n}}}$

Für korrelierte Zufallsvariablen muss die Stichprobenvarianz gemäß dem zentralen Grenzwertsatz der Markov-Kette berechnet werden.

Unabhängige und identisch verteilte Zufallsvariablen mit zufälligem Stichprobenumfang

Es gibt Fälle, in denen eine Stichprobe genommen wird, ohne im Voraus zu wissen, wie viele Beobachtungen nach einem bestimmten Kriterium akzeptabel sein werden. In solchen Fällen ist der Stichprobenumfang N {\displaystyle N}

$N$

ist eine Zufallsvariable, deren Variation zur Variation von X {\displaystyle X}

$X$

hinzukommt, so dass Var ( T ) = E ( N ) Var ( X ) + Var ( N ) ( E ( X ) ) 2 {\displaystyle \operatorname {Var} (T)=\Operatorname {E} (N)\Operatorname {Var} (X)+\Operatorname {Var} (N){\big (}\operatorname {E} (X){\big )}^{2}}

$\operatorname {Var} (T)=\operatorname {E} (N)\Operatorname {Var} (X)+\Operatorname {Var} (N){\big (}\operatorname {E} (X){\big )}^{2}$

Wenn N {\displaystyle N}

$N$

eine Poisson-Verteilung hat, dann ist E ( N ) = Var ( N ) {\displaystyle \operatorname {E} (N)=\operatorname {Var} (N)}

$\operatorname {E} (N)=\operatorname {Var} (N)$

mit Schätzer N = n {\displaystyle N=n}

$N=n$

. Daraus ergibt sich der Schätzer von Var ( T ) {\displaystyle \operatorname {Var} (T)}

$\operatorname {Var} (T)$

wird zu n S X 2 + n X ¯ 2 {\displaystyle nS_{X}^{2}+n{\bar {X}}^{2}}

$nS_{X}^{2}+n{\bar {X}}^{2}$

, was zu der folgenden Formel für den Standardfehler führt: S t a n d a r d E r r o r ( X ¯ ) = S X 2 + X ¯ 2 n {\displaystyle \operatorname {Standard~Error} ({\bar {X}})={\sqrt {\frac {S_{X}^{2}+{\bar {X}}^{2}}{n}}}}

$\operatorname {Standard~Fehler} ({\bar {X}})={\sqrt {\frac {S_{X}^{2}+{\bar {X}}^{2}}{n}}}$

Guinguette Marais Poitevin

Blog

Exakter WertEdit

EstimateEdit

Genauigkeit des SchätzersBearbeiten

AbleitungBearbeiten

Unabhängige und identisch verteilte Zufallsvariablen mit zufälligem Stichprobenumfang

Schreibe einen Kommentar Antworten abbrechen