Standaardfout

Exacte waardeEdit

Als een statistisch onafhankelijke steekproef van n {\displaystyle n}

n

waarnemingen x 1 , x 2 , … , x n {\displaystyle x_{1},x_{2},\ldots ,x_{n}}

{\displaystyle x_{1},x_{2},\ldots,x_{n}}

worden genomen uit een statistische populatie met een standaardafwijking van σ {\displaystyle \sigma }

\sigma

, dan is de gemiddelde waarde berekend uit de steekproef x ¯ {{\displaystyle {\bar {x}}}

{\bar {x}}

een standaardafwijking van het gemiddelde σ x ¯ {{\displaystyle {\sigma }_{\bar {x}}}

{\displaystyle {\sigma }_{\bar {x}}

gegeven door: σ x ¯ = σ n {\displaystyle {\sigma }_{\bar {x}}} ={\frac {\sigma }{sqrt {n}}}}

{\displaystyle {\sigma }_{\bar {x}} ={\frac {\sigma }{\sqrt {n}}}}

.

Praktisch betekent dit dat wanneer we de waarde van een populatiegemiddelde proberen te schatten, we vanwege de factor 1 / n {\displaystyle 1/{\sqrt {n}}

1/{\sqrt {n}}

, de fout in de schatting met een factor twee kan worden verkleind door vier keer zoveel waarnemingen in de steekproef te doen; voor een factor tien zijn honderd keer zoveel waarnemingen nodig.

RamingEdit

De standaardafwijking σ {{displaystyle \sigma }

\sigma

van de populatie die wordt bemonsterd, is zelden bekend. Daarom wordt de standaardafwijking van het gemiddelde gewoonlijk geschat door σ {{\displaystyle \sigma } } te vervangen door σ {{\displaystyle \sigma } }.

\sigma

te vervangen door de standaardafwijking van de steekproef σ x {\displaystyle \sigma _{x}}

in plaats daarvan: σ x ¯ ≈ σ x n {{\displaystyle {\sigma }_{\bar {x}}} {\approx {\frac {\sigma _{x}}{sqrt {n}}}}

{\displaystyle {\sigma }_{\bar {x}} \approx {\frac {\sigma _{x}}{\sqrt {n}}}}

.

Omdat dit slechts een schatter voor de ware “standaardfout” is, is het gebruikelijk hier andere notaties te zien zoals:

σ x ¯ ^ = σ x n {{}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}= {{}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}

{\displaystyle {\widehat {\sigma _{bar {x}}}}={\frac {\sigma _{x}}{\sqrt {n}}}}

of anders s x ¯ = s n {\displaystyle \operatorname {s} _{\bar {x}}}={\frac {s}{\sqrt {n}}}}

{\displaystyle \operatorname {s} _{\bar {x}} ={\frac {s}{\sqrt {n}}}}

.

Een veel voorkomende bron van verwarring ontstaat wanneer er geen duidelijk onderscheid wordt gemaakt tussen de standaardafwijking van de populatie ( σ {\displaystyle \sigma }

\sigma

), de standaardafwijking van de steekproef ( σ x {\displaystyle \sigma _{x}}

Sigma _{x}

), de standaardafwijking van het gemiddelde zelf ( σ x ¯ {\displaystyle \sigma _{x}}}

{\displaystyle \sigma _{\bar {x}}

, die de standaardfout is), en de schatter van de standaardafwijking van het gemiddelde ( σ x ¯ ^ {\displaystyle \widehat {\sigma _{\bar {x}}}}}

{\displaystyle {widehat {\sigma _{\bar {x}}}}}

, de meest berekende grootheid, die in de volksmond ook wel de standaardfout wordt genoemd).

Nauwkeurigheid van de schatterEdit

Bij een kleine steekproefomvang leidt het gebruik van de standaardafwijking van de steekproef in plaats van de werkelijke standaardafwijking van de populatie tot een systematische onderschatting van de standaardafwijking van de populatie, en dus ook van de standaardfout. Bij n = 2 is de onderschatting ongeveer 25%, maar bij n = 6 is de onderschatting slechts 5%. Gurland en Tripathi (1971) geven een correctie en een vergelijking voor dit effect. Sokal en Rohlf (1981) geven een vergelijking van de correctiefactor voor kleine steekproeven van n < 20. Zie unbiased estimation of standard deviation voor verdere discussie.

DerivationEdit

De standaardfout op het gemiddelde kan worden afgeleid uit de variantie van een som van onafhankelijke willekeurige variabelen, gegeven de definitie van variantie en enkele eenvoudige eigenschappen daarvan. Als x 1 , x 2 , … , x n {{1},x_{2},\ldots,x_{n}}

{\displaystyle x_{1},x_{2},\ldots,x_{n}}

zijn n {\displaystyle n}

n

onafhankelijke waarnemingen uit een populatie met gemiddelde x ¯ {{displaystyle {x}}

{bar {x}}

en standaardafwijking σ {\displaystyle \sigma }

\sigma

, dan kunnen we het totaal T = ( x 1 + x 2 + ⋯ + x n ) {\displaystyle T=(x_{1}+x_{2}+\dots +x_{n})} definiëren.

{\displaystyle T=(x_{1}+x_{2}+\cdots +x_{n})}

die door de formule van Bienaymé variantie zal hebben

Var ( T ) = ( Var ( x 1 ) + Var ( x 2 ) + ⋯ + Var ( x n ) ) = n σ 2 . {Voornaam {Var} (T)= {grote (}) operatienaam {Var} (x_{1})+operatornaam {Var} (x_{2})++operatornaam {Var} (x_{n})}=n-sigma ^{2}.}

{Displaystyle \operatornaam {Var} (T) = {operatornaam {Var} (x_{1})+operatornaam {Var} (x_{2})++operatornaam {Var} (x_{n}){{2}.}

Het gemiddelde van deze metingen x ¯ {displaystyle {{x}}

{\bar {x}}

wordt eenvoudigweg gegeven door x ¯ = T / n {\displaystyle {\bar {x}}=T/n}

{\displaystyle {\bar {x}}=T/n}

.

De variantie van het gemiddelde is dan

Var ( T n ) = 1 n 2 Var ( T ) = 1 n 2 n σ 2 = σ 2 n . {\displaystyle \operatorname {Var} \links({\frac {T}{n}} rechts)={\frac {1}{n^{2}}}\operatornaam {Var} (T)={\frac {1}{n^{2}}n}={\frac {\sigma ^{2}}{n}}.}

{Displaystyle \operatornaam {Var} \links({\frac {T}{n}} rechts)={\frac {1}{n^{2}}} {operatornaam {Var} (T)={{{frac {1}{n^{2}}n}}^{2}={{frac {{2}}{n}}.}

De standaardfout is per definitie de standaardafwijking van x ¯ {displaystyle {x}}

{\bar {x}}

die eenvoudigweg de vierkantswortel uit de variantie is: σ x ¯ = σ 2 n = σ n {\displaystyle \sigma _{bar {x}}={\sqrt {\frac {\sigma ^{2}}{n}}={\frac {\sigma }{\sqrt {n}}}}

{\displaystyle \sigma _{\bar {x}}={\sqrt {\frac {\sigma ^{2}}{n}}={\frac {\sigma }{\sqrt {n}}}}

.

Voor gecorreleerde willekeurige variabelen moet de steekproefvariantie worden berekend volgens de Markov chain central limit theorem.

Onafhankelijk en identiek verdeelde willekeurige variabelen met willekeurige steekproefgrootteEdit

Er zijn gevallen waarin een steekproef wordt genomen zonder van tevoren te weten hoeveel waarnemingen volgens een of ander criterium acceptabel zullen zijn. In dergelijke gevallen is de steekproefgrootte N {{Displaystyle N}

N

is een willekeurige variabele waarvan de variatie optelt bij de variatie van X {\displaystyle X}

X

zodanig dat, Var ( T ) = E ( N ) Var ( X ) + Var ( N ) ( E ( X ) ) 2 {\displaystyle \operatorname {Var} (T)=operatornaam {E} (N)=operatornaam {Var} (X)+operatornaam {Var} (N){operatornaam {E} (X){\big )}^{2}}

{Stijloperatornaam {Var} (T)=operatornaam {E} (N)=operatornaam {Var} (X)+operatorname {Var} (N){operatornaam {E} (X){\big )}^{2}}

Als N {\big}}

N

een Poisson-verdeling heeft, dan is E ( N ) = Var ( N ) {\displaystyle \operatornaam {E} (N)= {operatornaam {Var} (N)}

{\displaystyle \operatorname {E} (N)=operatornaam {Var} (N)}

met schatter N = n {{\displaystyle N=n}

{\displaystyle N=n}

. Vandaar dat de schatter van Var ( T ) {\displaystyle \operatornaam {Var} (T)}

{\displaystyle \operatorname {Var} (T)}

wordt n S X 2 + n X ¯ 2 {{\displaystyle nS_{X}^{2}+n{\bar {X}}^{2}}

{\displaystyle nS_{X}^{2}+n{\bar {X}}^{2}}

, wat leidt tot de volgende formule voor de standaardfout: S t a n d a r d E r r o r ( X ¯ ) = S X 2 + X ¯ 2 n {Standaard~Error} ({bar {X}})={\sqrt {\frac {S_{X}^{2}+{bar {X}}^{2}}{n}}}}

{Displaystyle \operatornaam {Standaard~Fout}} ({bar {X}})={\sqrt {\frac {S_{X}^{2}+{bar {X}}^{2}}{n}}}}

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *