Erreur standard

Valeur exacteEdit

Si un échantillon statistiquement indépendant de n {\displaystyle n}.

n

observations x 1 , x 2 , … , x n {\displaystyle x_{1},x_{2},\ldots ,x_{n}}.

{{displaystyle x_{1},x_{2},\ldots ,x_{n}}

sont tirées d’une population statistique dont l’écart-type est de σ {\displaystyle \sigma }.

\sigma

, alors la valeur moyenne calculée à partir de l’échantillon x ¯ {\displaystyle {\bar {x}}}.

{\bar {x}}

aura une erreur standard associée sur la moyenne σ x ¯ {\displaystyle {\sigma }_{\bar {x}}.

{\displaystyle {\sigma }_{\bar {x}}

donnée par : σ x ¯ = σ n {\displaystyle {\sigma }_{\bar {x}}\ ={\frac {\sigma }{\sqrt {n}}}}

{{displaystyle {\sigma }_{\bar {x}}\ ={\frac {\sigma }{\sqrt {n}}}}

.

Pratiquement, cela nous indique que lorsqu’on essaie d’estimer la valeur de la moyenne d’une population, en raison du facteur 1 / n {\displaystyle 1/{\sqrt {n}}}.

1/{\sqrt {n}}

, réduire l’erreur sur l’estimation d’un facteur deux nécessite d’acquérir quatre fois plus d’observations dans l’échantillon ; la réduire d’un facteur dix nécessite cent fois plus d’observations.

EstimateEdit

L’écart-type σ {\displaystyle \sigma }

\sigma

de la population échantillonnée est rarement connu. Par conséquent, l’erreur standard de la moyenne est généralement estimée en remplaçant σ {\displaystyle \sigma }

\sigma

par l’écart type de l’échantillon σ x {\displaystyle \sigma _{x}}.

\sigma _{x}

au lieu de : σ x ¯ ≈ σ x n {\displaystyle {\sigma }_{\bar {x}}\ \approx {\frac {\sigma _{x}}{\sqrt {n}}}}

{\displaystyle {\sigma }_{\bar {x}}\ \approx {\frac {\sigma _{x}}{\sqrt {n}}}}

.

Comme il ne s’agit que d’un estimateur de la véritable  » erreur standard « , il est courant de voir ici d’autres notations telles que :

σ x ¯ ^ = σ x n {\displaystyle {\widehat {\sigma _{\bar {x}}}}={\frac {\sigma _{x}}{\sqrt {n}}}}}.

{\displaystyle {\widehat {\sigma _{\bar {x}}}}={\frac {\sigma _{x}}{\sqrt {n}}}}

ou alternativement s x ¯ = s n {\displaystyle \operatorname {s} _{\bar {x}}\ ={\frac {s}{\sqrt {n}}}}

{displaystyle \operatorname {s} _{\bar {x}}\ ={\frac {s}{\sqrt {n}}}}

.

Une source de confusion fréquente survient lorsqu’on ne parvient pas à distinguer clairement l’écart-type de la population ( σ {\displaystyle \sigma }.

\sigma

), l’écart-type de l’échantillon ( σ x {\displaystyle \sigma _{x}}.

\sigma _{x}

), l’écart-type de la moyenne elle-même ( σ x ¯ {\displaystyle \sigma _{\bar {x}}}

{\displaystyle \sigma _{\bar {x}}

, qui est l’erreur standard), et l’estimateur de l’écart type de la moyenne ( σ x ¯ ^ {\displaystyle {\widehat {\sigma _{\bar {x}}}}}

{{displaystyle {\widehat {\sigma _{\bar {x}}}}}

, qui est la quantité la plus souvent calculée, et qui est aussi souvent appelée familièrement l’erreur standard).

Précision de l’estimateurModification

Lorsque la taille de l’échantillon est faible, l’utilisation de l’écart-type de l’échantillon au lieu du véritable écart-type de la population aura tendance à sous-estimer systématiquement l’écart-type de la population, et donc aussi l’erreur standard. Avec n = 2, la sous-estimation est d’environ 25%, mais pour n = 6, la sous-estimation n’est que de 5%. Gurland et Tripathi (1971) fournissent une correction et une équation pour cet effet. Sokal et Rohlf (1981) donnent une équation du facteur de correction pour les petits échantillons de n < 20. Voir unbiased estimation of standard deviation pour une discussion plus approfondie.

DérivationEdit

L’erreur standard sur la moyenne peut être dérivée de la variance d’une somme de variables aléatoires indépendantes, étant donné la définition de la variance et certaines propriétés simples de celle-ci. Si x 1 , x 2 , …, x n {\displaystyle x_{1},x_{2},\ldots ,x_{n}}

{\displaystyle x_{1},x_{2},\ldots ,x_{n}}

sont n {\displaystyle n}.

n

observations indépendantes d’une population dont la moyenne est x ¯ {\displaystyle {\bar {x}}}.

{\bar {x}}

et un écart-type σ {\displaystyle \sigma }.

\sigma

, alors on peut définir le total T = ( x 1 + x 2 + ⋯ + x n ) {\displaystyle T=(x_{1}+x_{2}+\cdots +x_{n})}

{\displaystyle T=(x_{1}+x_{2}+\cdots +x_{n})}

qui, en raison de la formule de Bienaymé, aura une variance

Var ( T ) = ( Var ( x 1 ) + Var ( x 2 ) + ⋯ + Var ( x n ) ) = n σ 2 . {\displaystyle \operatorname {Var} (T)={\big (}\N-operatorname {Var}) (x_{1})+\opérateurname {Var} (x_{2})+\cdots +\operatorname {Var} (T)={big (}) (T)={big (}) (x_{n}){\big )}=n\sigma ^{2}.}

{\displaystyle \operatorname {Var} (T)={\big (}operatorname {Var}) (x_{1})+\Nopérateur {Var} (x_{2})+\cdots +\operatorname {Var} (x_{n}){\big )}=n\sigma ^{2}.}

La moyenne de ces mesures x ¯ {\displaystyle {\bar {x}}.

{\bar {x}}

est simplement donnée par x ¯ = T / n {\displaystyle {\bar {x}}=T/n}

{\displaystyle {\bar {x}}=T/n}

.

La variance de la moyenne est alors

Var ( T n ) = 1 n 2 Var ( T ) = 1 n 2 n σ 2 = σ 2 n . {\displaystyle \operatorname {Var} \left({\frac {T}{n}}\right)={\frac {1}{n^{2}}}\operatorname {Var} (T)={\frac {1}{n^{2}}}n\sigma ^{2}={\frac {\sigma ^{2}}{n}}.}

{\displaystyle \operatorname {Var} \left({\frac {T}{n}}\right)={\frac {1}{n^{2}}}\operatorname {Var} (T)={\frac {1}{n^{2}}}n\sigma ^{2}={\frac {\sigma ^{2}}{n}}.}

L’erreur standard est, par définition, l’écart-type de x ¯ {\displaystyle {\bar {x}}.

{\bar {x}}

qui est simplement la racine carrée de la variance : σ x ¯ = σ 2 n = σ n {\displaystyle \sigma _{\bar {x}}={\sqrt {\frac {\sigma ^{2}}{n}}={\frac {\sigma }{\sqrt{n}}}}

{\displaystyle \sigma _{\bar {x}}={\sqrt {\frac {\sigma ^{2}}{n}}={\frac {\sigma }{\sqrt {n}}}}

.

Pour les variables aléatoires corrélées, la variance de l’échantillon doit être calculée selon le théorème central limite de la chaîne de Markov.

Variables aléatoires indépendantes et identiquement distribuées avec une taille d’échantillon aléatoireEdit

Il existe des cas où un échantillon est prélevé sans savoir, à l’avance, combien d’observations seront acceptables selon un certain critère. Dans de tels cas, la taille de l’échantillon N {\displaystyle N}

N

est une variable aléatoire dont la variation s’ajoute à la variation de X {\displaystyle X}

X

telle que, Var ( T ) = E ( N ) Var ( X ) + Var ( N ) ( E ( X ) ) 2 {\displaystyle \operatorname {Var} (T)=\N-opérateur nom {E} (N)=\opérateurname {Var} (T)=\opérateurname {E} (N) (X)+\N-opérateur {Var} (N){\big (}\N-operatorname {E} (X){\big )}^{2}}

{\displaystyle \operatorname {Var} (T)=\operatorname {E} (N)=\operatorname {Var} (N) (X)+\N-opérateur {Var} (N){\big (}\N-operatorname {E} (X){\big )}^{2}}

Si N {\displaystyle N}

N

a une distribution de Poisson, alors E ( N ) = Var ( N ) {\displaystyle \operatorname {E} (N)=\operatorname {Var} (N)}

{{displaystyle \operatorname {E} (N)=\operatorname {Var} (N)}

avec estimateur N = n {\displaystyle N=n}

{\displaystyle N=n}

. Par conséquent, l’estimateur de Var ( T ) {\displaystyle \operatorname {Var} (T)}

{\displaystyle \operatorname {Var} (T)}

devient n S X 2 + n X ¯ 2 {\displaystyle nS_{X}^{2}+n{\bar {X}}^{2}}

{\displaystyle nS_{X}^{2}+n{\bar {X}}^{2}}

, ce qui conduit à la formule suivante pour l’erreur standard : S t a n d a r d E r r o r ( X ¯ ) = S X 2 + X ¯ 2 n {\displaystyle \operatorname {Standard~Error} ({\bar {X}})={\sqrt {\frac {S_{X}^{2}+{\bar {X}}^{2}}{n}}}}

{\displaystyle \operatorname {Standard~Error} ({\bar {X}})={\sqrt {\frac {S_{X}^{2}+{\bar {X}}^{2}}{n}}}}

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *