Errore standard

Valore esattoEdit

Se un campione statisticamente indipendente di n {\displaystyle n}

n

osservazioni x 1 , x 2 , … , x n {\displaystyle x_{1},x_{2},\ldots ,x_{n}}

{\displaystyle x_{1},x_{2},\ldots ,x_{n}}

sono prese da una popolazione statistica con una deviazione standard di σ {displaystyle \sigma }

\sigma

, allora il valore medio calcolato dal campione x ¯ {displaystyle {\bar {x}}

{\bar {x}

avrà un errore standard associato sulla media σ x ¯ {displaystyle {\sigma }_{\bar {x}}

{{displaystyle {\sigma }_{\bar {x}}}

dato da: σ x ¯ = σ n {displaystyle {\sigma }_{bar {x}} ={frac {\sigma }{sqrt {n}}}}

{displaystyle {{sigma }_{bar {x}} ={frac {sigma }{sqrt {n}}}}

.

Praticamente questo ci dice che quando si cerca di stimare il valore della media di una popolazione, a causa del fattore 1 / n {\displaystyle 1/{sqrt {n}}

1/{\sqrt {n}}

, ridurre l’errore sulla stima di un fattore due richiede l’acquisizione di un numero di osservazioni quattro volte maggiore nel campione; ridurlo di un fattore dieci richiede un numero di osservazioni cento volte maggiore.

EstimateEdit

La deviazione standard σ {displaystyle \sigma }

\sigma

della popolazione campionata è raramente nota. Pertanto, l’errore standard della media è solitamente stimato sostituendo σ {displaystyle \sigma }

\sigma

con la deviazione standard del campione σ x {displaystyle \sigma _{x}}

\sigma _{x}

invece: σ x ¯ ≈ σ x n {\displaystyle {\sigma }_{bar {x}} \approx {\frac {\sigma _{x}}{sqrt {n}}}}

{{displaystyle {\sigma }{{bar {x}} \approx {frac {\sigma _{x}}{sqrt {n}}}}

.

Poiché questo è solo uno stimatore per il vero “errore standard”, è comune vedere altre notazioni qui come:

σ x ¯ ^ = σ x n {\displaystyle {widehat {sigma _{{bar {x}}}}={frac {sigma _{x}{sqrt {n}}}}

{{displaystyle {{widehat {sigma _{{bar {x}}}}={frac {sigma _{x}}{sqrt {n}}}}

o alternativamente s x ¯ = s n {displaystyle \operatorname {s} _{{bar {x}} ={frac {s}{sqrt {n}}}}

{displaystyle \operatorname {s} _{{barra {x}} ={frac {s}{sqrt {n}}}}

.

Una comune fonte di confusione si verifica quando non si distingue chiaramente tra la deviazione standard della popolazione ( σ {displaystyle \sigma }

\sigma

), la deviazione standard del campione ( σ x {displaystyle \sigma _{x}}

\sigma _{x}

), la deviazione standard della media stessa ( σ x ¯ {\displaystyle \sigma _{bar {x}}}

{displaystyle \sigma _{\bar {x}}}

, che è l’errore standard), e lo stimatore della deviazione standard della media ( σ x ¯ ^ {displaystyle {\widehat {\sigma _{\bar {x}}}}}

{displaystyle {\widehat {\sigma _{\bar {x}}}}}

, che è la quantità più spesso calcolata, ed è anche spesso colloquialmente chiamata errore standard).

Accuratezza dello stimatoreModifica

Quando la dimensione del campione è piccola, usare la deviazione standard del campione invece della vera deviazione standard della popolazione tenderà a sottostimare sistematicamente la deviazione standard della popolazione, e quindi anche l’errore standard. Con n = 2, la sottostima è circa il 25%, ma per n = 6, la sottostima è solo del 5%. Gurland e Tripathi (1971) forniscono una correzione e un’equazione per questo effetto. Sokal e Rohlf (1981) danno un’equazione del fattore di correzione per piccoli campioni di n < 20. Vedere stima imparziale della deviazione standard per ulteriori discussioni.

DerivazioneModifica

L’errore standard sulla media può essere derivato dalla varianza di una somma di variabili casuali indipendenti, data la definizione di varianza e alcune semplici proprietà della stessa. Se x 1 , x 2 , … , x n {\displaystyle x_{1},x_{2},\ldots ,x_{n}}

{\displaystyle x_{1},x_{2},\ldots ,x_{n}}

sono n {\displaystyle n}

n

osservazioni indipendenti da una popolazione con media x ¯ {displaystyle {\bar {x}}}

{\bar {x}

e deviazione standard σ {displaystyle \sigma }

\sigma

, allora possiamo definire il totale T = ( x 1 + x 2 + ⋯ + x n ) {\displaystyle T=(x_{1}+x_{2}+\cdots +x_{n})}

{\displaystyle T=(x_{1}+x_{2}+\cdots +x_{n})}

che a causa della formula di Bienaymé, avrà varianza

Var ( T ) = ( Var ( x 1 ) + Var ( x 2 ) + ⋯ + Var ( x n ) ) = n σ 2 . {\an8}Come si vede, il nome dell’operazione è {Var} (T)={big (}operatorname {Var} (x_{1})+{operatorname {Var} (x_{2})+cdots +\operatorname {Var} (x_{n}){\big )}=n\sigma ^{2}.}

{displaystyle \operatorname {Var} (T)={big (}operatorname {Var} (x_{1})+{operatorname {Var} (x_{2})+cdots +\operatorname {Var} (x_{n}){\big )}=n\sigma ^{2}.}

La media di queste misure x ¯ {displaystyle {\bar {x}}

{\bar {x}

è semplicemente data da x ¯ = T / n {\displaystyle {\bar {x}=T/n}

{{displaystyle {\bar {x}=T/n}

.

La varianza della media è quindi

Var ( T n ) = 1 n 2 Var ( T ) = 1 n 2 n σ 2 = σ 2 n . {\displaystyle \operatorname {Var} \sinistra({\frac {T}{n}}destra)={\frac {1}{n^{2}}}operatorname {Var} (T)={frac {1}{n^{2}}}n{sigma ^{2}={frac {sigma ^{2}}{n}.}

{displaystyle \operatorname {Var} \(T)={frac {T}{n}}{destra)={frac {1}{n^{2}}}operatorname {Var} (T)={frac {1}{n^{2}}}n\sigma ^{2}={frac {sigma ^{2}}}.}

L’errore standard è, per definizione, la deviazione standard di x ¯ {displaystyle {\bar {x}}

{\bar {x}}

che è semplicemente la radice quadrata della varianza: σ x ¯ = σ 2 n = σ n {displaystyle \sigma _{\bar {x}={sqrt {\frac {\sigma ^{2}}}={frac {\sigma }{sqrt {n}}}}}

{displaystyle \sigma _{\bar {x}={sqrt {\frac {\sigma ^{2}}{n}}={frac {\sigma }{sqrt {n}}}}

.

Per le variabili casuali correlate la varianza del campione deve essere calcolata secondo il teorema del limite centrale della catena di Markov.

Variabili casuali indipendenti e identicamente distribuite con dimensione del campione casualeModifica

Ci sono casi in cui un campione viene preso senza sapere, in anticipo, quante osservazioni saranno accettabili secondo qualche criterio. In questi casi, la dimensione del campione N {displaystyle N}

N

è una variabile casuale la cui variazione si aggiunge alla variazione di X {\displaystyle X}

X

tale che, Var ( T ) = E ( N ) Var ( X ) + Var ( N ) ( E ( X ) ) 2 {\displaystyle \operatorname {Var} (T)=\nome operatore {E} (N)\operatorname {Var} (N)\operatorname {Var} (N)\operatorname {Var} (X)+\nome operatore {Var} (N){\a6} (N)\a6} (N)\a6} (N)\a6} (E)\a6} (X)}^{2}}

{displaystyle \operatorname {Var} (T)=\operatorname {E} (N)\operatorname {Var} (X)+\nome operatore {Var} (X)+nome operatore {Var} (X)+nome operatore {Var} (X) (N){\a6} (N)\a6} (N)\a6} (N)\a6} (E)\a6} (X)^{2}}

Se N {\displaystyle N}

N

ha una distribuzione di Poisson, allora E ( N ) = Var ( N ) {\displaystyle \operatorname {E} (N)=\operatorname {Var} (N)} (N)}

{{displaystyle \operatorname {E} (N)=\operatorname {Var} (N)}
con stimatore N = n {\displaystyle N=n}

{\displaystyle N=n}

. Quindi lo stimatore di Var ( T ) {\displaystyle \operatorname {Var} (T)}

{displaystyle \operatorname {Var} (T)}

diventa n S X 2 + n X ¯ 2 {displaystyle nS_{X}^{2}+n{bar {X}^{2}

{displaystyle nS_{X}^{2}+n{bar {X}^{2}

, portando alla seguente formula per l’errore standard: S t a n d a r d E r r o r ( X ¯ ) = S X 2 + X ¯ 2 n {\displaystyle \operatorname {Standard~Error} ({\an8})={sqrt {\frac {S_{X}^{2}+{\an8}^{2}{n}}}}

{{displaystyle \operatorname {Standard~Error} ({{barra {X})={sqrt {\frac {S_{X}^{2}+{barra {X}^{2}}{n}}}}

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *