Come interpretare la deviazione standard e l’errore standard nella ricerca sui sondaggi

La deviazione standard e l’errore standard sono forse le due statistiche meno comprese e comunemente mostrate nelle tabelle dei dati. Il seguente articolo ha lo scopo di spiegare il loro significato e fornire ulteriori informazioni su come vengono utilizzati nell’analisi dei dati.

La deviazione standard e l’errore standard sono forse le due statistiche meno comprese e comunemente mostrate nelle tabelle di dati. Il seguente articolo ha lo scopo di spiegare il loro significato e fornire ulteriori informazioni su come vengono utilizzati nell’analisi dei dati. Entrambe le statistiche sono tipicamente mostrate con la media di una variabile e, in un certo senso, entrambe parlano della media. Sono spesso chiamati “deviazione standard della media” e “errore standard della media”. Tuttavia, non sono intercambiabili e rappresentano concetti molto diversi.

Deviazione standard

La deviazione standard (spesso abbreviata come “Std Dev” o “SD”) fornisce un’indicazione di quanto le singole risposte a una domanda variano o “deviano” dalla media. La deviazione standard dice al ricercatore quanto sono sparse le risposte – sono concentrate intorno alla media, o sparse lontano &? Tutti i tuoi intervistati hanno valutato il tuo prodotto a metà della tua scala, o alcuni lo hanno amato e altri odiato?

Diciamo che hai chiesto agli intervistati di valutare il tuo prodotto su una serie di attributi su una scala a 5 punti. La media per un gruppo di dieci intervistati (etichettati da ‘A’ a ‘J’ qui sotto) per “buon rapporto qualità/prezzo” era 3,2 con una DS di 0,4 e la media per “affidabilità del prodotto” era 3,4 con una DS di 2,1. A prima vista (guardando solo le medie) sembrerebbe che l’affidabilità sia stata valutata più alta del valore. Ma la DS più alta per l’affidabilità potrebbe indicare (come mostrato nella distribuzione sottostante) che le risposte erano molto polarizzate, dove la maggior parte degli intervistati non aveva problemi di affidabilità (valutando l’attributo con un “5”), ma un segmento più piccolo, ma importante di intervistati, aveva un problema di affidabilità e valutava l’attributo “1”. Guardare la media da sola racconta solo una parte della storia, ma troppo spesso è ciò su cui si concentrano i ricercatori. La distribuzione delle risposte è importante da considerare e la DS fornisce una preziosa misura descrittiva di questo.

Risposta: Buon valore
per i soldi:
Prodotto
affidabilità:
A 3 1
B 3 1
C 3 1
D 3 1
E 4 5
F 4 5
G 3 5
H 3 5
I 3 5
J 3 5
Media 3.2 3.4
Std Dev 0.4 2.1

Due distribuzioni molto diverse di risposte ad una scala di valutazione a 5 punti possono produrre la stessa media. Si consideri il seguente esempio che mostra i valori di risposta per due diverse valutazioni. Nel primo esempio (Valutazione “A”) la deviazione standard è zero perché TUTTE le risposte erano esattamente il valore medio. Le singole risposte non si sono affatto discostate dalla media. Nella valutazione “B”, anche se la media del gruppo è la stessa (3,0) della prima distribuzione, la deviazione standard è più alta. La deviazione standard di 1,15 mostra che le risposte individuali, in media*, erano poco più di 1 punto lontano dalla media.

Risposta: Valutazione “A” Valutazione “B”
A 3 1
B 3 2
C 3 2
D 3 3
E 3 3
F 3 3
G 3 3
H 3 4
I 3 4
J 3 5
Media 3.0 3.0
Std Dev 0.00 1.15

Un altro modo di guardare alla deviazione standard è tracciare la distribuzione come un istogramma di risposte. Una distribuzione con una bassa SD verrebbe visualizzata come una forma alta e stretta, mentre una grande SD sarebbe indicata da una forma più ampia.

La SD generalmente non indica “giusto o sbagliato” o “meglio o peggio” – una SD più bassa non è necessariamente più desiderabile. È usata puramente come statistica descrittiva. Descrive la distribuzione in relazione alla media.

*Disclaimer tecnico: pensare alla deviazione standard come a una “deviazione media” è un modo eccellente per capire concettualmente il suo significato. Tuttavia, non è effettivamente calcolata come una media (se lo fosse, la chiameremmo “deviazione media”). Invece, è “standardizzato”, un metodo un po’ complesso di calcolare il valore usando la somma dei quadrati. Per scopi pratici, il calcolo non è importante. La maggior parte dei programmi di tabulazione, fogli di calcolo o altri strumenti di gestione dei dati calcoleranno la SD per voi. Più importante è capire cosa trasmette la statistica.

Standard Error

L’errore standard (“Std Err” o “SE”), è un’indicazione dell’affidabilità della media. Un piccolo SE è un’indicazione che la media del campione è un riflesso più accurato della media effettiva della popolazione. Una dimensione del campione più grande risulterà normalmente in un SE più piccolo (mentre la SD non è direttamente influenzata dalla dimensione del campione).

La maggior parte delle ricerche di sondaggio comporta il prelievo di un campione da una popolazione. Poi facciamo inferenze sulla popolazione dai risultati ottenuti da quel campione. Se è stato estratto un secondo campione, i risultati probabilmente non corrisponderanno esattamente al primo campione. Se il valore medio di un attributo di valutazione era 3,2 per un campione, potrebbe essere 3,4 per un secondo campione della stessa dimensione. Se dovessimo estrarre un numero infinito di campioni (di uguali dimensioni) dalla nostra popolazione, potremmo visualizzare le medie osservate come una distribuzione. Potremmo poi calcolare una media di tutte le medie dei nostri campioni. Questa media sarebbe uguale alla vera media della popolazione. Possiamo anche calcolare la deviazione standard della distribuzione delle medie dei campioni. La deviazione standard di questa distribuzione delle medie campionarie è l’errore standard di ogni singola media campionaria. Detto altrimenti, l’errore standard è la deviazione standard della media della popolazione.

Campione: Media
3.2
3.4
3.3
3.2
3.1
. .
. .
Media 3.3
Std Dev 0.13

Pensateci. Se la DS di questa distribuzione ci aiuta a capire quanto la media di un campione sia lontana dalla vera media della popolazione, allora possiamo usarla per capire quanto sia accurata ogni singola media del campione rispetto alla vera media. Questa è l’essenza dell’errore standard. In realtà abbiamo estratto un solo campione dalla nostra popolazione, ma possiamo usare questo risultato per fornire una stima dell’affidabilità della nostra media campionaria osservata.

In effetti, l’SE ci dice che possiamo essere sicuri al 95% che la nostra media campionaria osservata sia più o meno di 2 (in realtà 1,96) errori standard dalla media della popolazione.

La tabella sottostante mostra la distribuzione delle risposte del nostro primo (e unico) campione usato per la nostra ricerca. Il SE di 0,13, essendo relativamente piccolo, ci dà un’indicazione che la nostra media è relativamente vicina alla vera media della nostra popolazione complessiva. Il margine di errore (al 95% di confidenza) per la nostra media è (approssimativamente) il doppio di quel valore (+/- 0,26), dicendoci che la vera media è molto probabilmente tra 2,94 e 3,46.

Risposta: Valutazione:
A 3
B 3
C 3
D 3
E 4
F 4
G 3
H 3
I 3
J 3
Medio 3.2
Std Err 0.13

Sommario

Molti ricercatori non comprendono la distinzione tra Deviazione Standard ed Errore Standard, anche se sono comunemente inclusi nell’analisi dei dati. Mentre i calcoli effettivi della deviazione standard e dell’errore standard sembrano molto simili, essi rappresentano due misure molto diverse, ma complementari. La SD ci dice la forma della nostra distribuzione, quanto i singoli valori dei dati sono vicini al valore medio. SE ci dice quanto la media del nostro campione è vicina alla vera media della popolazione complessiva. Insieme, ci aiutano a fornire un quadro più completo di quanto la media da sola possa dirci.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *