Como Interpretar o Desvio Padrão e o Erro Padrão na Pesquisa de Inquérito

Desvio Padrão e Erro Padrão são talvez as duas estatísticas menos compreendidas habitualmente mostradas nas tabelas de dados. O artigo seguinte destina-se a explicar o seu significado e a fornecer informações adicionais sobre como são utilizados na análise de dados.

Desvio Padrão e Erro Padrão são talvez as duas estatísticas menos compreendidas comummente mostradas nas tabelas de dados. O artigo seguinte destina-se a explicar o seu significado e a fornecer informações adicionais sobre como são utilizados na análise de dados. Ambas as estatísticas são tipicamente mostradas com a média de uma variável, e num certo sentido, ambas falam sobre a média. São frequentemente referidas como o “desvio padrão da média” e o “erro padrão da média”. Contudo, não são permutáveis e representam conceitos muito diferentes.

Desvio padrão

Desvio padrão (frequentemente abreviado como “Std Dev” ou “SD”) fornece uma indicação de até que ponto as respostas individuais a uma pergunta variam ou “desviam-se” da média. SD diz ao investigador como estão espalhadas as respostas – estão concentradas em torno da média, ou espalhadas muito & wide? Todos os seus inquiridos classificaram o seu produto no meio da sua escala, ou alguns adoraram-no e outros odiaram-no?

Vamos dizer que pediu aos inquiridos para classificarem o seu produto numa série de atributos numa escala de 5 pontos. A média para um grupo de dez inquiridos (rotulados de ‘A’ a ‘J’ abaixo) para “bom valor pelo dinheiro” foi de 3,2 com um SD de 0,4 e a média para “fiabilidade do produto” foi de 3,4 com um SD de 2,1. À primeira vista (olhando apenas para os meios), parece que a fiabilidade foi avaliada acima do valor. Mas o SD mais elevado para a fiabilidade podia indicar (como mostrado na distribuição abaixo) que as respostas estavam muito polarizadas, onde a maioria dos inquiridos não tinha problemas de fiabilidade (classificou o atributo “5”), mas um segmento menor, mas importante dos inquiridos, tinha um problema de fiabilidade e classificou o atributo “1”. Olhando apenas para a média conta apenas uma parte da história, no entanto, com demasiada frequência, é nisto que os investigadores se concentram. A distribuição das respostas é importante a considerar e o DS fornece uma valiosa medida descritiva disto.

Produto
Religibilidade:

Respondente: Bom Valor
para o Dinheiro:
A 3 1
B 3 1
C 3 1
D 3 1
E 4 5
F 4 5
G 3 5
H 3 5
I 3 5
J 3 5
Mean 3.2 3.4
Std Dev 0.4 2.1

Duas distribuições muito diferentes de respostas a uma escala de classificação de 5 pontos podem produzir a mesma média. Considere o seguinte exemplo mostrando valores de resposta para duas classificações diferentes. No primeiro exemplo (Classificação “A”) o Desvio Padrão é zero porque TODAS as respostas foram exactamente o valor médio. As respostas individuais não se desviaram de forma alguma da média. Na classificação “B”, embora a média do grupo seja a mesma (3,0) que a primeira distribuição, o Desvio Padrão é mais elevado. O Desvio Padrão de 1,15 mostra que as respostas individuais, em média*, estavam um pouco mais de 1 ponto afastadas da média.

H

Respondente: Classificação “A” Classificação “B”
A 3 1
B 3 2
C 3 2
D 3 3
E 3 3
F 3 3
G 3 3
3 4
I 3 4
J 3 5
Mean 3.0 3.0
Std Dev 0.00 1.15

Outra forma de ver o Desvio Padrão é traçando a distribuição como um histograma de respostas. Uma distribuição com um SD baixo seria exibida como uma forma alta e estreita, enquanto que um SD grande seria indicado por uma forma mais larga.

SD geralmente não indica “certo ou errado” ou “melhor ou pior” — um SD baixo não é necessariamente mais desejável. É usado puramente como uma estatística descritiva. Descreve a distribuição em relação à média.

*Relação técnica: pensar no desvio padrão como um “desvio médio” é uma excelente forma de compreender conceitualmente o seu significado. No entanto, não é efectivamente calculado como uma média (se fosse, chamar-lhe-íamos o “desvio médio”). Em vez disso, é “padronizado”, um método algo complexo de calcular o valor utilizando a soma dos quadrados. Para efeitos práticos, o cálculo não é importante. A maioria dos programas de tabulação, folhas de cálculo ou outras ferramentas de gestão de dados, calcularão o SD para si. Mais importante é compreender o que as estatísticas transmitem.

Erro Padrão

O Erro Padrão (“Std Err” ou “SE”), é uma indicação da fiabilidade da média. Um pequeno SE é uma indicação de que a média da amostra é um reflexo mais preciso da média real da população. Um tamanho de amostra maior resultará normalmente num SE menor (enquanto que o SD não é directamente afectado pelo tamanho da amostra).

A maior parte da investigação do inquérito envolve a retirada de uma amostra de uma população. Fazemos então inferências sobre a população a partir dos resultados obtidos a partir dessa amostra. Se uma segunda amostra foi retirada, os resultados provavelmente não corresponderão exactamente à primeira amostra. Se o valor médio para um atributo de classificação fosse 3,2 para uma amostra, poderia ser 3,4 para uma segunda amostra do mesmo tamanho. Se retirássemos um número infinito de amostras (de igual tamanho) da nossa população, poderíamos exibir os meios observados como uma distribuição. Poderíamos então calcular uma média de todos os nossos meios de amostra. Esta média seria igual à média verdadeira da população. Também podemos calcular o Desvio Padrão da distribuição das médias das amostras. O Desvio Padrão desta distribuição de meios de amostra é o Erro Padrão de cada média de amostra individual. Por outras palavras, Erro Padrão é o Desvio Padrão da média da população.

2nd

Sample: Mean
1st 3.2
3.4
3rd>/td> 3.3
4th 3.2
3.1
. .
. .
.
Mean 3.3
Std Dev 0.13

Pensa nisto. Se o SD desta distribuição nos ajudar a compreender quão longe está uma média de amostra da verdadeira média da população, então podemos usá-la para compreender quão precisa é qualquer média de amostra individual em relação à verdadeira média. Esta é a essência do Erro Padrão. Na realidade, apenas extraímos uma única amostra da nossa população, mas podemos utilizar este resultado para fornecer uma estimativa da fiabilidade da nossa média de amostra observada.

De facto, o SE diz-nos que podemos estar 95% confiantes de que a nossa média de amostra observada é mais ou menos aproximadamente 2 (na realidade 1,96) Erros Padrão da média da população.

A tabela abaixo mostra a distribuição das respostas da nossa primeira (e única) amostra utilizada para a nossa investigação. O SE de 0,13, sendo relativamente pequeno, dá-nos uma indicação de que a nossa média está relativamente próxima da média real da nossa população total. A margem de erro (a 95% de confiança) para a nossa média é (aproximadamente) o dobro desse valor (+/- 0,26), o que nos diz que a média verdadeira é muito provavelmente entre 2,94 e 3,46.

3

E

3

3

3

Std Err>0.13
Respondente: Rating:
A 3
B
C
D 3
4
F 4
G 3
H
I
J
Mean 3.2

Sumário

Muitos investigadores não conseguem compreender a distinção entre Desvio Padrão e Erro Padrão, apesar de serem normalmente incluídos na análise de dados. Embora os cálculos reais para desvio padrão e erro padrão pareçam muito semelhantes, eles representam duas medidas muito diferentes, mas complementares. O SD diz-nos sobre a forma da nossa distribuição, quão próximos estão os valores dos dados individuais do valor médio. SE diz-nos quão próxima está a nossa média amostral da verdadeira média da população em geral. Juntos, eles ajudam a fornecer uma imagem mais completa do que a média por si só nos pode dizer.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *