Comment interpréter l’écart-type et l’erreur-type dans la recherche par sondage

L’écart-type et l’erreur-type sont peut-être les deux statistiques les moins bien comprises qui apparaissent couramment dans les tableaux de données. L’article suivant a pour but d’expliquer leur signification et de fournir un aperçu supplémentaire sur la façon dont elles sont utilisées dans l’analyse des données.

L’écart-type et l’erreur standard sont peut-être les deux statistiques les moins comprises qui apparaissent couramment dans les tableaux de données. L’article suivant a pour but d’expliquer leur signification et de fournir un aperçu supplémentaire sur la façon dont elles sont utilisées dans l’analyse des données. Ces deux statistiques sont généralement présentées avec la moyenne d’une variable et, dans un sens, elles parlent toutes deux de la moyenne. On les appelle souvent « écart type de la moyenne » et « erreur type de la moyenne ». Cependant, ils ne sont pas interchangeables et représentent des concepts très différents.

Ecart-type

L’écart-type (souvent abrégé en « Std Dev » ou « SD ») donne une indication de la mesure dans laquelle les réponses individuelles à une question varient ou « dévient » de la moyenne. L’écart-type indique au chercheur à quel point les réponses sont étalées — sont-elles concentrées autour de la moyenne ou éparpillées loin & loin ? Tous vos répondants ont-ils évalué votre produit au milieu de votre échelle, ou certains l’ont-ils adoré et d’autres détesté ?

Disons que vous avez demandé aux répondants d’évaluer votre produit sur une série d’attributs sur une échelle en 5 points. La moyenne d’un groupe de dix répondants (étiquetés  » A  » à  » J  » ci-dessous) pour  » bon rapport qualité-prix  » était de 3,2 avec un écart-type de 0,4 et la moyenne pour  » fiabilité du produit  » était de 3,4 avec un écart-type de 2,1. À première vue (en ne regardant que les moyennes), il semblerait que la fiabilité soit mieux notée que la valeur. Mais l’écart-type plus élevé pour la fiabilité pourrait indiquer (comme le montre la distribution ci-dessous) que les réponses étaient très polarisées, la plupart des répondants n’ayant aucun problème de fiabilité (ils ont attribué une note de « 5 » à cet attribut), mais un segment plus petit, mais important, de répondants ayant un problème de fiabilité et ayant attribué une note de « 1 » à cet attribut. L’examen de la moyenne seule ne révèle qu’une partie de l’histoire, mais c’est trop souvent ce sur quoi les chercheurs se concentrent. Il est important de prendre en compte la distribution des réponses et l’écart-type en fournit une mesure descriptive précieuse.

A

Répondant: Bonne valeur
pour l’argent:
Produit
Fiabilité :
3 1
B 3 1
C 3 1
D 3 1
E 4 5
F 4 5
G 3 5
H 3 5 I 3 5 J 3 5 Moyenne 3.2 3,4 Std Dev 0,4 2,1

Deux distributions très différentes de réponses à une échelle d’évaluation en 5 points peuvent donner la même moyenne. Considérez l’exemple suivant montrant les valeurs de réponse pour deux notations différentes. Dans le premier exemple (notation « A »), l’écart type est égal à zéro car TOUTES les réponses correspondaient exactement à la valeur moyenne. Les réponses individuelles ne s’écartent pas du tout de la moyenne. Dans le classement « B », même si la moyenne du groupe est la même (3,0) que dans la première distribution, l’écart-type est plus élevé. L’écart-type de 1,15 montre que les réponses individuelles, en moyenne*, se sont éloignées d’un peu plus d’un point de la moyenne.

.

C

Tr>

I

Répondant : Cote « A » Cote « B »
A 3 1
B 3 2
3 2
D 3 3
E 3 3 3
F 3 3
G 3 3
H 3 4
3 4
J 3 5
Moyenne 3.0 3,0
Std Dev 0,00 1,15

Une autre façon de considérer l’écart-type est de tracer la distribution sous forme d’histogramme des réponses. Une distribution avec un faible écart-type s’afficherait sous la forme d’une forme haute et étroite, tandis qu’un grand écart-type serait indiqué par une forme plus large.

L’écart-type n’indique généralement pas « vrai ou faux » ou « meilleur ou pire » — un écart-type plus faible n’est pas nécessairement plus souhaitable. Elle est utilisée purement comme une statistique descriptive. Elle décrit la distribution par rapport à la moyenne.

*Avis technique : penser à l’écart-type comme à un  » écart moyen  » est une excellente façon de comprendre conceptuellement sa signification. Cependant, il n’est pas réellement calculé comme une moyenne (si c’était le cas, nous l’appellerions  » écart moyen « ). Il est plutôt « normalisé », une méthode quelque peu complexe qui consiste à calculer la valeur en utilisant la somme des carrés. Pour des raisons pratiques, le calcul n’est pas important. La plupart des programmes de tabulation, des feuilles de calcul ou d’autres outils de gestion des données calculeront l’écart-type pour vous. Il est plus important de comprendre ce que les statistiques véhiculent.

Erreur standard

L’erreur standard (« Std Err » ou « SE »), est une indication de la fiabilité de la moyenne. Une petite SE est une indication que la moyenne de l’échantillon est un reflet plus précis de la moyenne réelle de la population. Une taille d’échantillon plus importante se traduira normalement par un SE plus petit (tandis que le SD n’est pas directement affecté par la taille de l’échantillon).

La plupart des recherches par sondage impliquent de tirer un échantillon d’une population. Nous faisons ensuite des inférences sur la population à partir des résultats obtenus à partir de cet échantillon. Si un deuxième échantillon a été tiré, les résultats ne correspondront probablement pas exactement à ceux du premier échantillon. Si la valeur moyenne d’un attribut d’évaluation était de 3,2 pour un échantillon, elle pourrait être de 3,4 pour un second échantillon de même taille. Si nous devions tirer un nombre infini d’échantillons (de taille égale) de notre population, nous pourrions afficher les moyennes observées sous forme de distribution. Nous pourrions alors calculer une moyenne de toutes les moyennes de nos échantillons. Cette moyenne serait égale à la vraie moyenne de la population. Nous pouvons également calculer l’écart-type de la distribution des moyennes des échantillons. L’écart-type de cette distribution de moyennes d’échantillons est l’erreur-type de chaque moyenne d’échantillon individuelle. Dit autrement, l’erreur standard est l’écart-type de la moyenne de la population.

Échantillon: Moyenne
1ère 3.2
2e 3,4
3e 3,3
4e 3.2
5ème 3,1
.
. .
. . .
Moyenne 3,3
Std Dev 0,13

Réfléchissez à ceci. Si l’écart-type de cette distribution nous aide à comprendre à quel point la moyenne d’un échantillon est éloignée de la vraie moyenne de la population, alors nous pouvons l’utiliser pour comprendre la précision de toute moyenne d’échantillon individuelle par rapport à la vraie moyenne. C’est l’essence même de l’erreur standard. En réalité, nous n’avons tiré qu’un seul échantillon de notre population, mais nous pouvons utiliser ce résultat pour fournir une estimation de la fiabilité de notre moyenne d’échantillon observée.

En fait, l’ES nous indique que nous pouvons être sûrs à 95 % que notre moyenne d’échantillon observée est à plus ou moins environ 2 (en réalité 1,96) erreurs types de la moyenne de la population.

Le tableau ci-dessous montre la distribution des réponses de notre premier (et seul) échantillon utilisé pour notre recherche. L’ET de 0,13, étant relativement faible, nous donne une indication que notre moyenne est relativement proche de la vraie moyenne de notre population globale. La marge d’erreur (à un niveau de confiance de 95 %) de notre moyenne est (à peu près) le double de cette valeur (+/- 0,26), ce qui nous indique que la vraie moyenne se situe très probablement entre 2,94 et 3,46.

A

A

.

Répondant: Cote :
3
B 3
C 3 D 3 E 4
F 4
G 3 H 3 I 3 J 3 Moyenne 3.2
Std Err 0,13

Summary

Plusieurs chercheurs ne comprennent pas la distinction entre l’écart-type et l’erreur-type, même s’ils sont couramment inclus dans l’analyse des données. Bien que les calculs réels de l’écart-type et de l’erreur-type semblent très similaires, ils représentent deux mesures très différentes, mais complémentaires. L’écart-type nous renseigne sur la forme de notre distribution, sur la proximité des valeurs de données individuelles par rapport à la valeur moyenne. L’ET nous indique à quel point la moyenne de notre échantillon est proche de la moyenne réelle de la population globale. Ensemble, elles contribuent à fournir une image plus complète que ce que la moyenne seule peut nous dire.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *