Cómo interpretar la desviación estándar y el error estándar en la investigación de encuestas

La desviación estándar y el error estándar son quizás los dos estadísticos menos comprendidos que se muestran habitualmente en las tablas de datos. El siguiente artículo pretende explicar su significado y proporcionar información adicional sobre cómo se utilizan en el análisis de datos.

La Desviación Estándar y el Error Estándar son quizás las dos estadísticas menos comprendidas que se muestran comúnmente en las tablas de datos. El siguiente artículo pretende explicar su significado y proporcionar una visión adicional sobre cómo se utilizan en el análisis de datos. Ambos estadísticos se muestran normalmente con la media de una variable y, en cierto sentido, ambos hablan de la media. A menudo se denominan «desviación estándar de la media» y «error estándar de la media». Sin embargo, no son intercambiables y representan conceptos muy diferentes.

Desviación estándar

La desviación estándar (a menudo abreviada como «Std Dev» o «SD») proporciona una indicación de cuánto varían las respuestas individuales a una pregunta o se «desvían» de la media. La desviación estándar indica al investigador el grado de dispersión de las respuestas: ¿están concentradas en torno a la media o están muy dispersas? ¿Todos los encuestados calificaron su producto en la mitad de la escala, o algunos lo adoraron y otros lo odiaron?

Digamos que ha pedido a los encuestados que califiquen su producto en una serie de atributos en una escala de 5 puntos. La media de un grupo de diez encuestados (etiquetados de la ‘A’ a la ‘J’ a continuación) para la «buena relación calidad-precio» fue de 3,2 con una DE de 0,4 y la media para la «fiabilidad del producto» fue de 3,4 con una DE de 2,1. A primera vista (mirando sólo las medias) parecería que la fiabilidad fue más valorada que el valor. Pero la mayor DE de la fiabilidad podría indicar (como se muestra en la distribución de abajo) que las respuestas estaban muy polarizadas, donde la mayoría de los encuestados no tenían problemas de fiabilidad (calificaron el atributo con un «5»), pero un segmento más pequeño, pero importante, tenía un problema de fiabilidad y calificó el atributo con un «1». El análisis de la media es sólo una parte de la historia, pero con demasiada frecuencia los investigadores se centran en ella. Es importante tener en cuenta la distribución de las respuestas y la DE proporciona una valiosa medida descriptiva de la misma.

A

H

Responde: Buena relación calidad-precio: Producto
Fiable:
3 1
B 3 1
C 3 1
D 3 1
E 4 5
F 4 5
G 3 5 3 5
I 3 5
J 3 5
Media 3.2 3,4
Desviación estándar 0,4 2,1

Dos distribuciones muy diferentes de respuestas a una escala de valoración de 5 puntos pueden dar la misma media. Considere el siguiente ejemplo que muestra los valores de las respuestas para dos calificaciones diferentes. En el primer ejemplo (Calificación «A») la Desviación Estándar es cero porque TODAS las respuestas fueron exactamente el valor medio. Las respuestas individuales no se desviaron en absoluto de la media. En la calificación «B», aunque la media del grupo es la misma (3,0) que la primera distribución, la desviación típica es mayor. La Desviación Estándar de 1,15 muestra que las respuestas individuales, en promedio*, se alejaron un poco más de 1 punto de la media.

.

Media

Respuesta: Calificación «A» Calificación «B»
A 3 1
B 3 2
C 3 2
D 3 3
E 3 3
F 3 3 3 G 3 3 H 3 4
I 3 4
J 3 5
3.0 3,0
Desviación Estándar 0,00 1,15

Otra forma de ver la Desviación Estándar es trazando la distribución como un histograma de respuestas. Una distribución con una desviación estándar baja se mostraría como una forma alta y estrecha, mientras que una desviación estándar grande se indicaría con una forma más ancha.

La desviación estándar generalmente no indica «correcto o incorrecto» o «mejor o peor» — una desviación estándar más baja no es necesariamente más deseable. Se utiliza puramente como una estadística descriptiva. Describe la distribución en relación con la media.

*Aviso técnico: pensar en la Desviación Estándar como una «desviación media» es una excelente manera de entender conceptualmente su significado. Sin embargo, en realidad no se calcula como una media (si lo fuera, la llamaríamos «desviación media»). En su lugar, se «estandariza», un método algo complejo de calcular el valor mediante la suma de los cuadrados. A efectos prácticos, el cálculo no es importante. La mayoría de los programas de tabulación, hojas de cálculo u otras herramientas de gestión de datos calcularán la DE por usted. Lo más importante es entender lo que transmiten las estadísticas.

Error estándar

El error estándar («Std Err» o «SE»), es una indicación de la fiabilidad de la media. Un SE pequeño es una indicación de que la media de la muestra es un reflejo más exacto de la media real de la población. Un mayor tamaño de la muestra normalmente dará lugar a un SE más pequeño (mientras que la SD no se ve directamente afectada por el tamaño de la muestra).

La mayoría de las investigaciones de encuestas implican la extracción de una muestra de una población. Luego hacemos inferencias sobre la población a partir de los resultados obtenidos de esa muestra. Si se extrae una segunda muestra, es probable que los resultados no coincidan exactamente con la primera. Si el valor medio de un atributo de calificación fue de 3,2 en una muestra, podría ser de 3,4 en una segunda muestra del mismo tamaño. Si extrajéramos un número infinito de muestras (de igual tamaño) de nuestra población, podríamos mostrar las medias observadas como una distribución. A continuación, podríamos calcular una media de todas nuestras medias muestrales. Esta media sería igual a la verdadera media de la población. También podemos calcular la desviación estándar de la distribución de las medias muestrales. La desviación estándar de esta distribución de medias muestrales es el error estándar de cada media muestral individual. Dicho de otro modo, el Error Estándar es la Desviación Estándar de la media poblacional.

.

Muestra: Media
3ª.2
3,4
3,3
3.2
3,1
. .
. .
Media 3,3 Desviación estándar 0,13

Piensa en esto. Si la SD de esta distribución nos ayuda a entender qué tan lejos está la media de una muestra de la verdadera media de la población, entonces podemos usar esto para entender qué tan precisa es cualquier media de una muestra individual en relación con la verdadera media. Esa es la esencia del error estándar. En realidad, sólo hemos extraído una única muestra de nuestra población, pero podemos utilizar este resultado para proporcionar una estimación de la fiabilidad de nuestra media muestral observada.

De hecho, el SE nos dice que podemos estar seguros al 95% de que nuestra media muestral observada está más o menos a 2 (en realidad 1,96) Errores Estándar de la media poblacional.

La siguiente tabla muestra la distribución de las respuestas de nuestra primera (y única) muestra utilizada para nuestra investigación. El SE de 0,13, al ser relativamente pequeño, nos da una indicación de que nuestra media está relativamente cerca de la verdadera media de nuestra población global. El margen de error (con un 95% de confianza) para nuestra media es (aproximadamente) el doble de ese valor (+/- 0,26), lo que nos indica que la verdadera media está muy probablemente entre 2,94 y 3,46.

Responde: Calificación:
A 3
B 3
C 3
D 3
E 4
F 4
G 3
H 3
I 3
J 3
Media 3.2
Error Estándar 0,13

Resumen

Muchos investigadores no entienden la distinción entre Desviación Estándar y Error Estándar, aunque se incluyen comúnmente en el análisis de datos. Aunque los cálculos reales de la Desviación Estándar y el Error Estándar parecen muy similares, representan dos medidas muy diferentes, pero complementarias. La desviación estándar nos indica la forma de nuestra distribución, lo cerca que están los valores individuales de los datos del valor medio. El SE nos dice lo cerca que está la media de nuestra muestra de la media real de la población global. Juntos, ayudan a proporcionar una imagen más completa de lo que la media por sí sola puede decirnos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *