Tablas de distribución de frecuencias
Contenido archivado
La información identificada como archivada se proporciona con fines de referencia, investigación o mantenimiento de registros. No está sujeta a las normas web del Gobierno de Canadá y no ha sido modificada ni actualizada desde que se archivó. Póngase en contacto con nosotros para solicitar un formato distinto de los disponibles.
- Ejemplo 1 – Construir una tabla de distribución de frecuencias
- Ejemplo 2 – Construir una tabla de distribución de frecuencias acumulativas
- Intervalos de clase
- Ejemplo 3 – Construir una tabla de distribución de frecuencias para un gran número de observaciones
- Frecuencia relativa y frecuencia porcentual
- Ejemplo 4 – Construir tablas de frecuencia relativa y frecuencia porcentual
La frecuencia (f) de una observación particular es el número de veces que la observación ocurre en los datos. La distribución de una variable es el patrón de frecuencias de la observación. Las distribuciones de frecuencias se representan como tablas de frecuencias, histogramas o polígonos.
Las distribuciones de frecuencias pueden mostrar el número real de observaciones que caen en cada rango o el porcentaje de observaciones. En este último caso, la distribución se denomina distribución de frecuencias relativas.
Las tablas de distribución de frecuencias pueden utilizarse tanto para variables categóricas como numéricas. Las variables continuas sólo deben utilizarse con intervalos de clase, que se explicarán en breve.
Ejemplo 1 – Construcción de una tabla de distribución de frecuencias
Se realizó una encuesta en la avenida Maple. En cada uno de los 20 hogares, se preguntó a las personas cuántos coches estaban registrados en sus hogares. Los resultados se registraron de la siguiente manera:
1, 2, 1, 0, 3, 4, 0, 1, 1, 1, 2, 2, 3, 2, 1, 4, 0, 0
Utilice los siguientes pasos para presentar estos datos en una tabla de distribución de frecuencias.
- Divida los resultados (x) en intervalos y, a continuación, cuente el número de resultados en cada intervalo. En este caso, los intervalos serían el número de hogares sin coche (0), un coche (1), dos coches (2) y así sucesivamente.
- Haga una tabla con columnas separadas para los números de los intervalos (el número de coches por hogar), los resultados contados y la frecuencia de los resultados en cada intervalo. Etiquete estas columnas como Número de coches, Recuento y Frecuencia.
- Lea la lista de datos de izquierda a derecha y coloque una marca de recuento en la fila correspondiente. Por ejemplo, el primer resultado es un 1, así que coloca una marca de recuento en la fila junto a la que aparece el 1 en la columna del intervalo (Número de coches). El siguiente resultado es un 2, así que coloca una marca de conteo en la fila junto al 2, y así sucesivamente. Cuando llegues a la quinta marca de recuento, traza una línea de recuento a través de las cuatro marcas precedentes para que tus cálculos finales de frecuencia sean más fáciles de leer.
- Suma el número de marcas de recuento en cada fila y anótelo en la columna final titulada Frecuencia.
- Divida los resultados en intervalos y, a continuación, cuente el número de resultados en cada intervalo. En este caso, los intervalos de 10 son adecuados. Dado que 36 es la edad más baja y 92 la más alta, comience los intervalos en 35 a 44 y termine los intervalos con 85 a 94.
- Cree una tabla similar a la tabla de distribución de frecuencia pero con tres columnas adicionales.
- En la primera columna o columna Valor inferior, enumere el valor inferior de los intervalos de resultados. Por ejemplo, en la primera fila, pondría el número 35.
- La siguiente columna es la columna de valor Superior. Coloca el valor superior de los intervalos de resultados. Por ejemplo, en la primera fila pondría el número 44.
- La tercera columna es la de Frecuencia. Registra el número de veces que un resultado aparece entre los valores inferior y superior. En la primera fila, coloque el número 1.
- La cuarta columna es la de Frecuencia acumulada. Aquí sumamos la frecuencia acumulada de la fila anterior a la frecuencia de la fila actual. Como se trata de la primera fila, la frecuencia acumulada es la misma que la frecuencia. Sin embargo, en la segunda fila, la frecuencia del intervalo 35-44 (es decir, 1) se añade a la frecuencia del intervalo 45-54 (es decir, 2). Así, la frecuencia acumulada es 3, lo que significa que tenemos 3 participantes en el grupo de edad de 34 a 54 años.
1 + 2 = 3
- La siguiente columna es la de Porcentaje. En esta columna, anote el porcentaje de la frecuencia. Para ello, divide la frecuencia entre el número total de resultados y multiplícalo por 100. En este caso, la frecuencia de la primera fila es 1 y el número total de resultados es 10. El porcentaje sería entonces 10,0.
10.0. (1 ÷ 10) X 100 = 10,0
- La última columna es Porcentaje acumulado. En esta columna se divide la frecuencia acumulada por el número total de resultados y luego para hacer un porcentaje se multiplica por 100. Tenga en cuenta que el último número de esta columna debe ser siempre igual a 100,0. En este ejemplo, la frecuencia acumulada es 1 y el número total de resultados es 10, por lo que el porcentaje acumulado de la primera fila es 10,0.
10.0. (1 ÷ 10) X 100 = 10,0
La tabla de distribución de frecuencias acumuladas debe tener este aspecto:
Tabla 2. Edades de los participantes en un torneo de ajedrez Valor inferior Valor superior Frecuencia (f) Frecuencia acumulada frecuencia Porcentaje Porcentaje acumulado 35 44 1 1 10.0 10,0 45 54 2 3 20,0 30.0 55 64 2 5 20,0 50,0 65 74 2 7 20,0 70.0 75 84 2 9 20,0 90,0 85 94 1 10,0 100.0
Tu tabla de distribución de frecuencias para este ejercicio debe tener el siguiente aspecto:
Número de coches (x) | Total | Frecuencia (f) |
---|---|---|
0 | 4 | 1 | 6 |
2 | 5 | |
3 | 3 | |
4 | 2 |
Mirando rápidamente esta tabla de distribución de frecuencias, podemos ver que de los 20 hogares encuestados, 4 hogares no tenían coche, 6 hogares tenían 1 coche, etc.
Ejemplo 2 – Construir una tabla de distribución de frecuencias acumulativas
Una tabla de distribución de frecuencias acumulativas es una tabla más detallada. Tiene un aspecto casi idéntico al de una tabla de distribución de frecuencias, pero tiene columnas añadidas que dan la frecuencia acumulada y el porcentaje acumulado de los resultados, también.
En un reciente torneo de ajedrez, los 10 participantes tuvieron que rellenar un formulario en el que figuraban sus nombres, dirección y edad. Las edades de los participantes se registraron de la siguiente manera:
36, 48, 54, 92, 57, 63, 66, 76, 66, 80
Utilice los siguientes pasos para presentar estos datos en una tabla de distribución de frecuencias acumuladas.
Para más información sobre cómo hacer tablas de frecuencias acumuladas, vea la sección de Frecuencia acumulada y Porcentaje acumulado.
Intervalos de clase
Si una variable toma un gran número de valores, entonces es más fácil presentar y manejar los datos agrupando los valores en intervalos de clase. Es más probable que las variables continuas se presenten en intervalos de clase, mientras que las variables discretas pueden agruparse en intervalos de clase o no.
Para ilustrar, supongamos que establecemos intervalos de edad para un estudio de personas jóvenes, al tiempo que permitimos la posibilidad de que algunas personas mayores también entren en el ámbito de nuestro estudio.
La frecuencia de un intervalo de clase es el número de observaciones que se producen en un intervalo predefinido concreto. Así, por ejemplo, si en los datos de nuestro estudio aparecen 20 personas con edades comprendidas entre los 5 y los 9 años, la frecuencia del intervalo 5-9 es 20.
Los puntos finales de un intervalo de clase son los valores más bajos y más altos que puede tomar una variable. Así, los intervalos de nuestro estudio son de 0 a 4 años, de 5 a 9 años, de 10 a 14 años, de 15 a 19 años, de 20 a 24 años y de 25 años en adelante. Los puntos finales del primer intervalo son 0 y 4 si la variable es discreta, y 0 y 4,999 si la variable es continua. Los puntos finales de los otros intervalos de clase se determinarían de la misma manera.
La anchura del intervalo de clase es la diferencia entre el punto final inferior de un intervalo y el punto final inferior del siguiente intervalo. Así, si los intervalos continuos de nuestro estudio son de 0 a 4, de 5 a 9, etc., la anchura de los cinco primeros intervalos es 5, y el último intervalo está abierto, ya que no se le asigna ningún punto final superior. Los intervalos también podrían escribirse como de 0 a menos de 5, de 5 a menos de 10, de 10 a menos de 15, de 15 a menos de 20, de 20 a menos de 25 y de 25 en adelante.
Reglas para conjuntos de datos que contienen un gran número de observaciones
En resumen, siga estas reglas básicas al construir una tabla de distribución de frecuencias para un conjunto de datos que contiene un gran número de observaciones:
- encuentre los valores más bajos y más altos de las variables
- decida la anchura de los intervalos de clase
- incluya todos los valores posibles de la variable.
- El 7% de las pilas AA tienen una vida de entre 360 minutos y menos de 370 minutos, y que
- la probabilidad de que cualquier pila AA seleccionada al azar tenga una vida en este rango es aproximadamente de 0.07.
Al decidir la anchura de los intervalos de clase, tendrá que encontrar un compromiso entre tener intervalos lo suficientemente cortos para que no todas las observaciones caigan en el mismo intervalo, pero lo suficientemente largos para no acabar con una sola observación por intervalo.
También es importante asegurarse de que los intervalos de clase son mutuamente excluyentes.
Ejemplo 3 – Construir una tabla de distribución de frecuencias para un gran número de observaciones
Se probaron treinta pilas AA para determinar cuánto durarían. Los resultados, al minuto más cercano, se registraron de la siguiente manera:
423, 369, 387, 411, 393, 394, 371, 377, 389, 409, 392, 408, 431, 401, 363, 391, 405, 382, 400, 381, 399, 415, 428, 422, 396, 372, 410, 419, 386, 390
Utiliza los pasos del ejemplo 1 y las reglas anteriores para ayudarte a construir una tabla de distribución de frecuencias.
Respuesta
El valor más bajo es 363 y el más alto es 431.
Usando los datos dados y un intervalo de clase de 10, el intervalo para la primera clase es de 360 a 369 e incluye 363 (el valor más bajo). Recuerde que siempre debe haber suficientes intervalos de clase para que se incluya el valor más alto.
La tabla de distribución de frecuencias completada debe tener este aspecto:
Vida de las pilas, minutos (x) | Total | Frecuencia (f) | 360-369 | 2 |
---|---|---|
370-379 | 3 | |
380-389 | 5 | |
390-399 | 7 | 400-409 | 5 |
410-419 | 4 | |
420-429 | 3 | 430-439 | 1 |
30 |
Frecuencia relativa y frecuencia porcentual
Un analista que estudie estos datos podría querer saber no sólo cuánto duran las pilas, sino también qué proporción de las baterías entra en cada intervalo de clase de duración de la batería.
Esta frecuencia relativa de una determinada observación o intervalo de clase se encuentra dividiendo la frecuencia (f) por el número de observaciones (n): es decir, (f ÷ n). Así:
Frecuencia relativa = frecuencia ÷ número de observaciones
La frecuencia porcentual se encuentra multiplicando cada valor de frecuencia relativa por 100. Así:
Frecuencia porcentual = frecuencia relativa X 100 = f ÷ n X 100
Ejemplo 4 – Construcción de tablas de frecuencias relativas y frecuencias porcentuales
Utilice los datos del Ejemplo 3 para hacer una tabla que dé la frecuencia relativa y la frecuencia porcentual de cada intervalo de duración de la batería.
Aquí tienes el aspecto de esa tabla:
Vida de las pilas, minutos (x) | Frecuencia (f) | Frecuencia relativa | Frecuencia porcentual |
---|---|---|---|
360-369 | 2 | 0.07 | 7 | 370-379 | 3 | 0.10 | 10 | 380-389 | 5 | 0,17 |
390-399 | 7 | 0.23 | 23 |
400-409 | 5 | 0,17 | 17 |
410-419 | 4 | 0,13 | 420-429 | 3 | 0.10 | 10 |
430-439 | 1 | 0,03 | 3 |
30 | 1.00 | 100 |
Un analista de estos datos podría decir ahora que:
Tenga en cuenta que estas afirmaciones analíticas han supuesto que se ha extraído una muestra representativa. En el mundo real, un analista también se referiría a una estimación de la variabilidad (véase la sección titulada Medidas de dispersión) para completar el análisis. Para nuestro propósito, sin embargo, es suficiente saber que las tablas de distribución de frecuencias pueden proporcionar información importante sobre la población de la que se extrajo una muestra.