ligações da barra de menu comum

Tabelas de distribuição de frequência

Conteúdo Arquivado

Informação identificada como arquivada é fornecida para fins de referência, pesquisa ou manutenção de registos. Não está sujeita às Normas Web do Governo do Canadá e não foi alterada ou actualizada desde que foi arquivada. Por favor contacte-nos para solicitar um formato diferente dos disponíveis.

  • Exemplo 1 – Construção de uma tabela de distribuição de frequências
  • Exemplo 2 – Construção de uma tabela de distribuição de frequências acumuladas
    • intervalos de classe
  • Exemplo 3 – Construção de uma tabela de distribuição de frequências para grandes números de observações
    • Frequência relativa e frequência percentual
  • Exemplo 4 – Construção de tabelas de frequência relativa e frequência percentual

A frequência (f) de uma determinada observação é o número de vezes que a observação ocorre nos dados. A distribuição de uma variável é o padrão de frequências da observação. As distribuições de frequência são apresentadas como tabelas de frequência, histogramas, ou polígonos.

As distribuições de frequência podem mostrar quer o número real de observações que caem em cada intervalo, quer a percentagem de observações. Neste último caso, a distribuição é chamada distribuição de frequência relativa.

As tabelas de distribuição de frequência podem ser utilizadas tanto para variáveis categóricas como numéricas. As variáveis contínuas só devem ser utilizadas com intervalos de classe, o que será explicado em breve.

Exemplo 1 – Construção de uma tabela de distribuição de frequência

Foi realizado um inquérito na Maple Avenue. Em cada uma de 20 casas, foi perguntado às pessoas quantos carros estavam registados nas suas casas. Os resultados foram registados da seguinte forma:

1, 2, 1, 0, 3, 4, 0, 1, 1, 1, 1, 2, 2, 2, 3, 2, 3, 2, 1, 4, 0, 0

Utilizar os seguintes passos para apresentar estes dados numa tabela de distribuição de frequências.

  1. Dividir os resultados (x) em intervalos, e depois contar o número de resultados em cada intervalo. Neste caso, os intervalos seriam o número de famílias sem carro (0), um carro (1), dois carros (2) e assim por diante.
  2. Faça uma tabela com colunas separadas para os números dos intervalos (o número de carros por família), os resultados contados, e a frequência dos resultados em cada intervalo. Etiquete estas colunas Número de carros, Tally e Frequência.
  3. li>Leia a lista de dados da esquerda para a direita e coloque uma marca de tally na linha apropriada. Por exemplo, o primeiro resultado é um 1, por isso coloque uma marca de contagem na linha ao lado onde aparece 1 na coluna de intervalo (Número de carros). O resultado seguinte é um 2, por isso, colocar uma marca de contabilização na fila ao lado do 2, e assim por diante. Quando chegar à quinta marca de contagem, desenhe uma linha de contagem através das quatro marcas anteriores para facilitar a leitura dos seus cálculos finais de frequência.

  4. Adicionar o número de marcas de contagem em cada linha e registá-las na coluna final intitulada Frequency.

Sua tabela de distribuição de frequência para este exercício deve ter o seguinte aspecto:

>Número de carros (x)>Tally

>2

Table 1. Tabela de frequência para o número de carros registados em cada família ítulo>
Frequência (f)
0 4 4
1 6 6
5 5
3 3 3
4 5 2

Ao olhar rapidamente para esta tabela de distribuição de frequências, podemos ver que das 20 famílias inquiridas, 4 famílias não tinham carros, 6 famílias tinham 1 carro, etc.

Exemplo 2 – Construção de uma tabela de distribuição de frequência acumulada

Uma tabela de distribuição de frequência acumulada é uma tabela mais detalhada. Parece quase o mesmo que uma tabela de distribuição de frequência, mas acrescentou colunas que dão a frequência acumulada e a percentagem acumulada dos resultados, bem como.

Num torneio de xadrez recente, todos os 10 participantes tiveram de preencher um formulário que dava os seus nomes, morada e idade. As idades dos participantes foram registadas da seguinte forma:

36, 48, 54, 92, 57, 63, 66, 76, 66, 80

Utilizar os seguintes passos para apresentar estes dados numa tabela de distribuição de frequência acumulada.

  1. Dividir os resultados em intervalos, e depois contar o número de resultados em cada intervalo. Neste caso, os intervalos de 10 são apropriados. Uma vez que 36 é a idade mais baixa e 92 é a idade mais alta, iniciar os intervalos com 35 a 44 e terminar os intervalos com 85 a 94,
  2. Criar uma tabela semelhante à tabela de distribuição de frequências, mas com três colunas extra.
    • Na primeira coluna ou na coluna de valor inferior, enumerar o valor inferior dos intervalos de resultados. Por exemplo, na primeira linha, seria colocado o número 35.
    • A coluna seguinte é a coluna de valor superior. Colocar o valor superior dos intervalos de resultados. Por exemplo, colocar-se-ia o número 44 na primeira linha.
    • A terceira coluna é a coluna Frequência. Registar o número de vezes que um resultado aparece entre os valores inferior e superior. Na primeira linha, colocar o número 1.
    • A quarta coluna é a coluna de Frequência Cumulativa. Aqui adicionamos a frequência cumulativa da linha anterior à frequência da linha actual. Uma vez que esta é a primeira linha, a frequência cumulativa é a mesma que a frequência. Contudo, na segunda linha, a frequência para o intervalo 35-44 (isto é, 1) é adicionada à frequência para o intervalo 45-54 (isto é, 2). Assim, a frequência acumulada é 3, o que significa que temos 3 participantes no grupo etário dos 34 aos 54 anos.

      1 + 2 = 3

    • A coluna seguinte é a coluna Percentagem. Nesta coluna, enumere a percentagem da frequência. Para tal, dividir a frequência pelo número total de resultados e multiplicar por 100. Neste caso, a frequência da primeira linha é 1 e o número total de resultados é 10. A percentagem seria então 10,0.

      10.0. (1 ÷ 10) X 100 = 10,0

    • A coluna final é a percentagem acumulada. Nesta coluna, dividir a frequência acumulada pelo número total de resultados e depois, para fazer uma percentagem, multiplicar por 100. Note-se que o último número nesta coluna deve ser sempre igual a 100,0. Neste exemplo, a frequência cumulativa é 1 e o número total de resultados é 10, portanto a percentagem cumulativa da primeira linha é 10,0.

      10.0. (1 ÷ 10) X 100 = 10,0

    A tabela de distribuição de frequência acumulada deve ser parecida com esta:

    2

    1

    Table 2. Idades dos participantes num torneio de xadrezção>tr>>>baixo Valor>valor superior>Frequência (f)>cumulativo frequência%%%%
    >35 44 1 1 10.0 10.0
    45 54 2 3 20.0 30.0
    55 64 2 5 20.0 50.0
    65 74 7 20.0 70.0
    75 84 2 9 20.0 90.0
    85 94 10 10.0 100.0

Para mais informações sobre como fazer tabelas de frequência acumulada, ver a secção sobre Frequência acumulada e percentagem acumulada.

Intervalos de classe

Se uma variável toma um grande número de valores, então é mais fácil apresentar e tratar os dados agrupando os valores em intervalos de classe. As variáveis contínuas são mais susceptíveis de serem apresentadas em intervalos de classe, enquanto as variáveis discretas podem ser agrupadas em intervalos de classe ou não.

Para ilustrar, suponha-se que estabelecemos faixas etárias para um estudo de jovens, permitindo ao mesmo tempo a possibilidade de algumas pessoas mais velhas poderem também cair no âmbito do nosso estudo.

A frequência de um intervalo de classe é o número de observações que ocorrem num determinado intervalo pré-definido. Assim, por exemplo, se 20 pessoas de 5 a 9 anos aparecerem nos dados do nosso estudo, a frequência do intervalo 5-9 é 20,

Os pontos finais de um intervalo de classe são os valores mais baixos e mais altos que uma variável pode tomar. Assim, os intervalos no nosso estudo são de 0 a 4 anos, 5 a 9 anos, 10 a 14 anos, 15 a 19 anos, 20 a 24 anos, e 25 anos ou mais. Os pontos finais do primeiro intervalo são 0 e 4, se a variável for discreta, e 0 e 4,999, se a variável for contínua. Os pontos finais dos outros intervalos de classe seriam determinados da mesma forma.

Largura do intervalo de classe é a diferença entre o ponto final inferior de um intervalo e o ponto final inferior do intervalo seguinte. Assim, se os intervalos contínuos do nosso estudo forem de 0 a 4, 5 a 9, etc., a largura dos primeiros cinco intervalos é 5, e o último intervalo está aberto, uma vez que não lhe é atribuído um ponto final superior. Os intervalos também podem ser escritos como 0 a menos de 5, 5 a menos de 10, 10 a menos de 15, 15 a menos de 20, 20 a menos de 25, e 25 ou mais.

Regras para conjuntos de dados que contenham um grande número de observações

Em resumo, siga estas regras básicas ao construir uma tabela de distribuição de frequências para um conjunto de dados que contenha um grande número de observações:

  • a encontrar os valores mais baixos e mais altos das variáveis
  • decidir sobre a largura dos intervalos de classe
  • incluir todos os valores possíveis da variável.

Ao decidir sobre a largura dos intervalos de classe, terá de encontrar um compromisso entre ter intervalos suficientemente curtos para que nem todas as observações caiam no mesmo intervalo, mas suficientemente longos para que não se acabe com apenas uma observação por intervalo.

É também importante certificar-se de que os intervalos de classe são mutuamente exclusivos.

Exemplo 3 – Construção de uma tabela de distribuição de frequências para um grande número de observações

Trinta pilhas AA foram testadas para determinar quanto tempo durariam. Os resultados, ao minuto mais próximo, foram registados da seguinte forma:

423, 369, 387, 411, 393, 394, 371, 377, 389, 409, 392, 408, 431, 401, 363, 391, 405, 382, 400, 381, 399, 415, 428, 422, 396, 372, 410, 419, 386, 390

Utilizar os passos do Exemplo 1 e as regras acima mencionadas para o ajudar a construir uma tabela de distribuição de frequências.

Resposta

O valor mais baixo é 363 e o mais alto é 431.

Utilizando os dados fornecidos e um intervalo de classe de 10, o intervalo para a primeira classe é 360 a 369 e inclui 363 (o valor mais baixo). Lembre-se, deve haver sempre intervalos de classe suficientes para que o valor mais alto seja incluído.

A tabela de distribuição de frequência completa deve ter o seguinte aspecto:

>55

>410-419

Table 3. Duração das pilhas AA, em minutos
Battery life, minutos (x) Tally Frequency (f)
360-369 2 2
370-379 3 3
380-389 5 5
390-399 7 7
400-409 5
4 4
420-429 3 3
430-439 1 1
Total 30

Frequência relativa e frequência percentual

Um analista que estude estes dados poderá querer saber não só quanto tempo duram as baterias, mas também qual a proporção das baterias que se enquadra em cada intervalo de duração da bateria de cada classe.

Esta frequência relativa de uma determinada observação ou intervalo de classe é encontrada dividindo a frequência (f) pelo número de observações (n): ou seja, (f ÷ n). Assim:

Frequência relativa = frequência ÷ número de observações

A frequência percentual é encontrada multiplicando cada valor relativo de frequência por 100. Assim:

Frequência percentual = frequência relativa X 100 = f ÷ n X 100

Exemplo 4 – Construção de tabelas de frequência relativa e frequência percentual

Utilizar os dados do Exemplo 3 para fazer uma tabela com a frequência relativa e frequência percentual de cada intervalo de duração da bateria.

Aqui está o aspecto dessa tabela:

>th>Frequency (f)th>th> Frequência relativa>th>% de frequência

>th>360-369

>0.17

0.17

Table 4. Duração das pilhas AA, em minutos
Battery life, minutes (x)
2 0.07 7
370-379 3 0.10 10
380-389 5 17
390-399 7 0.23 23
400-409 5 17
410-419 4 0.13 13
420-429 3 0.10 10
430-439 1 0.03 3
Total 30 1.00 100

Um analista destes dados poderia agora dizer que:

  • 7% das pilhas AA têm uma vida útil de 360 minutos até mas inferior a 370 minutos, e que
  • a probabilidade de qualquer pilha AA seleccionada aleatoriamente ter uma vida útil neste intervalo é de aproximadamente 0.07.

Cutem em mente que estas declarações analíticas assumiram que foi extraída uma amostra representativa. No mundo real, um analista também se referiria a uma estimativa de variabilidade (ver secção intitulada Medidas de dispersão) para completar a análise. Para o nosso propósito, no entanto, basta saber que as tabelas de distribuição de frequência podem fornecer informações importantes sobre a população da qual uma amostra foi retirada.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *