Collegamenti alla barra dei menu comuni

Tabelle di distribuzione della frequenza

Contenuto archiviato

Le informazioni identificate come archiviate sono fornite per scopi di riferimento, ricerca o conservazione. Non sono soggette agli Standard Web del Governo del Canada e non sono state modificate o aggiornate da quando sono state archiviate. Contattaci per richiedere un formato diverso da quelli disponibili.

  • Esempio 1 – Costruzione di una tabella di distribuzione di frequenza
  • Esempio 2 – Costruzione di una tabella di distribuzione di frequenza cumulativa
    • Intervalli di classe
  • Esempio 3 – Costruzione di una tabella di distribuzione di frequenza per grandi numeri di osservazioni
    • Frequenza relativa e frequenza percentuale
  • Esempio 4 – Costruzione di tabelle di frequenza relativa e frequenza percentuale

La frequenza (f) di una particolare osservazione è il numero di volte che l’osservazione si verifica nei dati. La distribuzione di una variabile è lo schema delle frequenze dell’osservazione. Le distribuzioni di frequenza sono rappresentate come tabelle di frequenza, istogrammi o poligoni.

Le distribuzioni di frequenza possono mostrare sia il numero effettivo di osservazioni che cadono in ogni intervallo o la percentuale di osservazioni. In quest’ultimo caso, la distribuzione è chiamata distribuzione di frequenza relativa.

Le tabelle di distribuzione di frequenza possono essere usate sia per variabili categoriche che numeriche. Le variabili continue dovrebbero essere usate solo con intervalli di classe, che saranno spiegati tra poco.

Esempio 1 – Costruzione di una tabella di distribuzione di frequenza

Un sondaggio è stato fatto su Maple Avenue. In ognuna delle 20 case, è stato chiesto alle persone quante auto erano registrate nelle loro famiglie. I risultati sono stati registrati come segue:

1, 2, 1, 0, 3, 4, 0, 1, 1, 1, 2, 2, 3, 2, 3, 2, 1, 4, 0, 0

Usa i seguenti passi per presentare questi dati in una tabella di distribuzione di frequenza.

  1. Dividi i risultati (x) in intervalli e poi conta il numero di risultati in ogni intervallo. In questo caso, gli intervalli sarebbero il numero di famiglie senza auto (0), un’auto (1), due auto (2) e così via.
  2. Fai una tabella con colonne separate per i numeri degli intervalli (il numero di auto per famiglia), i risultati contati e la frequenza dei risultati in ogni intervallo. Etichetta queste colonne Numero di auto, Conteggio e Frequenza.
  3. Leggi la lista dei dati da sinistra a destra e metti un segno di conteggio nella riga appropriata. Per esempio, il primo risultato è un 1, quindi metti un segno di conteggio nella riga accanto a dove appare 1 nella colonna dell’intervallo (Numero di auto). Il risultato successivo è un 2, quindi metti un segno di conteggio nella riga accanto al 2, e così via. Quando raggiungete il quinto segno di conteggio, tracciate una linea di conteggio attraverso i quattro segni precedenti per rendere i vostri calcoli di frequenza finali più facili da leggere.
  4. Sommate il numero di segni di conteggio in ogni riga e registrateli nella colonna finale intitolata Frequenza.

La vostra tabella di distribuzione della frequenza per questo esercizio dovrebbe essere simile a questa:

Tabella 1. Tabella di frequenza per il numero di auto registrate in ogni famiglia
Numero di auto (x) Tally Frequenza (f)
0 4 4
1 6 6
2 5 5
3 3 3
4 5 2

Guardando velocemente questa tabella di distribuzione di frequenza, possiamo vedere che su 20 famiglie intervistate, 4 famiglie non hanno auto, 6 famiglie hanno 1 auto, ecc.

Esempio 2 – Costruzione di una tabella di distribuzione di frequenza cumulativa

Una tabella di distribuzione di frequenza cumulativa è una tabella più dettagliata. Ha quasi lo stesso aspetto di una tabella di distribuzione di frequenza, ma ha aggiunto delle colonne che danno anche la frequenza cumulativa e la percentuale cumulativa dei risultati.

A un recente torneo di scacchi, tutti e 10 i partecipanti hanno dovuto compilare un modulo che riportava i loro nomi, indirizzo ed età. Le età dei partecipanti sono state registrate come segue:

36, 48, 54, 92, 57, 63, 66, 76, 66, 80

Usa i seguenti passi per presentare questi dati in una tabella di distribuzione di frequenza cumulativa.

  1. Dividi i risultati in intervalli e poi conta il numero di risultati in ogni intervallo. In questo caso, gli intervalli di 10 sono appropriati. Poiché 36 è l’età più bassa e 92 è l’età più alta, inizia gli intervalli da 35 a 44 e finisci gli intervalli da 85 a 94.
  2. Crea una tabella simile alla tabella di distribuzione della frequenza ma con tre colonne extra.
    • Nella prima colonna o colonna del valore inferiore, elencate il valore inferiore degli intervalli di risultato. Per esempio, nella prima riga, mettereste il numero 35.
    • La colonna successiva è la colonna del valore superiore. Mettete il valore superiore degli intervalli di risultato. Per esempio, metteresti il numero 44 nella prima riga.
    • La terza colonna è la colonna della frequenza. Registra il numero di volte che un risultato appare tra il valore inferiore e quello superiore. Nella prima riga, mettete il numero 1.
    • La quarta colonna è la colonna della frequenza cumulativa. Qui aggiungiamo la frequenza cumulativa della riga precedente alla frequenza della riga attuale. Poiché questa è la prima riga, la frequenza cumulativa è la stessa della frequenza. Tuttavia, nella seconda riga, la frequenza dell’intervallo 35-44 (cioè 1) viene aggiunta alla frequenza dell’intervallo 45-54 (cioè 2). Così, la frequenza cumulativa è 3, il che significa che abbiamo 3 partecipanti nel gruppo di età 34-54.

      1 + 2 = 3

    • La prossima colonna è la colonna Percentuale. In questa colonna, elenca la percentuale della frequenza. Per fare questo, dividete la frequenza per il numero totale di risultati e moltiplicate per 100. In questo caso, la frequenza della prima riga è 1 e il numero totale di risultati è 10. La percentuale sarebbe quindi 10.0.

      10.0. (1 ÷ 10) X 100 = 10.0

    • L’ultima colonna è Percentuale cumulativa. In questa colonna, dividete la frequenza cumulativa per il numero totale di risultati e poi per fare una percentuale, moltiplicate per 100. Notate che l’ultimo numero di questa colonna dovrebbe essere sempre uguale a 100.0. In questo esempio, la frequenza cumulativa è 1 e il numero totale di risultati è 10, quindi la percentuale cumulativa della prima riga è 10,0.

      10.0. (1 ÷ 10) X 100 = 10.0

    La tabella di distribuzione della frequenza cumulativa dovrebbe apparire così:

    Tabella 2. Età dei partecipanti ad un torneo di scacchi
    Valore inferiore Valore superiore Frequenza (f) Frequenza cumulativa frequenza Percentuale Percentuale cumulativa
    35 44 1 1 10.0 10.0
    45 54 2 3 20.0 30.0
    55 64 2 5 20.0 50.0
    65 74 2 7 20.0 70.0
    75 84 2 9 20.0 90.0
    85 94 1 10 10.0 100.0

Per maggiori informazioni su come creare tabelle di frequenza cumulativa, vedi la sezione Frequenza cumulativa e Percentuale cumulativa.

Intervalli di classe

Se una variabile assume un gran numero di valori, allora è più facile presentare e gestire i dati raggruppando i valori in intervalli di classe. È più probabile che le variabili continue siano presentate in intervalli di classe, mentre le variabili discrete possono essere raggruppate o meno in intervalli di classe.

Per illustrare, supponiamo di stabilire degli intervalli di età per uno studio sui giovani, pur ammettendo la possibilità che anche alcuni anziani possano rientrare nell’ambito del nostro studio.

La frequenza di un intervallo di classe è il numero di osservazioni che avvengono in un particolare intervallo predefinito. Così, per esempio, se 20 persone tra i 5 e i 9 anni appaiono nei dati del nostro studio, la frequenza dell’intervallo 5-9 è 20.

I punti finali di un intervallo di classe sono i valori più bassi e più alti che una variabile può assumere. Così, gli intervalli nel nostro studio sono da 0 a 4 anni, da 5 a 9 anni, da 10 a 14 anni, da 15 a 19 anni, da 20 a 24 anni, e 25 anni e oltre. Gli estremi del primo intervallo sono 0 e 4 se la variabile è discreta, e 0 e 4,999 se la variabile è continua. Gli estremi degli altri intervalli di classe verrebbero determinati nello stesso modo.

L’ampiezza dell’intervallo di classe è la differenza tra l’estremo inferiore di un intervallo e l’estremo inferiore dell’intervallo successivo. Così, se gli intervalli continui del nostro studio sono da 0 a 4, da 5 a 9, ecc., la larghezza dei primi cinque intervalli è 5, e l’ultimo intervallo è aperto, dato che non gli è stato assegnato un punto finale superiore. Gli intervalli potrebbero anche essere scritti come 0 a meno di 5, 5 a meno di 10, 10 a meno di 15, 15 a meno di 20, 20 a meno di 25, e 25 e oltre.

Regole per insiemi di dati che contengono un gran numero di osservazioni

In sintesi, seguite queste regole di base quando costruite una tabella di distribuzione di frequenza per un insieme di dati che contiene un gran numero di osservazioni:

  • trovate i valori più bassi e più alti delle variabili
  • decidete la larghezza degli intervalli delle classi
  • includete tutti i possibili valori della variabile.

Nel decidere la larghezza degli intervalli di classe, dovrete trovare un compromesso tra avere intervalli abbastanza corti in modo che non tutte le osservazioni cadano nello stesso intervallo, ma abbastanza lunghi in modo da non finire con una sola osservazione per intervallo.

È anche importante assicurarsi che gli intervalli di classe si escludano a vicenda.

Esempio 3 – Costruire una tabella di distribuzione di frequenza per un gran numero di osservazioni

Trenta batterie AA sono state testate per determinare la loro durata. I risultati, al minuto più vicino, sono stati registrati come segue:

423, 369, 387, 411, 393, 394, 371, 377, 389, 409, 392, 408, 431, 401, 363, 391, 405, 382, 400, 381, 399, 415, 428, 422, 396, 372, 410, 419, 386, 390

Utilizza i passi dell’esempio 1 e le regole di cui sopra per costruire una tabella di distribuzione delle frequenze.

Risposta

Il valore più basso è 363 e il più alto è 431.

Utilizzando i dati forniti e un intervallo di classe di 10, l’intervallo per la prima classe è da 360 a 369 e include 363 (il valore più basso). Ricordate, ci dovrebbero essere sempre abbastanza intervalli di classe in modo che il valore più alto sia incluso.

La tabella di distribuzione di frequenza completata dovrebbe essere come questa:

Tabella 3. Durata delle batterie AA, in minuti
Vita delle batterie, minuti (x) Tally Frequenza (f)
360-369 2 2
370-379 3 3
380-389 5 5
390-399 7 7
400-409 5 5
410-419 4 4
420-429 3 3
430-439 1 1
Totale 30

Frequenza relativa e frequenza percentuale

Un analista che studi questi dati potrebbe voler sapere non solo quanto durano le batterie, ma anche quale percentuale delle batterie rientra in ogni intervallo di classe di durata della batteria.

Questa frequenza relativa di una particolare osservazione o intervallo di classe si trova dividendo la frequenza (f) per il numero di osservazioni (n): cioè, (f ÷ n). Così:

Frequenza relativa = frequenza ÷ numero di osservazioni

La frequenza percentuale si trova moltiplicando ogni valore di frequenza relativa per 100. Così:

Frequenza percentuale = frequenza relativa X 100 = f ÷ n X 100

Esempio 4 – Costruzione di tabelle di frequenza relativa e frequenza percentuale

Utilizza i dati dell’esempio 3 per fare una tabella che dia la frequenza relativa e la frequenza percentuale di ogni intervallo di vita della batteria.

Ecco come appare la tabella:

Tabella 4. Durata delle batterie AA, in minuti
Vita della batteria, minuti (x) Frequenza (f) Frequenza relativa Frequenza percentuale
360-369 2 0.07 7
370-379 3 0.10 10
380-389 5 0.17 17
390-399 7 0.23 23
400-409 5 0.17 17
410-419 4 0.13 13
420-429 3 0.10 10
430-439 1 0.03 3
Totale 30 1.00 100

Un analista di questi dati potrebbe ora dire che:

  • il 7% delle batterie AA ha una durata da 360 minuti fino a ma meno di 370 minuti, e che
  • la probabilità di qualsiasi batteria AA scelta a caso di avere una vita in questo intervallo è circa 0.07.

Tenete presente che queste affermazioni analitiche hanno presupposto che sia stato estratto un campione rappresentativo. Nel mondo reale, un analista farebbe riferimento anche a una stima della variabilità (vedi sezione intitolata Misure di diffusione) per completare l’analisi. Per il nostro scopo, tuttavia, è sufficiente sapere che le tabelle di distribuzione della frequenza possono fornire importanti informazioni sulla popolazione da cui è stato estratto un campione.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *