Gemeenschappelijke menubalk links

Frequentieverdelingstabellen

Gearchiveerde inhoud

Informatie die als gearchiveerd is aangemerkt, wordt ter beschikking gesteld voor referentie-, onderzoeks- of archiveringsdoeleinden. De informatie valt niet onder de webnormen van de Canadese regering en is niet gewijzigd of bijgewerkt sinds ze werd gearchiveerd. Neem contact met ons op om een ander formaat aan te vragen dan de beschikbare.

  • Voorbeeld 1 – Een frequentieverdelingstabel construeren
  • Voorbeeld 2 – Een cumulatieve frequentieverdelingstabel construeren
    • Klasse-intervallen
  • Voorbeeld 3 – Een frequentieverdelingstabel construeren voor grote aantallen waarnemingen
    • Relatieve frequentie en procentuele frequentie
  • Voorbeeld 4 – Construeren van relatieve frequentie- en procentuele frequentietabellen

De frequentie (f) van een bepaalde waarneming is het aantal keren dat de waarneming in de gegevens voorkomt. De verdeling van een variabele is het patroon van frequenties van de waarneming. Frequentieverdelingen worden weergegeven in de vorm van frequentietabellen, histogrammen of polygonen.

Frequentieverdelingen kunnen ofwel het werkelijke aantal waarnemingen binnen elk bereik weergeven, ofwel het percentage van de waarnemingen. In het laatste geval wordt de verdeling een relatieve frequentieverdeling genoemd.

Frequentieverdelingstabellen kunnen worden gebruikt voor zowel categorische als numerieke variabelen. Continue variabelen mogen alleen worden gebruikt met klasse-intervallen, die zo dadelijk worden uitgelegd.

Voorbeeld 1 – Een frequentieverdelingstabel samenstellen

Er werd een enquête gehouden op Maple Avenue. In elk van de 20 woningen werd gevraagd hoeveel auto’s er bij hun huishouden geregistreerd stonden. De resultaten werden als volgt genoteerd:

1, 2, 1, 0, 3, 4, 0, 1, 1, 1, 2, 2, 3, 2, 1, 4, 0, 0

Gebruik de volgende stappen om deze gegevens in een frequentieverdelingstabel te presenteren.

  1. Verdeel de resultaten (x) in intervallen, en tel vervolgens het aantal resultaten in elk interval. In dit geval zijn de intervallen het aantal huishoudens zonder auto (0), met één auto (1), met twee auto’s (2) enzovoort.
  2. Maak een tabel met aparte kolommen voor de intervalnummers (het aantal auto’s per huishouden), de getelde resultaten, en de frequentie van de resultaten in elk interval. Label deze kolommen Aantal auto’s, Tally en Frequentie.
  3. Lees de lijst met gegevens van links naar rechts en plaats een tally-teken in de juiste rij. Bijvoorbeeld, het eerste resultaat is een 1, dus plaats een streepje in de rij naast de 1 in de intervalkolom (Aantal auto’s). Het volgende resultaat is een 2, dus plaats een merkteken in de rij naast de 2, enzovoort. Trek bij het vijfde merkteken een streep door de vorige vier merktekens om de uiteindelijke frequentieberekeningen leesbaarder te maken.
  4. Tel het aantal merktekens in elke rij bij elkaar op en noteer ze in de laatste kolom met de titel Frequentie.

Uw frequentieverdelingstabel voor deze oefening moet er als volgt uitzien:

Tabel 1. Frequentietabel voor het aantal auto’s dat in elk huishouden is geregistreerd
Aantal auto’s (x) Telling Frequentie (f)
0 4 4
1 6 6
2 5 5
3 3 3
4 5 2

Als we snel naar deze frequentieverdelingstabel kijken, kunnen we zien dat van de 20 ondervraagde huishoudens, 4 huishoudens geen auto hadden, 6 huishoudens hadden 1 auto, enz.

Voorbeeld 2 – Het samenstellen van een cumulatieve frequentieverdelingstabel

Een cumulatieve frequentieverdelingstabel is een meer gedetailleerde tabel. Hij ziet er bijna hetzelfde uit als een frequentieverdelingstabel, maar er zijn kolommen aan toegevoegd die ook de cumulatieve frequentie en het cumulatieve percentage van de resultaten geven.

Bij een recent schaaktoernooi moesten alle 10 de deelnemers een formulier invullen waarop hun naam, adres en leeftijd stonden vermeld. De leeftijden van de deelnemers werden als volgt genoteerd:

36, 48, 54, 92, 57, 63, 66, 76, 80

Gebruik de volgende stappen om deze gegevens in een cumulatieve frequentieverdelingstabel te presenteren.

  1. Verdeel de resultaten in intervallen, en tel vervolgens het aantal resultaten in elk interval. In dit geval zijn intervallen van 10 geschikt. Aangezien 36 de laagste leeftijd is en 92 de hoogste leeftijd, beginnen de intervallen bij 35 tot 44 en eindigen de intervallen bij 85 tot 94.
  2. Maak een tabel die lijkt op de frequentieverdelingstabel, maar met drie extra kolommen.
    • In de eerste kolom of de kolom met de laagste waarde, vermeldt u de laagste waarde van de resultaatintervallen. In de eerste rij zou u bijvoorbeeld het getal 35 zetten.
    • De volgende kolom is de kolom Hogere waarde. Zet de bovenste waarde van de resultaatintervallen. In de eerste rij zou u bijvoorbeeld het getal 44 plaatsen.
    • De derde kolom is de kolom Frequentie. Noteer het aantal keren dat een resultaat tussen de onderste en de bovenste waarde voorkomt. In de eerste rij plaatst u het getal 1.
    • De vierde kolom is de kolom Cumulatieve frequentie. Hier tellen we de cumulatieve frequentie van de vorige rij op bij de frequentie van de huidige rij. Aangezien dit de eerste rij is, is de cumulatieve frequentie gelijk aan de frequentie. In de tweede rij wordt echter de frequentie voor het interval 35-44 (d.w.z. 1) opgeteld bij de frequentie voor het interval 45-54 (d.w.z. 2). De cumulatieve frequentie is dus 3, wat betekent dat we 3 deelnemers in de leeftijdsgroep 34-54 hebben.

      1 + 2 = 3

    • De volgende kolom is de kolom Percentage. Vermeld in deze kolom het percentage van de frequentie. Daartoe deelt u de frequentie door het totale aantal resultaten en vermenigvuldigt u dat met 100. In dit geval is de frequentie van de eerste rij 1 en het totale aantal resultaten 10. Het percentage zou dan 10,0 zijn.

      10.0. (1 ÷ 10) X 100 = 10,0

    • De laatste kolom is Cumulatief percentage. In deze kolom deelt u de cumulatieve frequentie door het totale aantal resultaten en vervolgens vermenigvuldigt u deze met 100 om er een percentage van te maken. Merk op dat het laatste getal in deze kolom altijd gelijk moet zijn aan 100,0. In dit voorbeeld is de cumulatieve frequentie 1 en het totale aantal resultaten 10, zodat het cumulatieve percentage van de eerste rij 10,0 is.

      10.0. (1 ÷ 10) X 100 = 10.0

    De cumulatieve frequentieverdelingstabel moet er als volgt uitzien:

    Tabel 2. Leeftijden van de deelnemers aan een schaaktoernooi
    Onderste waarde Bovenste waarde Frequentie (f) Cumulatieve frequentie Percentage Cumulatief percentage
    35 44 1 1 10.0 10.0
    45 54 2 3 20.0 30.0
    55 64 2 5 20.0 50.0
    65 74 2 7 20.0 70.0
    75 84 2 9 20.0 90.0
    85 94 1 10 10.0 100.0
    85 94 1 10.0 100.0

Voor meer informatie over het maken van cumulatieve frequentietabellen, zie het gedeelte over Cumulatieve frequentie en Cumulatief percentage.

Klasse-intervallen

Als een variabele een groot aantal waarden heeft, dan is het eenvoudiger om de gegevens te presenteren en te hanteren door de waarden te groeperen in klasse-intervallen. Continue variabelen zullen eerder in klasse-intervallen worden gepresenteerd, terwijl discrete variabelen al dan niet in klasse-intervallen kunnen worden gegroepeerd.

Ter illustratie, stel dat we leeftijdsbereiken vaststellen voor een onderzoek onder jongeren, terwijl we rekening houden met de mogelijkheid dat sommige ouderen ook binnen de reikwijdte van ons onderzoek kunnen vallen.

De frequentie van een klasse-interval is het aantal waarnemingen dat in een bepaald vooraf gedefinieerd interval voorkomt. Dus als er bijvoorbeeld 20 mensen van 5 tot 9 jaar in de gegevens van onze studie voorkomen, is de frequentie voor het interval 5-9 20.

De eindpunten van een klasse-interval zijn de laagste en hoogste waarden die een variabele kan aannemen. De intervallen in onze studie zijn dus 0 tot 4 jaar, 5 tot 9 jaar, 10 tot 14 jaar, 15 tot 19 jaar, 20 tot 24 jaar, en 25 jaar en ouder. De eindpunten van het eerste interval zijn 0 en 4 als de variabele discreet is, en 0 en 4,999 als de variabele continu is. De eindpunten van de andere klasse-intervallen zouden op dezelfde manier worden bepaald.

De breedte van het klasse-interval is het verschil tussen het laagste eindpunt van een interval en het laagste eindpunt van het volgende interval. Als de continue intervallen van onze studie dus van 0 tot 4, van 5 tot 9 enz. zijn, is de breedte van de eerste vijf intervallen 5, en is het laatste interval open, omdat daaraan geen hoger eindpunt is toegekend. De intervallen kunnen ook worden geschreven als 0 tot minder dan 5, 5 tot minder dan 10, 10 tot minder dan 15, 15 tot minder dan 20, 20 tot minder dan 25, en 25 en meer.

Regels voor gegevensverzamelingen die een groot aantal waarnemingen bevatten

Samengevat volgt u deze basisregels bij het construeren van een frequentieverdelingstabel voor een gegevensverzameling die een groot aantal waarnemingen bevat:

  • vind de laagste en hoogste waarden van de variabelen
  • beslis over de breedte van de klasse-intervallen
  • neem alle mogelijke waarden van de variabele op.

Bij het bepalen van de breedte van de klassenintervallen moet u een compromis zien te vinden tussen intervallen die kort genoeg zijn zodat niet alle waarnemingen in hetzelfde interval vallen, maar lang genoeg zodat u niet met slechts één waarneming per interval komt te zitten.

Het is ook belangrijk ervoor te zorgen dat de klasse-intervallen elkaar uitsluiten.

Voorbeeld 3 – Een frequentieverdelingstabel samenstellen voor grote aantallen waarnemingen

Dertig AA-batterijen werden getest om te bepalen hoe lang ze zouden meegaan. De resultaten, op de minuut nauwkeurig, werden als volgt genoteerd:

423, 369, 387, 411, 393, 394, 371, 377, 389, 409, 392, 408, 431, 401, 363, 391, 405, 382, 400, 381, 399, 415, 428, 422, 396, 372, 410, 419, 386, 390

Gebruik de stappen in Voorbeeld 1 en de bovenstaande regels om je te helpen een frequentieverdelingstabel te construeren.

Antwoorden

De laagste waarde is 363 en de hoogste 431.

Gebruik makend van de gegeven gegevens en een klasse-interval van 10, is het interval voor de eerste klasse 360 tot 369 en omvat het 363 (de laagste waarde). Denk eraan dat er altijd genoeg klasse-intervallen moeten zijn, zodat de hoogste waarde wordt meegerekend.

De ingevulde frequentieverdelingstabel moet er als volgt uitzien:

430-439

Tabel 3. Levensduur van AA-batterijen, in minuten
Levensduur batterijen, minuten (x) Taal Frequentie (f)
360-369 2 2
370-379 3 3
380-389 5 5
390-399 7 7
400-409 5 5
410-419 4 4
420-429 3 3
1 1
Totaal 30

Relatieve frequentie en procentuele frequentie

Een analist die deze gegevens bestudeert, wil misschien niet alleen weten hoe lang batterijen meegaan, maar ook welk percentage van de batterijen in elk klasse-interval van batterijlevensduur valt.

De relatieve frequentie van een bepaalde waarneming of klasse-interval wordt gevonden door de frequentie (f) te delen door het aantal waarnemingen (n): dat wil zeggen, (f ÷ n). Dus:

Relatieve frequentie = frequentie ÷ aantal waarnemingen

De procentuele frequentie wordt gevonden door elke relatieve frequentiewaarde met 100 te vermenigvuldigen. Dus:

Percentage frequentie = relatieve frequentie X 100 = f ÷ n X 100

Voorbeeld 4 – Opstellen van tabellen met relatieve frequentie en percentage frequentie

Gebruik de gegevens uit voorbeeld 3 om een tabel te maken met de relatieve frequentie en percentage frequentie van elk interval van de levensduur van de batterij.

Hier ziet die tabel eruit:

Tabel 4. Levensduur van AA-batterijen, in minuten
Levensduur batterij, minuten (x) Frequentie (f) Relatieve frequentie Percentuele frequentie
360-369 2 0.07 7
370-379 3 0.10 10
380-389 5 0.17 17
390-399 7 0.23 23
400-409 5 0.17 17
410-419 4 0.13 13
420-429 3 0.10 10
430-439 1 0.03 3
Totaal 30 1.00 100

Een analist van deze gegevens zou nu kunnen zeggen dat:

  • 7% van de AA-batterijen een levensduur heeft van 360 minuten tot maar minder dan 370 minuten, en dat
  • de waarschijnlijkheid dat een willekeurig geselecteerde AA-batterij een levensduur heeft in dit bereik ongeveer 0.07.

Bedenk dat er bij deze analytische uitspraken van is uitgegaan dat een representatieve steekproef is getrokken. In de echte wereld zou een analist zich ook baseren op een schatting van de variabiliteit (zie het hoofdstuk “Maten van spreiding”) om de analyse te vervolledigen. Voor ons doel is het echter voldoende te weten dat frequentieverdelingstabellen belangrijke informatie kunnen verschaffen over de populatie waaruit een steekproef is getrokken.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *