Liens courants de la barre de menus

Tableaux de distribution de fréquences

Contenu archivé

L’information identifiée comme étant archivée est fournie à des fins de référence, de recherche ou de tenue de dossiers. Elle n’est pas soumise aux normes Web du gouvernement du Canada et n’a pas été modifiée ou mise à jour depuis son archivage. Veuillez nous contacter pour demander un format autre que ceux disponibles.

  • Exemple 1 – Construction d’un tableau de distribution des fréquences
  • Exemple 2 – Construction d’un tableau de distribution des fréquences cumulatives
    • Intervalles de classe
  • Exemple 3 – Construction d’un tableau de distribution des fréquences pour un grand nombre de observations
    • Fréquence relative et fréquence en pourcentage
  • Exemple 4 – Construction de tableaux de fréquence relative et de fréquence en pourcentage

La fréquence (f) d’une observation particulière est le nombre de fois où l’observation apparaît dans les données. La distribution d’une variable est le modèle des fréquences de l’observation. Les distributions de fréquences sont représentées sous forme de tableaux de fréquences, d’histogrammes ou de polygones.

Les distributions de fréquences peuvent montrer soit le nombre réel d’observations tombant dans chaque plage, soit le pourcentage d’observations. Dans ce dernier cas, la distribution est appelée distribution de fréquence relative.

Les tableaux de distribution de fréquence peuvent être utilisés pour les variables catégorielles et numériques. Les variables continues ne doivent être utilisées qu’avec des intervalles de classe, ce qui sera expliqué prochainement.

Exemple 1 – Construction d’un tableau de distribution de fréquences

Un sondage a été effectué sur l’avenue Maple. Dans chacun des 20 foyers, on a demandé aux personnes combien de voitures étaient enregistrées dans leur foyer. Les résultats ont été enregistrés comme suit :

1, 2, 1, 0, 3, 4, 0, 1, 1, 1, 2, 2, 3, 2, 3, 2, 1, 4, 0, 0

Suivez les étapes suivantes pour présenter ces données dans un tableau de distribution de fréquences.

  1. Divisez les résultats (x) en intervalles, puis comptez le nombre de résultats dans chaque intervalle. Dans ce cas, les intervalles seraient le nombre de ménages sans voiture (0), une voiture (1), deux voitures (2) et ainsi de suite.
  2. Faites un tableau avec des colonnes séparées pour les numéros d’intervalle (le nombre de voitures par ménage), les résultats comptés et la fréquence des résultats dans chaque intervalle. Intitulez ces colonnes Nombre de voitures, Décompte et Fréquence.
  3. Lisez la liste des données de gauche à droite et placez une marque de décompte dans la ligne appropriée. Par exemple, le premier résultat est un 1, donc placez une marque de pointage dans la ligne à côté de l’endroit où 1 apparaît dans la colonne d’intervalle (Nombre de voitures). Le résultat suivant est un 2, alors placez une marque de pointage dans la rangée à côté du 2, et ainsi de suite. Lorsque vous atteignez votre cinquième marque de pointage, tracez une ligne de pointage à travers les quatre marques précédentes pour rendre vos calculs de fréquence finaux plus faciles à lire.
  4. Ajoutez le nombre de marques de pointage dans chaque rangée et enregistrez-les dans la colonne finale intitulée Fréquence.

Votre tableau de distribution de fréquence pour cet exercice devrait ressembler à ceci:

.

Tableau 1. Tableau de fréquence pour le nombre de voitures immatriculées dans chaque ménage
Nombre de voitures (x) Tableau Fréquence (f)
0 4 4
1 6 6
2 5 5
3 3 3
4 5 2

En regardant rapidement ce tableau de distribution de fréquence, nous pouvons voir que sur les 20 ménages interrogés, 4 ménages n’avaient pas de voiture, 6 ménages avaient 1 voiture, etc.

Exemple 2 – Construction d’un tableau de distribution de fréquences cumulées

Un tableau de distribution de fréquences cumulées est un tableau plus détaillé. Il se présente presque de la même manière qu’un tableau de distribution de fréquences, mais il a ajouté des colonnes qui donnent la fréquence cumulée et le pourcentage cumulé des résultats, également.

Lors d’un récent tournoi d’échecs, les 10 participants ont dû remplir un formulaire indiquant leur nom, leur adresse et leur âge. Les âges des participants ont été enregistrés comme suit :

36, 48, 54, 92, 57, 63, 66, 76, 66, 80

Suivez les étapes suivantes pour présenter ces données dans un tableau de distribution de fréquence cumulée.

  1. Divisez les résultats en intervalles, puis comptez le nombre de résultats dans chaque intervalle. Dans ce cas, des intervalles de 10 sont appropriés. Puisque 36 est l’âge le plus bas et 92 est l’âge le plus élevé, commencez les intervalles de 35 à 44 et terminez les intervalles de 85 à 94.
  2. Créer un tableau similaire au tableau de distribution de fréquence mais avec trois colonnes supplémentaires.
    • Dans la première colonne ou la colonne Valeur inférieure, indiquez la valeur inférieure des intervalles de résultats. Par exemple, dans la première ligne, vous mettrez le nombre 35.
    • La colonne suivante est la colonne de valeur supérieure. Placez la valeur supérieure des intervalles de résultats. Par exemple, vous mettriez le nombre 44 dans la première ligne.
    • La troisième colonne est la colonne Fréquence. Inscrivez le nombre de fois où un résultat apparaît entre les valeurs inférieure et supérieure. Dans la première ligne, placez le nombre 1.
    • La quatrième colonne est la colonne Fréquence cumulée. Ici, nous ajoutons la fréquence cumulée de la ligne précédente à la fréquence de la ligne actuelle. Comme il s’agit de la première ligne, la fréquence cumulée est la même que la fréquence. Toutefois, dans la deuxième ligne, la fréquence de l’intervalle 35-44 (c’est-à-dire 1) est ajoutée à la fréquence de l’intervalle 45-54 (c’est-à-dire 2). Ainsi, la fréquence cumulée est de 3, ce qui signifie que nous avons 3 participants dans la tranche d’âge 34 à 54 ans.

      1 + 2 = 3

    • La colonne suivante est la colonne des pourcentages. Dans cette colonne, indiquez le pourcentage de la fréquence. Pour ce faire, divisez la fréquence par le nombre total de résultats et multipliez par 100. Dans ce cas, la fréquence de la première ligne est de 1 et le nombre total de résultats est de 10. Le pourcentage serait alors de 10,0.

      10.0. (1 ÷ 10) X 100 = 10,0

    • La dernière colonne est le pourcentage cumulé. Dans cette colonne, divisez la fréquence cumulée par le nombre total de résultats, puis pour obtenir un pourcentage, multipliez par 100. Notez que le dernier chiffre de cette colonne doit toujours être égal à 100,0. Dans cet exemple, la fréquence cumulée est 1 et le nombre total de résultats est 10, donc le pourcentage cumulé de la première ligne est 10,0.

      10.0. (1 ÷ 10) X 100 = 10,0

    Le tableau de distribution des fréquences cumulées devrait ressembler à ceci:

    Tableau 2. Âges des participants à un tournoi d’échecs
    Valeur inférieure Valeur supérieure Fréquence (f) Fréquence cumulée Fréquence cumulée . fréquence Pourcentage Pourcentage cumulé
    35 44 1 1 10.0 10.0
    45 54 2 3 20.0 30.0
    55 64 2 5 20.0 50.0 65 74 2 7 20.0 70.0 75 84 2 9 20.0 90.0 85 94 1 10 10.0 100.0

Pour plus d’informations sur la façon de réaliser des tableaux de fréquence cumulée, consultez la section Fréquence cumulée et Pourcentage cumulé.

Intervalles de classe

Si une variable prend un grand nombre de valeurs, il est alors plus facile de présenter et de traiter les données en regroupant les valeurs en intervalles de classe. Les variables continues sont plus susceptibles d’être présentées en intervalles de classe, tandis que les variables discrètes peuvent être regroupées en intervalles de classe ou non.

Pour illustrer, supposons que nous définissions des tranches d’âge pour une étude sur les jeunes, tout en prévoyant la possibilité que certaines personnes plus âgées puissent également entrer dans le champ de notre étude.

La fréquence d’un intervalle de classe est le nombre d’observations qui se produisent dans un intervalle prédéfini particulier. Ainsi, par exemple, si 20 personnes âgées de 5 à 9 ans apparaissent dans les données de notre étude, la fréquence de l’intervalle 5-9 est de 20.

Les extrémités d’un intervalle de classe sont les valeurs les plus basses et les plus hautes qu’une variable peut prendre. Ainsi, les intervalles de notre étude sont 0 à 4 ans, 5 à 9 ans, 10 à 14 ans, 15 à 19 ans, 20 à 24 ans et 25 ans et plus. Les extrémités du premier intervalle sont 0 et 4 si la variable est discrète, et 0 et 4,999 si la variable est continue. Les points extrêmes des autres intervalles de classe seraient déterminés de la même manière.

La largeur de l’intervalle de classe est la différence entre le point extrême inférieur d’un intervalle et le point extrême inférieur de l’intervalle suivant. Ainsi, si les intervalles continus de notre étude sont de 0 à 4, 5 à 9, etc., la largeur des cinq premiers intervalles est de 5, et le dernier intervalle est ouvert, puisqu’aucun point d’extrémité supérieur ne lui est attribué. Les intervalles pourraient également être écrits comme 0 à moins de 5, 5 à moins de 10, 10 à moins de 15, 15 à moins de 20, 20 à moins de 25, et 25 et plus.

Règles pour les ensembles de données qui contiennent un grand nombre d’observations

En résumé, suivez ces règles de base lorsque vous construisez un tableau de distribution de fréquences pour un ensemble de données qui contient un grand nombre d’observations :

  • trouver les valeurs les plus basses et les plus hautes des variables
  • décider de la largeur des intervalles de classe
  • inclure toutes les valeurs possibles de la variable.

En décidant de la largeur des intervalles de classe, vous devrez trouver un compromis entre avoir des intervalles suffisamment courts pour que toutes les observations ne tombent pas dans le même intervalle, mais suffisamment longs pour ne pas vous retrouver avec une seule observation par intervalle.

Il est également important de s’assurer que les intervalles de classe s’excluent mutuellement.

Exemple 3 – Construction d’un tableau de distribution de fréquences pour un grand nombre d’observations

Trentes piles AA ont été testées pour déterminer leur durée de vie. Les résultats, à la minute près, ont été enregistrés comme suit :

423, 369, 387, 411, 393, 394, 371, 377, 389, 409, 392, 408, 431, 401, 363, 391, 405, 382, 400, 381, 399, 415, 428, 422, 396, 372, 410, 419, 386, 390

Utilisez les étapes de l’exemple 1 et les règles ci-dessus pour vous aider à construire un tableau de distribution de fréquences.

Réponse

La valeur la plus faible est 363 et la plus élevée est 431.

En utilisant les données données et un intervalle de classe de 10, l’intervalle pour la première classe est de 360 à 369 et inclut 363 (la valeur la plus faible). N’oubliez pas qu’il doit toujours y avoir suffisamment d’intervalles de classe pour que la valeur la plus élevée soit incluse.

Le tableau de distribution de fréquence complété devrait ressembler à ceci:

.

.

Tableau 3. Durée de vie des piles AA, en minutes
Vie des piles, minutes (x) Tally Fréquence (f)
360-369 2 2
370-379 3 3
380-389 5 5
390-399 7 7
400-409 5 5
410-419 4 4
420-429 3 3
430-439 1 1
Total 30

Fréquence relative et fréquence en pourcentage

Un analyste étudiant ces données pourrait vouloir savoir non seulement combien de temps durent les piles, mais aussi quelle proportion des piles se situe dans chaque intervalle de classe de durée de vie des piles.

Cette fréquence relative d’une observation particulière ou d’un intervalle de classe est trouvée en divisant la fréquence (f) par le nombre d’observations (n) : c’est-à-dire (f ÷ n). Ainsi:

Fréquence relative = fréquence ÷ nombre d’observations

On trouve la fréquence en pourcentage en multipliant chaque valeur de fréquence relative par 100. Ainsi:

Fréquence en pourcentage = fréquence relative X 100 = f ÷ n X 100

Exemple 4 – Construction de tableaux de fréquence relative et de fréquence en pourcentage

Utiliser les données de l’exemple 3 pour réaliser un tableau donnant la fréquence relative et la fréquence en pourcentage de chaque intervalle d’autonomie de la batterie.

Voici à quoi ressemble ce tableau :

Tableau 4. Durée de vie des piles AA, en minutes
Vie des piles, minutes (x) Fréquence (f) Fréquence relative Pourcentage de fréquence
360-369 2 0.07 7
370-379 3 0.10 10
380-389 5 0,17 17
390-399 7 0.23 23
400-409 5 0,17 17
410-419 4 0,13 13
420-429 3 0.10 10
430-439 1 0,03 3
Total 30 1.00 100

Un analyste de ces données pourrait maintenant dire que :

  • 7% des piles AA ont une durée de vie allant de 360 minutes à mais inférieure à 370 minutes, et que
  • la probabilité qu’une pile AA choisie au hasard ait une durée de vie dans cette plage est d’environ 0.07.

N’oubliez pas que ces déclarations analytiques ont supposé qu’un échantillon représentatif a été tiré. Dans le monde réel, un analyste se référerait également à une estimation de la variabilité (voir la section intitulée Mesures de la dispersion) pour compléter l’analyse. Pour notre objectif, cependant, il suffit de savoir que les tableaux de distribution de fréquences peuvent fournir des informations importantes sur la population à partir de laquelle un échantillon a été tiré.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *