度数分布表
アーカイブされたコンテンツ
アーカイブされたと確認された情報は、参照、研究、記録保持の目的で提供されています。 カナダ政府のウェブスタンダードの対象ではなく、アーカイブされてから変更や更新はされていません。 これら以外のフォーマットをご希望の場合は、お問い合わせください。
- 例1-度数分布表の作成
- 例2-累積度数分布表の作成
- クラス区間
- 例3-多数の度数分布表の作成
- 相対度数とパーセント度数
- 例4 – 相対度数とパーセント度数表の構築
特定の観測の頻度(f)は、その観測がデータに出現する回数です。 ある変数の分布は、観測値の頻度のパターンです。
頻度分布は、各範囲に含まれるオブザベーションの実際の数を示す場合と、オブザベーションの割合を示す場合があります。
度数分布表は、カテゴリー変数と数値変数の両方に使用することができます。
Example 1 – Constructing a frequency distribution table
Maple Avenueでアンケート調査が行われました。 20軒の家で、それぞれの家に登録されている車の数を聞かれました。 結果は次のように記録されました:
1, 2, 1, 0, 3, 4, 0, 1, 1, 2, 3, 2, 3, 2, 1, 4, 0, 0
このデータを度数分布表で表示するには、次の手順を使用します。
- 結果(x)を間隔に分割し、各間隔の結果の数を数えます。
- 区間番号(世帯あたりの車の数)、集計結果、各区間における結果の頻度をそれぞれ別の列にして表を作成します。
- データのリストを左から右に読み、適切な行にタリーマークを付けます。 例えば、最初の結果は「1」なので、間隔の列(Number of cars)で「1」が表示されている横の行にタリーマークを置きます。 次の結果は「2」なので、「2」の横の行にタリーマークを置く、という具合です。
- 各行のタリーマークの数を合計し、最終的に「頻度」と題した列に記録します。
この演習の頻度分布表は次のようになります:
自動車の台数(x) | 集計 | 頻度(f) |
---|---|---|
0 | 4 | |
1 | 6 | |
2 | 5 | |
3 | 3 | |
4 | 2 |
この度の度数分布表を早速見てみましょう。 調査対象の20世帯のうち、車を持っていないのは4世帯、1台持っているのは6世帯ということがわかります。
例2 – 累積度数分布表を作成する
累積度数分布表は、より詳細な表です。
最近行われたチェス大会で、10人の参加者全員が、名前、住所、年齢を記入する用紙に記入しなければなりませんでした。
36、48、54、92、57、63、66、76、66、80
これらのデータを累積度数分布表で表示するには、次の手順を使用します。
- 結果を間隔に分け、各間隔の結果の数を数えます。 このケースでは、10個の間隔が適切です。 36が最も低い年齢で、92が最も高い年齢なので、間隔を35から44で開始し、85から94で終了させます。
- 度数分布表に似た表を作成しますが、3つの列が追加されます。
- 最初の列または下値の列に、結果の間隔の下値を列挙する。 例えば、最初の行には、35という数字を入れます。
- 次の列は、Upper value列です。 結果のインターバルの上限値を記載します。 例えば、最初の行には、数字の44を入れます。
- 3番目の列は、Frequency(頻度)列です。 下限値と上限値の間に結果が現れる回数を記録します。 1行目には、数字の1を入れます。
- 4列目は、累積頻度の列です。 ここでは、前の行の累積度数を現在の行の度数に加えます。 これは1行目なので、累積度数は度数と同じです。 しかし、2行目では、35~44歳の区間の頻度(=1)に、45~54歳の区間の頻度(=2)を加えています。 したがって、累積頻度は3となり、34歳から54歳の年齢層に3人の参加者がいることになります。
1 + 2 = 3
- 次の欄は「割合」の欄です。 この列には、頻度のパーセンテージを記載します。 これを行うには、頻度を結果の総数で割り、100を掛けます。 このケースでは、1行目の頻度が1で、結果の総数が10です。 この場合、パーセンテージは10.0となります。
10.0. (1 ÷ 10) X 100 = 10.0
- 最後の列はCumulative percentageです。 この列では、累積頻度を結果の総数で割り、パーセンテージにするために100を掛けます。 なお、この列の最後の数字は常に100.0になるようにしてください。 この例では、累積頻度が1で、結果の総数が10であることから、1行目の累積パーセンテージは10.0となります。
10.0. (1 ÷ 10) X 100 = 10.0
累積度数分布表は次のようになります:
表2. チェス大会の参加者の年齢 下の値 上の値 頻度(f) 累積 頻度 パーセンテージ 累積パーセンテージ 35 44 1 1 10.0 10.0 45 54 2 3 20.0 30.0 55 64 2 5 20.0 50.0 65 74 2 7 20.0 70.0。0 75 84 2 9 20.0 90.0 85 94 1 10 10.0 100.0
累積度数表の作成方法については、累積度数と累積パーセントの項を参照してください。
クラス区間
変数が多くの値をとる場合、クラス区間にグループ化することで、データの表示や取り扱いが容易になります。
例として、若年層を対象とした調査のために年齢層を設定し、高齢者も調査の対象になる可能性を考慮したとします。
クラス・インターバルの終点は、変数が取り得る最小値と最大値です。
クラスのインターバルの終点は、変数が取り得る最小値と最大値です。つまり、今回の研究では、0~4歳、5~9歳、10~14歳、15~19歳、20~24歳、25歳以上のインターバルを設定しました。 最初の区間の終点は、変数が離散的であれば0と4、変数が連続的であれば0と4.999です。
クラスインターバルの幅は、あるインターバルの下端と次のインターバルの下端の差です。
クラス インターバルの幅は、あるインターバルの下端と次のインターバルの下端との間の差です。したがって、私たちの研究の連続したインターバルが0から4、5から9などの場合、最初の5つのインターバルの幅は5で、最後のインターバルは、より高い終点が割り当てられていないため、開いています。 間隔は、0から5未満、5から10未満、10から15未満、15から20未満、20から25未満、25以上と書くこともできます。
多数のオブザベーションを含むデータセットのルール
要約すると、多数のオブザベーションを含むデータセットの度数分布表を作成する際には、以下の基本的なルールに従ってください:
- 変数の最小値と最大値を見つける
- クラス区間の幅を決める
- 変数のすべての可能な値を含める。
クラス区間の幅を決定する際には、すべてのオブザベーションが同じ区間に入らないように区間を十分に短くすることと、1つの区間に1つのオブザベーションしかない状態にならないように十分に長くすることの間で、妥協点を見つけなければなりません。
また、クラスの間隔が相互に排他的であることを確認することも重要です。
例 3 – 多数の観測値に対する度数分布表の構築
30個の単三電池をテストして、どれくらい持つかを調べました。 その結果は、分単位で次のように記録されました。
423、369、387、411、393、394、371、377、389、409、392、408、431、401、363、391、405、382、400、381、399、415、428、422、396、372、410、419、386、390
例題1の手順と上記のルールを参考にして、度数分布表を作成してみましょう。
回答
最も低い値は363で、最も高い値は431です。
与えられたデータとクラスの間隔10を使用すると、1つ目のクラスの間隔は360から369で、363(最も低い値)を含みます。
完成した度数分布表は次のようになります。
電池の寿命。 分(x) | タリー | 周波数(f) |
---|---|---|
360-369 | 2 | |
370-379 | 3 | |
380-389 | 5 | |
390-399 | 7 | |
400-409 | 5 | |
410-419 | 4 | |
420-429 | 3 | |
430-439 | 1 | |
合計 | 30 |
相対度数とパーセント度数
これらのデータを研究しているアナリストは、電池の寿命だけでなく、どのような割合で電池が使用されているかを知りたいと思うかもしれません。
この相対度数とパーセント度数というのは、バッテリーの寿命がどのくらいかということだけでなく、バッテリーのうちどのくらいの割合が、バッテリーの寿命の各クラスの間隔に当てはまるかということも知りたいと思います。
この特定の観測値またはクラスの間隔の相対的な頻度は、頻度 (f) を観測値の数 (n) で割ることによって求められます: つまり、(f ÷ n) です。 したがって、
相対度数=度数÷観測数
パーセント度数は、各相対度数の値に100を掛けて求めます。
パーセント度数 = 相対度数 X 100 = f ÷ n X 100
例4 – 相対度数とパーセント度数の表を作成する
例3のデータを使って、バッテリー寿命の各間隔の相対度数とパーセント度数を示す表を作成します。
その表は次のようになります。
電池の寿命、分(x) | 頻度(f) | 相対頻度 | パーセント頻度 |
---|---|---|---|
360-369 | 2 | 0.07 | 7 |
370-379 | 3 | 0.10 | 10 |
380-389 | 5 | 0.17 | 17 |
390-399 | 7 | 0.23 | 23 |
400-409 | 5 | 0.17 | 17 |
410-419 | 4 | 0.13 | 13 |
420-429 | 3 | 0.10 | 10 |
430-439 | 1 | 0.03 | 3 |
合計 | 30 | 1. |
これらのデータの分析者は次のように言うことができます:
- 単三電池の7%は360分から370分未満の寿命を持ち、
- ランダムに選択された単三電池がこの範囲の寿命を持つ確率は約0.07です。
これらの分析結果は、代表的なサンプルが抽出されたことを前提としていることに留意してください。 現実の世界では、分析者は、分析を完了するために、変動性の推定値 (Measurement of spreadのセクションを参照) も参照するでしょう。 しかし、今回の目的では、度数分布表が、サンプルが抽出された母集団に関する重要な情報を提供できることを知っていれば十分です。