Wspólne łącza paska menu

Tablice rozkładu częstości

Zawartość zarchiwizowana

Informacja określona jako zarchiwizowana jest dostarczana w celach referencyjnych, badawczych lub archiwizacyjnych. Nie podlegają one standardom Government of Canada Web Standards i nie były zmieniane ani aktualizowane od momentu ich zarchiwizowania. Prosimy o kontakt w celu uzyskania formatu innego niż dostępny.

  • Przykład 1 – Konstruowanie tabeli rozkładu częstości
  • Przykład 2 – Konstruowanie tabeli skumulowanego rozkładu częstości
    • Przedziały klas
  • Przykład 3 – Konstruowanie tabeli rozkładu częstości dla dużej liczby obserwacji
    • Częstotliwość względna i procentowa
  • Przykład 4 – Konstruowanie tabel częstotliwości względnej i procentowej

Częstotliwość (f) danej obserwacji jest liczbą wystąpień tej obserwacji w danych. Rozkład zmiennej jest wzorem częstości występowania obserwacji. Rozkłady częstości są przedstawiane jako tabele częstości, histogramy lub wielokąty.

Rozkłady częstości mogą pokazywać albo rzeczywistą liczbę obserwacji w każdym zakresie, albo procent obserwacji. W tym drugim przypadku rozkład nazywany jest względnym rozkładem częstości.

Tablice rozkładu częstości mogą być używane zarówno dla zmiennych kategorycznych, jak i numerycznych. Zmienne ciągłe powinny być używane tylko z przedziałami klasowymi, co zostanie wyjaśnione za chwilę.

Przykład 1 – Konstruowanie tabeli rozkładu częstości

Na Maple Avenue przeprowadzono ankietę. W każdym z 20 domów zapytano ludzi, ile samochodów jest zarejestrowanych na ich gospodarstwa domowe. Wyniki zostały zapisane w następujący sposób:

1, 2, 1, 0, 3, 4, 0, 1, 1, 1, 2, 2, 2, 3, 3, 2, 1, 4, 0, 0

Wykorzystaj następujące kroki, aby przedstawić te dane w tabeli rozkładu częstości.

  1. Podziel wyniki (x) na przedziały, a następnie policz liczbę wyników w każdym przedziale. W tym przypadku przedziałami byłyby: liczba gospodarstw domowych bez samochodu (0), z jednym samochodem (1), z dwoma samochodami (2) i tak dalej.
  2. Zrób tabelę z oddzielnymi kolumnami dla numerów przedziałów (liczba samochodów na gospodarstwo domowe), zliczonych wyników i częstości wyników w każdym przedziale. Oznacz te kolumny Liczba samochodów, Tally i Frequency.
  3. Przeczytaj listę danych od lewej do prawej i umieścić znak tally w odpowiednim rzędzie. Na przykład, pierwszy wynik jest 1, więc umieścić znak tally w wierszu obok, gdzie 1 pojawia się w kolumnie przedziału (Liczba samochodów). Następnym wynikiem jest 2, więc umieść znak tally w rzędzie obok 2, itd. Kiedy osiągniesz piąty znak tally, narysuj linię tally przez poprzednie cztery znaki, aby ułatwić odczytanie końcowych obliczeń częstotliwości.
  4. Podsumuj liczbę znaków tally w każdym rzędzie i zapisz je w ostatniej kolumnie zatytułowanej Częstotliwość.

Twoja tabela rozkładu częstotliwości dla tego ćwiczenia powinna wyglądać tak:

Tabela 1. Tabela rozkładu częstości dla liczby samochodów zarejestrowanych w każdym gospodarstwie domowym
Liczba samochodów (x) Liczba całkowita Częstotliwość (f)
0 4 4
1 6 6
2 5 5
3 3 3
4 5 2

Poprzez szybkie spojrzenie na tę tabelę rozkładu częstości, możemy zobaczyć, że z 20 badanych gospodarstw domowych, 4 gospodarstwa domowe nie miały samochodów, 6 gospodarstw domowych miało 1 samochód, itd.

Przykład 2 – Konstruowanie skumulowanej tabeli rozkładu częstości

Skumulowana tabela rozkładu częstości jest bardziej szczegółową tabelą. Wygląda prawie tak samo jak tabela rozkładu częstości, ale ma dodane kolumny, które dają skumulowaną częstość i skumulowany procent wyników, jak również.

Na ostatnim turnieju szachowym, wszyscy 10 z uczestników musieli wypełnić formularz, który podawał ich nazwiska, adres i wiek. Wiek uczestników został zapisany następująco:

36, 48, 54, 92, 57, 63, 66, 76, 66, 80

Wykorzystaj następujące kroki, aby przedstawić te dane w tabeli rozkładu częstości skumulowanej.

  1. Podziel wyniki na przedziały, a następnie policz liczbę wyników w każdym przedziale. W tym przypadku odpowiednie są przedziały 10. Ponieważ 36 to najniższy wiek, a 92 to najwyższy wiek, zacznij przedziały od 35 do 44, a zakończ je na 85 do 94.
  2. Stwórz tabelę podobną do tabeli rozkładu częstości, ale z trzema dodatkowymi kolumnami.
    • W pierwszej kolumnie lub kolumnie Dolna wartość, wymień dolną wartość przedziałów wyników. Na przykład w pierwszym wierszu umieść liczbę 35.
    • Kolejna kolumna to kolumna wartości górnej. Umieść górną wartość przedziałów wyników. Na przykład, można umieścić numer 44 w pierwszym rzędzie.
    • Trzecia kolumna jest kolumna Częstotliwość. Zapisz liczbę razy wynik pojawia się między dolną i górną wartością. W pierwszym rzędzie umieść liczbę 1.
    • Czwarta kolumna to kolumna częstotliwości skumulowanej. Tutaj dodajemy skumulowaną częstotliwość poprzedniego wiersza do częstotliwości bieżącego wiersza. Ponieważ jest to pierwszy wiersz, skumulowana częstotliwość jest taka sama jak częstotliwość. Jednakże, w drugim rzędzie, częstotliwość dla przedziału 35-44 (tj. 1) jest dodawana do częstotliwości dla przedziału 45-54 (tj. 2). W ten sposób skumulowana częstotliwość wynosi 3, co oznacza, że mamy 3 uczestników w grupie wiekowej od 34 do 54 lat.

      1 + 2 = 3

    • Kolejną kolumną jest kolumna Procent. W tej kolumnie należy wypisać procent częstości. Aby to zrobić, podziel częstotliwość przez całkowitą liczbę wyników i pomnóż przez 100. W tym przypadku częstotliwość w pierwszym rzędzie wynosi 1, a całkowita liczba wyników to 10. Procent wyniósłby więc 10.0.

      10.0. (1 ÷ 10) X 100 = 10.0

    • Ostatnia kolumna to Procent skumulowany. W tej kolumnie należy podzielić częstość skumulowaną przez całkowitą liczbę wyników, a następnie, aby uzyskać wartość procentową, pomnożyć przez 100. Zwróć uwagę, że ostatnia liczba w tej kolumnie powinna zawsze być równa 100.0. W tym przykładzie skumulowana częstotliwość wynosi 1, a całkowita liczba wyników wynosi 10, dlatego skumulowany procent pierwszego wiersza wynosi 10,0.

      10.0. (1 ÷ 10) X 100 = 10.0

    Tabela rozkładu częstości skumulowanej powinna wyglądać tak:

    Tabela 2. Wiek uczestników turnieju szachowego
    Lower Value Upper Value Frequency (f) Cumulative frequency Percentage Cumulative percentage
    35 44 1 1 10.0 10.0
    45 54 2 3 20.0 30.0
    55 64 2 5 20.0 50.0
    65 74 2 7 20.0 70.0
    75 84 2 9 20.0 90.0
    85 94 1 10 10.0 100.0

Więcej informacji na temat tworzenia tabel częstości skumulowanej można znaleźć w rozdziale Częstotliwość skumulowana i Procent skumulowany.

Integralność klas

Jeśli zmienna przyjmuje dużą liczbę wartości, to łatwiej jest przedstawić i posługiwać się danymi, grupując wartości w przedziały klasowe. Zmienne ciągłe chętniej przedstawia się w przedziałach klasowych, natomiast zmienne dyskretne można grupować w przedziały klasowe lub nie.

Dla ilustracji załóżmy, że określamy przedziały wiekowe dla badania młodych ludzi, dopuszczając jednocześnie możliwość, że w zakres naszego badania wejdą również niektóre osoby starsze.

Częstotliwość przedziału klasowego to liczba obserwacji, które występują w danym, z góry określonym przedziale. Tak więc, na przykład, jeśli w danych naszego badania pojawia się 20 osób w wieku od 5 do 9 lat, częstość dla przedziału 5-9 wynosi 20.

Końcowe punkty przedziału klasowego to najniższa i najwyższa wartość, jaką może przyjąć zmienna. W naszym badaniu są to więc przedziały: od 0 do 4 lat, od 5 do 9 lat, od 10 do 14 lat, od 15 do 19 lat, od 20 do 24 lat oraz 25 lat i więcej. Punktami końcowymi pierwszego przedziału są 0 i 4, jeśli zmienna jest dyskretna, oraz 0 i 4,999, jeśli zmienna jest ciągła. Punkty końcowe pozostałych przedziałów klasowych zostałyby wyznaczone w ten sam sposób.

Szerokość przedziału klasowego to różnica między dolnym punktem końcowym przedziału a dolnym punktem końcowym następnego przedziału. Tak więc, jeśli ciągłe interwały naszego badania to 0 do 4, 5 do 9, itd., szerokość pierwszych pięciu interwałów wynosi 5, a ostatni interwał jest otwarty, ponieważ nie jest mu przypisany żaden wyższy punkt końcowy. Interwały mogą być również zapisane jako 0 do mniej niż 5, 5 do mniej niż 10, 10 do mniej niż 15, 15 do mniej niż 20, 20 do mniej niż 25 oraz 25 i więcej.

Reguły dla zbiorów danych zawierających dużą liczbę obserwacji

Podsumowując, podczas konstruowania tabeli rozkładu częstości dla zbioru danych zawierającego dużą liczbę obserwacji należy przestrzegać następujących podstawowych reguł:

  • znajdź najniższą i najwyższą wartość zmiennych
  • zdecyduj o szerokości przedziałów klasowych
  • uwzględnij wszystkie możliwe wartości zmiennej.

Podejmując decyzję o szerokości przedziałów klasowych, trzeba będzie znaleźć kompromis między posiadaniem wystarczająco krótkich przedziałów, aby nie wszystkie obserwacje mieściły się w tym samym przedziale, ale wystarczająco długich, aby nie skończyć z tylko jedną obserwacją na przedział.

Jest również ważne, aby upewnić się, że przedziały klasowe wzajemnie się wykluczają.

Przykład 3 – Konstruowanie tabeli rozkładu częstości dla dużej liczby obserwacji

Trzydzieści baterii AA przetestowano, aby ustalić, jak długo wytrzymają. Wyniki, z dokładnością do minuty, zostały zapisane następująco:

423, 369, 387, 411, 393, 394, 371, 377, 389, 409, 392, 408, 431, 401, 363, 391, 405, 382, 400, 381, 399, 415, 428, 422, 396, 372, 410, 419, 386, 390

Użyj kroków z przykładu 1 i powyższych reguł, aby pomóc sobie w skonstruowaniu tabeli rozkładu częstości.

Odpowiedź

Najniższą wartością jest 363, a najwyższą 431.

Używając podanych danych i przedziału klasowego równego 10, przedział dla pierwszej klasy wynosi od 360 do 369 i zawiera 363 (najniższą wartość). Pamiętaj, że zawsze powinno być tyle przedziałów klasowych, aby najwyższa wartość została uwzględniona.

Pełna tabela rozkładu częstości powinna wyglądać tak:

.

Tabela 3. Żywotność baterii AA, w minutach
Żywotność baterii, minut (x) Tally Częstotliwość (f)
360-369 2 2
370-379 3 3
380-389 5 5
390-399 7 7
400-409 5 5
410-419 4 4
420-429 3 3
430-439 1 1
Total 30

Częstotliwość względna i procentowa

Analityk badający te dane może chcieć wiedzieć nie tylko jak długo wytrzymują baterie, ale także jaka część baterii mieści się w każdym przedziale klasowym żywotności baterii.

Tę względną częstość danej obserwacji lub przedziału klasowego można znaleźć, dzieląc częstość (f) przez liczbę obserwacji (n): to znaczy (f ÷ n). Zatem:

Częstotliwość względna = częstotliwość ÷ liczba obserwacji

Częstotliwość procentową znajdujemy, mnożąc każdą wartość częstotliwości względnej przez 100. Zatem:

Częstotliwość procentowa = częstość względna X 100 = f ÷ n X 100

Przykład 4 – Konstruowanie tabel częstości względnych i częstości procentowych

Użyj danych z przykładu 3, aby sporządzić tabelę podającą częstość względną i częstość procentową każdego przedziału czasu pracy baterii.

Tak wygląda ta tabela:

Tabela 4. Żywotność baterii AA, w minutach
Żywotność baterii, minuty (x) Częstotliwość (f) Częstotliwość względna Częstotliwość procentowa
360-369 2 0.07 7
370-379 3 0.10 10
380-389 5 0.17 17
390-399 7 0.23 23
400-409 5 0,17 17
410-419 4 0,13 13
420-429 3 0.10 10
430-439 1 0,03 3
Ogółem 30 1.00 100

Analityk tych danych mógłby teraz powiedzieć, że:

  • 7% baterii AA ma żywotność od 360 minut do, ale mniej niż 370 minut, i że
  • prawdopodobieństwo, że każda losowo wybrana bateria AA ma żywotność w tym zakresie wynosi około 0.07.

Pamiętaj, że te analityczne stwierdzenia zakładają, że wylosowano reprezentatywną próbkę. W rzeczywistym świecie, analityk odwołałby się również do oszacowania zmienności (patrz rozdział zatytułowany Miary rozprzestrzeniania się), aby zakończyć analizę. Dla naszego celu wystarczy jednak wiedzieć, że tablice rozkładu częstości mogą dostarczyć ważnych informacji o populacji, z której wylosowano próbę.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *