Einführung in die Statistik

Lernergebnisse

  • Berechnen Sie den Stichprobenumfang, der erforderlich ist, um einen Populationsmittelwert und einen Populationsanteil unter Berücksichtigung eines gewünschten Konfidenzniveaus und einer Fehlermarge zu schätzen

In einem Wahljahr sehen wir Artikel in der Zeitung, die Konfidenzintervalle in Form von Anteilen oder Prozentsätzen angeben. Zum Beispiel könnte eine Umfrage für einen bestimmten Kandidaten, der für das Präsidentenamt kandidiert, zeigen, dass der Kandidat 40 % der Stimmen innerhalb von drei Prozentpunkten hat (wenn die Stichprobe groß genug ist). Oft werden Wahlumfragen mit 95%iger Sicherheit berechnet, so dass die Meinungsforscher mit 95%iger Sicherheit davon ausgehen können, dass der wahre Anteil der Wähler, die den Kandidaten favorisieren, zwischen 0,37 und 0,43 liegt: (0,40 – 0,03,0,40 + 0,03).

Investoren an der Börse interessieren sich für den wahren Anteil der Aktien, die jede Woche steigen und fallen. Unternehmen, die Personalcomputer verkaufen, sind an dem Anteil der Haushalte in den Vereinigten Staaten interessiert, die Personalcomputer besitzen. Konfidenzintervalle können für den wahren Anteil der Aktien, die jede Woche steigen oder fallen, und für den wahren Anteil der Haushalte in den USA, die Personalcomputer besitzen, berechnet werden.

Das Verfahren zur Ermittlung des Konfidenzintervalls, des Stichprobenumfangs, der Fehlergrenze und des Konfidenzniveaus für einen Anteil ist dem für den Populationsmittelwert ähnlich, aber die Formeln sind unterschiedlich.

Woher weiß man, dass man es mit einem Anteilsproblem zu tun hat? Erstens: Die zugrunde liegende Verteilung ist eine Binomialverteilung. (Von einem Mittelwert oder Durchschnitt ist nicht die Rede.) Wenn X eine binomiale Zufallsvariable ist, dann ist X ~ B(n, p), wobei n die Anzahl der Versuche und p die Erfolgswahrscheinlichkeit ist. Um eine Proportion zu bilden, nimmt man X, die Zufallsvariable für die Anzahl der Erfolge, und dividiert sie durch n, die Anzahl der Versuche (oder den Stichprobenumfang). Die Zufallsvariable P′ (lies „P prime“) ist dieses Verhältnis,

\displaystyle{P‘}=\frac{{X}}{{n}}

(Manchmal wird die Zufallsvariable als \displaystyle\hat{P}, lies „P hat“, bezeichnet.)

Wenn n groß ist und p nicht nahe Null oder Eins ist, können wir die Normalverteilung verwenden, um die Binomialverteilung zu approximieren.

\displaystyle{X}~{N}{({n}{p},\sqrt{{{n}{p}{q}})}

Wenn wir die Zufallsvariable, den Mittelwert und die Standardabweichung durch
n teilen, erhalten wir eine Normalverteilung der Proportionen mit P′, genannt die geschätzte Proportion, als Zufallsvariable. (Erinnern Sie sich, dass eine Proportion die Anzahl der Erfolge geteilt durch n ist.)

\displaystyle\frac{{X}}{{n}}={P‘}{\sim}{N}{(\frac{{{n}{p}}}{{n}},\frac{{\sqrt{{{{n}{p}{q}}}}}{{n}})}

Zur Vereinfachung verwenden wir Algebra:
\displaystyle\frac{{\sqrt{{{n}{p}{q}}}}}{{n}}=\sqrt{{\frac{{{p}{q}}}{{n}}}}

P′ folgt einer Normalverteilung für Proportionen:

\displaystyle\frac{{X}}{{n}}={P‘}{\sim}{N}{(\frac{{{n}{p}}}{{n}},\frac{{\sqrt{{{n}{p}{q}}}}}{{n}})}

Das Vertrauensintervall hat die Form (p′ – EBP, p′ + EBP). EBP ist die Fehlergrenze für den Anteil.

\displaystyle{p‘}=\frac{{x}}{{n}}

p′ = der geschätzte Anteil der Erfolge (p′ ist eine Punktschätzung für p, den wahren Anteil.)

x = die Anzahl der Erfolge

n = der Umfang der Stichprobe

Die Fehlergrenze für einen Anteil ist EBP = \displaystyle({z}_{\frac{{\alpha}}}{{2}})(\sqrt{\frac{{p’q‘}}{{{n}}}) wobei q‘ = 1-p‘.

Diese Formel ähnelt der Fehlergrenzenformel für einen Mittelwert, mit dem Unterschied, dass die „geeignete Standardabweichung“ anders ist. Für einen Mittelwert, wenn die Standardabweichung der Population bekannt ist, ist die geeignete Standardabweichung, die wir verwenden, \displaystyle\frac{{\sigma}}{{\sqrt{n}}}. Für einen Anteil ist die geeignete Standardabweichung \displaystyle\sqrt{\frac{{pq}}{{n}}}. In der Fehlergrenzenformel wird jedoch \displaystyle\sqrt{\frac{{p’q‘}}{{n}}} als Standardabweichung verwendet, anstatt \displaystyle\sqrt{\frac{{pq}}{{n}}}.

In der Fehlergrenzenformel sind die Stichprobenanteile p′ und q′ Schätzungen der unbekannten Populationsanteile p und q. Die geschätzten Anteile p′ und q′ werden verwendet, da p und q nicht bekannt sind. Die Stichprobenanteile p′ und q′ werden aus den Daten berechnet: p′ ist der geschätzte Anteil der Erfolge und q′ ist der geschätzte Anteil der Misserfolge.

Das Konfidenzintervall kann nur verwendet werden, wenn die Anzahl der Erfolge np′ und die Anzahl der Misserfolge nq′ beide größer als fünf sind.

Hinweis

Für die Normalverteilung von Anteilen lautet die z-Score-Formel wie folgt. Wenn \displaystyle{P‘}{\sim}{N}(p, \displaystyle\sqrt{\frac{{pq}}{{n}}), dann lautet die z-Score-Formel z = \displaystyle\frac{{p‘-p}}{{\sqrt{pqn}}}

Beispiel

Angenommen, ein Marktforschungsunternehmen wird beauftragt, den Prozentsatz der in einer Großstadt lebenden Erwachsenen zu schätzen, die ein Mobiltelefon besitzen. Fünfhundert zufällig ausgewählte erwachsene Einwohner dieser Stadt werden befragt, um festzustellen, ob sie Handys besitzen. Von den 500 befragten Personen antworteten 421 mit „Ja“ – sie besitzen Handys. Berechnen Sie unter Verwendung eines Konfidenzniveaus von 95 % eine Konfidenzintervallschätzung für den wahren Anteil der erwachsenen Einwohner dieser Stadt, die Mobiltelefone besitzen.

  • Die erste Lösung ist schrittweise (Lösung A).
  • Die zweite Lösung verwendet eine Funktion der Taschenrechner TI-83, 83+ oder 84 (Lösung B).

Lösung A:

Lassen Sie X = die Anzahl der Personen in der Stichprobe, die Mobiltelefone besitzen. X ist binomial.

X ~ B(500, \displaystyle\frac{{421}}{{500}})

Um das Konfidenzintervall zu berechnen, müssen Sie p′, q′ undEBP finden.

n = 500

x = die Anzahl der Erfolge = 421

p’= \displaystyle\frac{{x}}{{{n}} =\frac{{421}}{{500}} = 0,842

p′ = 0.842 ist der Stichprobenanteil; dies ist die Punktschätzung des Populationsanteils.

q′ = 1 – p′ = 1 – 0.842 = 0.158

Da CL = 0.95, dann ist α = 1 – CL = 1 – 0.95 = 0,05 (α) = 0,025.

Dann ist \displaystyle{z}_{\frac{{\alpha}}{{2}}={z}_{0,025} = 1,96

Benutzen Sie den TI-83, 83+ oder 84+ Taschenrechner-Befehl invNorm(0,975,0,1), um z0,025 zu finden. Denken Sie daran, dass die Fläche rechts von z0,025 gleich 0,025 und die Fläche links von z0,025 gleich 0,975 ist. Dies kann auch mit entsprechenden Befehlen auf anderen Taschenrechnern, mit einem Computer oder mit einer Standardnormal-Wahrscheinlichkeitstabelle ermittelt werden.

EBP = \displaystyle({z}_{\frac{{\alpha}}{{2}})(\sqrt{\frac{{p’q‘}}{{{n}}}) = (1.96)\displaystyle\sqrt{\frac{{(0.842)(0.158)}}{{500}}} = 0.032

p‘−EBP=0.842−0.032=0.81

p′+EBP=0.842+0.032=0.874

Das Konfidenzintervall für den wahren binomialen Bevölkerungsanteil ist ( p′ – EBP, p′ + EBP) = (0,810, 0,874).

Interpretation

Wir schätzen mit 95 % Konfidenz, dass zwischen 81 % und 87,4 % aller erwachsenen Einwohner dieser Stadt ein Mobiltelefon besitzen.

Erklärung des 95 %-Konfidenzniveaus

Fünfundneunzig Prozent der so konstruierten Konfidenzintervalle würden den wahren Wert für den Bevölkerungsanteil aller erwachsenen Einwohner dieser Stadt enthalten, die ein Mobiltelefon besitzen.

Lösung B:

Drücken Sie STAT und pfeilen Sie zuTESTS.

Pfeilen Sie nach unten zu A:1-PropZint. Drücken Sie ENTER.Pfeil nach unten bis und geben Sie 421 ein.Pfeil nach unten bis und geben Sie 500 ein.Pfeil nach unten bis C-Level und geben Sie .95 ein.Pfeil nach unten bis Calculate und drücken Sie ENTER.Das Konfidenzintervall ist (0,81003, 0,87397).

Versuch es

Angenommen, 250 zufällig ausgewählte Personen werden befragt, ob sie ein Tablet besitzen. Von den 250 Befragten gaben 98 an, ein Tablet zu besitzen. Berechnen Sie unter Verwendung eines Konfidenzniveaus von 95 % eine Konfidenzintervallschätzung für den wahren Anteil der Personen, die ein Tablet besitzen.

(0,3315, 0,4525)

Beispiel

Für ein Unterrichtsprojekt möchte ein Student der Politikwissenschaft an einer großen Universität den Prozentsatz der Studenten schätzen, die als Wähler registriert sind. Er befragt 500 Studenten und stellt fest, dass 300 als Wähler registriert sind. Berechnen Sie ein 90%-Konfidenzintervall für den wahren Prozentsatz der Studenten, die als Wähler registriert sind, und interpretieren Sie das Konfidenzintervall.

  • Die erste Lösung ist schrittweise (Lösung A).
  • Die zweite Lösung verwendet eine Funktion des TI-83, 83+ oder 84-Rechners (Lösung B).

Lösung A:

x = 300 und n = 500

p‘ =\displaystyle\frac{{x}}{{{n}} = \frac{{300}}{{500}} = 0.600
Da CL = 0.90, dann α = 1 – CL = 1 – 0.90 = 0.10

\displaystyle\frac{{\alpha}}{{2}} = 0,05
\displaystyle{z}_{\frac{{\alpha}}{{2}}} = \displaystyle{z}_{0,05} = 1,645

Benutzen Sie den TI-83, 83+ oder 84+ Taschenrechner-Befehl invNorm(0,95,0,1), um z0,05 zu finden. Denken Sie daran, dass der Bereich rechts von z0,05 0,05 und der Bereich links von z0,05 0,95 ist. Dies kann auch mit entsprechenden Befehlen auf anderen Taschenrechnern, mit einem Computer oder mit einer Standard-Normalwahrscheinlichkeitstabelle ermittelt werden.

EBP = \displaystyle({z}_{\frac{{\alpha}}{{2}})(\sqrt{\frac{{p’q‘}}{{n}})) = (1,645)\displaystyle\sqrt{\frac{{(0,6)(0,4)}}{{500}} = 0.036

Das Konfidenzintervall für den wahren binomialen Bevölkerungsanteil ist (p′ – EBP, p′ + EBP) = (0,564,0,636).

Interpretation

  • Wir schätzen mit 90%iger Sicherheit, dass der wahre Prozentsatz aller Studenten, die als Wähler registriert sind, zwischen 56,4% und 63,6% liegt.
  • Alternative Formulierung: Wir schätzen mit 90-prozentiger Sicherheit, dass zwischen 56,4 % und 63,6 % ALLER Studenten registrierte Wähler sind.

Erläuterung des 90-prozentigen Konfidenzniveaus

Neunzig Prozent aller auf diese Weise konstruierten Konfidenzintervalle enthalten den wahren Wert für den Prozentsatz der Studenten, die registrierte Wähler sind.

Lösung B:

Drücken Sie STAT und pfeilen Sie aufTESTS.

Pfeilen Sie nach unten auf A:1-PropZint.

Drücken Sie ENTER.

Pfeilen Sie nach unten zu und geben Sie 300 ein.

Pfeilen Sie nach unten zu und geben Sie 500 ein.

Pfeilen Sie nach unten bis C-Level und geben Sie 0,90 ein.

Pfeilen Sie nach unten bis Calculate und drücken Sie ENTER.

Das Konfidenzintervall ist (0,564, 0,636).

Beispiel

Ein Student befragt seine Schule, um herauszufinden, ob die Schüler im Schulbezirk für oder gegen die neue Gesetzgebung bezüglich Schuluniformen sind. Sie befragt 600 Schüler und findet heraus, dass 480 gegen die neue Gesetzgebung sind.

  1. Berechnen Sie ein 90%-Konfidenzintervall für den wahren Prozentsatz der Schüler, die gegen die neue Gesetzgebung sind, und interpretieren Sie das Konfidenzintervall.
  2. In einer Stichprobe von 300 Schülern gaben 68% an, dass sie einen iPod und ein Smartphone besitzen. Berechnen Sie ein 97%-Konfidenzintervall für den wahren Prozentsatz der Schüler, die einen iPod und ein Smartphone besitzen.

Lösung

  1. (0,7731, 0,8269); Wir schätzen mit 90%iger Konfidenz, dass der wahre Prozentsatz aller Schüler im Bezirk, die gegen die neue Gesetzgebung sind, zwischen 77,31% und 82,69% liegt.
  2. Die erste Lösung ist schrittweise (Lösung A). Die zweite Lösung verwendet eine Funktion des Taschenrechners TI-83, 83+ oder 84 (Lösung B)

Lösung A

  • Achtundsechzig Prozent (68 %) der Schüler besitzen einen iPod und ein Smartphone. p′=0,68, q′=1′=1-0,68=0,32
  • Da CL = 0,97 ist, wissen wir α=1-0,97=0,03
  • Die Fläche links von z0.015 ist 0,015, und die Fläche rechts von z0,015 ist 1 – 0,015 = 0,985.
  • Mit der Taschenrechnerfunktion InvNorm(.985,0,1) des TI 83, 83+ oder 84+ ergibt sich z0.015 = 2.17

EBP = \displaystyle({z}_{\frac{{\alpha}}{{2}})(\sqrt{\frac{{p’q‘}}{{n}}) = (1.645)\displaystyle\sqrt{\frac{{(0.68)(0.32)}}{{{300}}} = 0.0269

  • Wir sind zu 97 % sicher, dass der wahre Anteil aller Schüler, die einen iPod und ein Smartphone besitzen, zwischen 0,6531 und 0,7069 liegt.

Lösung B

  1. Drücken Sie STAT und gehen Sie mit dem Pfeil auf TESTS.
  2. Pfeil nach unten zu A:1-PropZint.
  3. Drücken Sie ENTER.
  4. Pfeil nach unten zu x und geben Sie 300*0,68 ein.
  5. Pfeil nach unten zu n und geben Sie 300 ein.
  6. Pfeil nach unten zu C-Level und geben Sie 0,97 ein.
  7. Pfeil nach unten zu Berechnen und drücken Sie ENTER.
  8. Das Konfidenzintervall ist (0,6531, 0,7069).

„Plus Vier“ Konfidenzintervall für p

Bei der Berechnung eines Konfidenzintervalls für einen Anteil ist ein gewisser Fehleranteil enthalten. Da wir den wahren Anteil der Grundgesamtheit nicht kennen, sind wir gezwungen, Punktschätzungen zu verwenden, um die entsprechende Standardabweichung der Stichprobenverteilung zu berechnen. Studien haben gezeigt, dass die resultierende Schätzung der Standardabweichung fehlerhaft sein kann.

Glücklicherweise gibt es eine einfache Anpassung, die es uns ermöglicht, genauere Konfidenzintervalle zu erzeugen. Wir geben einfach vor, dass wir vier zusätzliche Beobachtungen haben. Zwei dieser Beobachtungen sind Erfolge und zwei sind Misserfolge. Der neue Stichprobenumfang ist dann n + 4, und die neue Anzahl der Erfolge ist x + 2.

Computerstudien haben die Effektivität dieser Methode gezeigt. Sie sollte verwendet werden, wenn das gewünschte Konfidenzniveau mindestens 90 % und der Stichprobenumfang mindestens zehn beträgt.

Beispiel

Eine Zufallsstichprobe von 25 Statistikstudenten wurde gefragt: „Haben Sie in der letzten Woche eine Zigarette geraucht?“ Sechs Studenten gaben an, in der letzten Woche geraucht zu haben. Verwenden Sie die „Plus-Vier“-Methode, um ein 95%-Konfidenzintervall für den wahren Anteil der Statistikstudenten, die rauchen, zu finden.

Lösung A:

Sechs von 25 Studenten gaben an, in der letzten Woche geraucht zu haben, also x = 6 und n = 25. Da wir die „Plus-Vier“-Methode anwenden, verwenden wir x = 6 + 2 = 8 und n = 25 + 4 = 29.

p‘ = \displaystyle\frac{{x}}{{n}} =\frac{{8}}{{29}} = 0.276

q‘ = 1-p‘ – 1-0.276 = 0.724

Da CL = 0.95 ist, wissen wir, dass \displaystyle{z}_{0.025}={1.96}
Wir sind zu 95% sicher, dass der wahre Anteil aller Statistikstudenten, die Zigaretten rauchen, zwischen 0.113 und 0.439 liegt.

Lösung B:

Drücken Sie STAT und gehen Sie auf TESTS.

Pfeilen Sie auf A:1-PropZint. Drücken Sie ENTER.

Erinnern Sie sich daran, dass die Plus-Vier-Methode von vier zusätzlichen Versuchen ausgeht: zwei Erfolge und zwei Misserfolge. Sie brauchen das Verfahren zur Berechnung des Konfidenzintervalls nicht zu ändern; aktualisieren Sie einfach die Werte von x und n, um diese zusätzlichen Versuche zu berücksichtigen.

Pfeilen Sie nach unten zu x und geben Sie acht ein.

Pfeilen Sie nach unten zu n und geben Sie 29 ein.

Pfeilen Sie nach unten zu C-Level und geben Sie 0 ein.95.

Pfeilen Sie nach unten auf Berechnen und drücken Sie ENTER.

Das Konfidenzintervall ist (0,113, 0,439).

Beispiel

Aus einer Zufallsstichprobe von 65 Studienanfängern an der State University haben 31 Studenten ein Hauptfach angegeben. Verwenden Sie die „Plus-Vier“-Methode, um ein 96%-Konfidenzintervall für den wahren Anteil der Studienanfänger an der State University zu finden, die ein Hauptfach angegeben haben.

Lösung A:

Unter Verwendung der „Plus-Vier“-Methode ergibt sich x = 31 + 2 = 33 und n = 65 + 4 = 69.

Da CL = 0,96 ist, wissen wir, dass .

z0,02 = 2,054

Wir sind zu 96 % sicher, dass zwischen 35,4 % und 60,2 % aller Studienanfänger an der State U ein Hauptfach angegeben haben.

Lösung B:

Drücken Sie STAT und pfeilen Sie zu TESTS.

Pfeil nach unten auf A:1-PropZint.

Drücken Sie ENTER.

Pfeil nach unten auf x und geben Sie 33 ein.

Pfeil nach unten auf n und geben Sie 69 ein.

Pfeil nach unten auf C-Level und geben Sie 0,96 ein.

Pfeil nach unten auf Berechnen und drücken Sie ENTER.

Das Konfidenzintervall ist (0,355, 0,602).

Beispiel

Das Berkman Center for Internet & Society in Harvard führte kürzlich eine Studie durch, in der die Gewohnheiten im Umgang mit der Privatsphäre von jugendlichen Internetnutzern analysiert wurden. In einer Gruppe von 50 Teenagern gaben 13 an, mehr als 500 Freunde auf Facebook zu haben. Verwenden Sie die „Plus-Vier“-Methode, um ein 90 %-Konfidenzintervall für den wahren Anteil der Teenager zu finden, die angeben, mehr als 500 Facebook-Freunde zu haben.

Lösung A:

Anhand der „Plus-Vier“-Methode ergibt sich x = 13 + 2 = 15 und n = 50 + 4 = 54.

Da CL = 0,90 ist, wissen wir, dass .

z0,05 = 1,645

Wir sind zu 90 % sicher, dass zwischen 17,8 % und 37,8 % aller Teenager angeben, mehr als 500 Freunde auf Facebook zu haben.

Lösung B:

Drücken Sie STAT und pfeilen Sie zu TESTS.

Pfeilen Sie nach unten zu A:1-PropZint.

Drücken Sie ENTER.

Pfeilen Sie nach unten zu x und geben Sie 15 ein.

Pfeilen Sie nach unten zu n und geben Sie 54 ein.

Pfeilen Sie nach unten zu C-Level und geben Sie 0,90 ein.

Pfeilen Sie nach unten zu Berechnen und drücken Sie ENTER.

Das Konfidenzintervall ist (0,178, 0,378).

Beispiel

Die Berkman Center Studie, auf die in Beispiel 6 Bezug genommen wird, sprach mit Jugendlichen in kleineren Fokusgruppen, befragte aber auch zusätzliche Jugendliche per Telefon. Als die Studie abgeschlossen war, hatten 588 Jugendliche die Frage nach ihren Facebook-Freunden beantwortet, wobei 159 angaben, dass sie mehr als 500 Freunde haben. Verwenden Sie die „Plus-Vier“-Methode, um ein 90 %-Konfidenzintervall für den wahren Anteil der Jugendlichen zu finden, die angeben würden, mehr als 500 Facebook-Freunde zu haben, basierend auf dieser größeren Stichprobe. Vergleichen Sie die Ergebnisse mit denen in Beispiel 6.

Lösung A:

Mit der „Plus-Vier“-Methode haben wir x = 159 + 2 = 161 und n = 588 + 4 = 592.

Da CL = 0,90 ist, wissen wir, dass zwischen 24.2 % bis 30,2 % aller Teenager angeben würden, mehr als 500 Freunde auf Facebook zu haben.

Lösung B:

Drücken Sie STAT und gehen Sie auf TESTS.

Pfeilen Sie auf A:1-PropZint. Drücken Sie ENTER.

Pfeil nach unten zu xund geben Sie 161 ein.

Pfeil nach unten zu nund geben Sie 592 ein.

Pfeil nach unten zu C-Level und geben Sie 0,90 ein.

Pfeil nach unten zu Berechnen und drücken Sie ENTER.

Das Konfidenzintervall ist (0,242, 0,302).

Schlussfolgerung

Das Konfidenzintervall für die größere Stichprobe ist schmaler als das Intervall aus Beispiel 6. Größere Stichproben ergeben immer genauere Konfidenzintervalle als kleinere Stichproben. Die „plus vier“-Methode hat eine größere Auswirkung auf die kleinere Stichprobe. Sie verschiebt die Punktschätzung von 0,26 (13/50) auf 0,278 (15/54). Sie hat eine geringere Auswirkung auf die EPB und verändert sie von 0,102 auf 0,100. In der größeren Stichprobe erfährt die Punktschätzung eine kleinere Verschiebung: von 0,270 (159/588) auf 0,272 (161/592). Es ist leicht zu erkennen, dass die Plus-Vier-Methode bei kleineren Stichproben den größten Einfluss hat.

Berechnung des Stichprobenumfangs n
Wenn Forscher eine bestimmte Fehlermarge wünschen, können sie die Fehlergrenzenformel verwenden, um den erforderlichen Stichprobenumfang zu berechnen.

Die Fehlergrenzenformel für einen Populationsanteil lautet EBP = \displaystyle({z}_{\frac{{\alpha}}{{2}}})(\sqrt{\frac{{p’q‘}}{{{n}}})

Die Lösung für n ergibt eine Gleichung für den Stichprobenumfang.

\displaystyle{n}=\frac{{{\left({z}_{\frac{{\alpha}}{{2}}}\right)}^{2}({p‘}{q‘})}}{{{EBP}^{2}}}

Example

Suppose ein Mobilfunkunternehmen möchte den aktuellen Prozentsatz der Kunden im Alter von 50+ ermitteln, die Textnachrichten auf ihrem Mobiltelefon nutzen. Wie viele Kunden im Alter von 50+ sollte das Unternehmen befragen, um mit 90%iger Sicherheit sagen zu können, dass der geschätzte (Stichproben-)Anteil innerhalb von drei Prozentpunkten des wahren Bevölkerungsanteils der Kunden im Alter von 50+ liegt, die SMS auf ihrem Mobiltelefon nutzen.

Lösung:

Aus der Problemstellung wissen wir, dass EBP = 0,03 (3%=0,03) ist und dass das Konfidenzniveau 90% beträgt.

Um n zu finden, müssen wir jedoch den geschätzten (Stichproben-)Anteil p′ kennen. Denken Sie daran, dass q′ = 1 – p′. Aber wir kennen p′ noch nicht. Da wir p′ und q′ miteinander multiplizieren, machen wir beide gleich 0,5, denn p′q′ = (0,5)(0,5) = 0,25 ergibt das größtmögliche Produkt. (Versuchen Sie andere Produkte: (0,6)(0,4) = 0,24; (0,3)(0,7) = 0,21; (0,2)(0,8) = 0,16 und so weiter). Das größtmögliche Produkt ergibt das größte n. Damit haben wir eine ausreichend große Stichprobe, so dass wir zu 90 % sicher sein können, dass wir innerhalb von drei Prozentpunkten des wahren Bevölkerungsanteils liegen. Um den Stichprobenumfang n zu berechnen, verwenden Sie die Formel und nehmen die Substitutionen vor.

Runden Sie die Antwort auf den nächsthöheren Wert. Der Stichprobenumfang sollte 752 Handy-Kunden im Alter von 50+ betragen, um mit 90-prozentiger Sicherheit sagen zu können, dass der geschätzte (Stichproben-)Anteil innerhalb von drei Prozentpunkten des wahren Bevölkerungsanteils aller Kunden im Alter von 50+ liegt, die Textnachrichten auf ihren Handys nutzen.

Versuchen Sie es

Angenommen, ein Internet-Marketing-Unternehmen möchte den aktuellen Prozentsatz der Kunden ermitteln, die auf Anzeigen auf ihren Smartphones klicken. Wie viele Kunden sollte das Unternehmen befragen, um mit 90-prozentiger Sicherheit sagen zu können, dass der geschätzte Anteil innerhalb von fünf Prozentpunkten des wahren Bevölkerungsanteils der Kunden liegt, die auf Anzeigen auf ihren Smartphones klicken?

271 Kunden sollten befragt werden.Überprüfen Sie die Immobilienabteilung in Ihrem lokalen

Jensen, Tom. „Democrats, Republicans Divided on Opinion of Music Icons.“ Public Policy Polling. Online verfügbar unter http://www.publicpolicypolling.com/Day2MusicPoll.pdf (Zugriff am 2. Juli 2013).

Madden, Mary, Amanda Lenhart, Sandra Coresi, Urs Gasser, Maeve Duggan, Aaron Smith, and Meredith Beaton. „Teens, Social Media, and Privacy.“ PewInternet, 2013. Online verfügbar unter http://www.pewinternet.org/Reports/2013/Teens-Social-Media-And-Privacy.aspx (Zugriff am 2. Juli 2013).

Prince Survey Research Associates International. „2013 Teen and Privacy Management Survey.“ Pew Research Center: Internet and American Life Project. Online verfügbar unter http://www.pewinternet.org/~/media//Files/Questionnaire/2013/Methods%20and%20Questions_Teens%20and%20Social%20Media.pdf (Zugriff am 2. Juli 2013).

Saad, Lydia. „Three in Four U.S. Workers Plan to Work Pas Retirement Age: Slightly more say they will do this by choice rather than necessity.“ Gallup® Economy, 2013. Online verfügbar unter http://www.gallup.com/poll/162758/three-four-workers-plan-work-past-retirement-age.aspx (Zugriff am 2. Juli 2013).

The Field Poll. Online verfügbar unter http://field.com/fieldpollonline/subscribers/ (Zugriff am 2. Juli 2013).

Zogby. „New SUNYIT/Zogby Analytics Poll: Few Americans Worry about Emergency Situations Occurring in Their Community; Only one in three have an Emergency Plan; 70% Support Infrastructure ‚Investment‘ for National Security.“ Zogby Analytics, 2013. Online verfügbar unter http://www.zogbyanalytics.com/news/299-americans-neither-worried-nor-prepared-in-case-of-a-disaster-sunyit-zogby-analytics-poll (Zugriff am 2. Juli 2013).

„52% Say Big-Time College Athletics Corrupt Education Process.“ Rasmussen Reports, 2013. Online verfügbar unter http://www.rasmussenreports.com/public_content/lifestyle/sports/may_2013/52_say_big_time_college_athletics_corrupt_education_process (Zugriff am 2. Juli 2013).

Konzeptübersicht

Einige statistische Maße, wie viele Umfragefragen, messen eher qualitative als quantitative Daten. In diesem Fall ist der zu schätzende Populationsparameter ein Anteil. Es ist möglich, ein Konfidenzintervall für den wahren Bevölkerungsanteil zu erstellen, indem man ähnliche Verfahren wie bei der Erstellung von Konfidenzintervallen für Bevölkerungsmittelwerte anwendet. Die Formeln unterscheiden sich geringfügig, folgen aber der gleichen Argumentation.

Lassen Sie p′ den Stichprobenanteil, x/n, darstellen, wobei x die Anzahl der Erfolge und n den Stichprobenumfang darstellt. Es sei q′ = 1 – p′. Dann ist das Konfidenzintervall für einen Populationsanteil durch die folgende Formel gegeben:

(untere Grenze, obere Grenze)

Die „plus vier“-Methode zur Berechnung von Konfidenzintervallen ist ein Versuch, den Fehler auszugleichen, der durch die Verwendung von Schätzungen des Populationsanteils bei der Berechnung der Standardabweichung der Stichprobenverteilung eingeführt wird. Stellen Sie sich einfach vier zusätzliche Versuche in der Studie vor; zwei sind Erfolge und zwei sind Misserfolge. Berechnen Sie , und fahren Sie fort, das Konfidenzintervall zu finden. Bei kleinen Stichprobengrößen liefert diese Methode nachweislich genauere Konfidenzintervalle als die Standardformel, die für größere Stichproben verwendet wird.

Formelübersicht

p′ = x / n, wobei x die Anzahl der Erfolge und n die Stichprobengröße darstellt. Die Variable p′ ist der Stichprobenanteil und dient als Punktschätzung für den wahren Bevölkerungsanteil.
q′ = 1 – p′
Die Variable p′ hat eine Binomialverteilung, die mit der hier dargestellten Normalverteilung angenähert werden kann.
EBP = \displaystyle({z}_{\frac{{\alpha}}{{2}})(\sqrt{\frac{{p’q‘}}{{{n}}})
Konfidenzintervall für einen Anteil:
(untere Grenze, obere Grenze)= (p‘ – EBP, p‘ + EBP) = (p‘ – \displaystyle({z}_{\frac{{\alpha}}{{2}})(\sqrt{\frac{{p’q‘}}{{{n}})), p’+ \displaystyle({z}_{\frac{{\alpha}}{{2}}})(\sqrt{\frac{{p’q‘}}{{n}}}))
n =\displaystyle\frac{{({z}_{\frac{{\alpha}}{{2}}}{p’q‘}}}{{{EBP}^{2}}}provides die Anzahl der Teilnehmer, die benötigt wird, um den Bevölkerungsanteil mit einer Konfidenz von 1 – α und einer Fehlermarge von EBP zu schätzen.

Verwenden Sie die Normalverteilung für einen einzelnen Bevölkerungsanteil p′ = \displaystyle\frac{{x}}{{n}}

EBP = \displaystyle({z}_{\frac{{\alpha}}{{2}}})(\sqrt{\frac{{p’q‘}}{{{n}}})(p’+q‘) = 1

Das Konfidenzintervall hat das Format (p′ – EBP, p′ + EBP).

\displaystyle\overline{x}ist eine Punktschätzung für μ

p′ ist eine Punktschätzung für ρ

s ist eine Punktschätzung für σ

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.