Introduction à la statistique

Résultats d’apprentissage

  • Calculer la taille de l’échantillon nécessaire pour estimer une moyenne de population et une proportion de population étant donné un niveau de confiance souhaité et une marge d’erreur

Pendant une année électorale, nous voyons des articles dans le journal qui énoncent des intervalles de confiance en termes de proportions ou de pourcentages. Par exemple, un sondage pour un candidat particulier qui se présente à la présidence pourrait montrer que le candidat a 40% des voix à trois points de pourcentage près (si l’échantillon est assez grand). Souvent, les sondages électoraux sont calculés avec un niveau de confiance de 95 %, ainsi, les sondeurs seraient confiants à 95 % que la véritable proportion d’électeurs favorables au candidat serait comprise entre 0,37 et 0,43 : (0,40 – 0,03,0,40 + 0,03).

Les investisseurs en bourse s’intéressent à la véritable proportion d’actions qui montent et descendent chaque semaine. Les entreprises qui vendent des ordinateurs personnels s’intéressent à la proportion de ménages aux États-Unis qui possèdent des ordinateurs personnels. Les intervalles de confiance peuvent être calculés pour la véritable proportion d’actions qui montent ou descendent chaque semaine et pour la véritable proportion de ménages aux États-Unis qui possèdent des ordinateurs personnels.

La procédure pour trouver l’intervalle de confiance, la taille de l’échantillon, la limite d’erreur et le niveau de confiance pour une proportion est similaire à celle pour la moyenne de la population, mais les formules sont différentes.

Comment savez-vous que vous avez affaire à un problème de proportion ? Tout d’abord, la distribution sous-jacente est une distribution binomiale. (Il n’est pas question de moyenne ou de moyenne.) Si X est une variable aléatoire binomiale, alors X ~ B(n, p) où n est le nombre d’essais et p la probabilité de réussite. Pour former une proportion, prenez X, la variable aléatoire pour le nombre de succès et divisez-la par n, le nombre d’essais (ou la taille de l’échantillon). La variable aléatoire P′(lire « P prime ») est cette proportion,

\displaystyle{P’}=\frac{{X}}{n}}

(Parfois la variable aléatoire est notée \displaystyle\hat{P}, lire « P chapeau ».)

Lorsque n est grand et que p n’est pas proche de zéro ou de un, on peut utiliser la distribution normale pour approcher la binomiale.

\displaystyle{X}~{N}{({n}{p},\sqrt{{{n}{p}{q}})}

Si nous divisons la variable aléatoire, la moyenne et l’écart-type par
n, nous obtenons une distribution normale des proportions avec P′, appelée proportion estimée, comme variable aléatoire. (Rappelons qu’une proportion comme le nombre de réussites divisé par n.)

\displaystyle\frac{{X}}{n}}={P’}{\sim}{N}{(\frac{{{n}{p}}{{n}},\frac{{\sqrt{{n}{p}{q}}}}}{n}})}

Utiliser l’algèbre pour simplifier :
\displaystyle\frac{\sqrt{{{n}{p}{q}}}}}{n}}=\sqrt{{\frac{{{{p}{q}}{n}}}}

P′ suit une loi normale pour les proportions :

\displaystyle\frac{X}}{n}}={P’}{\sim}{N}{(\frac{{{n}{p}}{{n}},\frac{{\sqrt{{n}{p}{q}}}}}{n}})}

L’intervalle de confiance a la forme (p′ – EBP, p′ + EBP). EBP est la borne d’erreur pour la proportion.

\displaystyle{p’}=\frac{{x}}{{n}}

p′ = la proportion estimée de succès (p′ est une estimation ponctuelle de p, la vraie proportion.)

x = le nombre de succès

n = la taille de l’échantillon

La limite d’erreur pour une proportion est EBP = \displaystyle({z}_{\frac{{\alpha}}{2}})(\sqrt{\frac{{p’q’}}{{n}}) où q’ = 1-p’.

Cette formule est similaire à la formule de la borne d’erreur pour une moyenne, sauf que  » l’écart-type approprié  » est différent. Pour une moyenne, lorsque l’écart-type de la population est connu, l’écart-type approprié que nous utilisons est \displaystyle\frac{{\sigma}}{{\sqrt{n}}. Pour une proportion, l’écart type approprié est \displaystyle\sqrt{\frac{{{pq}}{{n}}}. Cependant, dans la formule de la limite d’erreur, nous utilisons \displaystyle\sqrt{\frac{{p’q’}}{n}} comme écart type, au lieu de \displaystyle\sqrt{\frac{{pq}}{n}}.

Dans la formule de la limite d’erreur, les proportions d’échantillon p′ et q′ sont des estimations des proportions de population inconnues p et q. Les proportions estiméesp′ et q′ sont utilisées parce que p et q ne sont pas connues. Les proportions d’échantillon p′ et q′ sont calculées à partir des données : p′ est la proportion estimée de réussites, et q′ est la proportion estimée d’échecs.

L’intervalle de confiance ne peut être utilisé que si le nombre de réussites np′ et le nombre d’échecs nq′ sont tous deux supérieurs à cinq.

Note

Pour la distribution normale des proportions, la formule du score z est la suivante . Si \displaystyle{P’}{\sim}{N}(p, \displaystyle\sqrt{\frac{{pq}}{{n}}), alors la formule du score z est z = \displaystyle\frac{{p’-p}}{\sqrt{pqn}}}

Exemple

Supposons qu’une société d’études de marché soit engagée pour estimer le pourcentage d’adultes vivant dans une grande ville et possédant un téléphone portable. Cinq cents adultes résidents de cette ville, choisis au hasard, sont interrogés pour déterminer s’ils ont un téléphone cellulaire. Sur les 500 personnes interrogées, 421 ont répondu par l’affirmative – elles possèdent un téléphone portable. En utilisant un niveau de confiance de 95 %, calculez une estimation de l’intervalle de confiance pour la véritable proportion de résidents adultes de cette ville qui possèdent des téléphones cellulaires.

  • La première solution est pas à pas (Solution A).
  • La seconde solution utilise une fonction des calculatrices TI-83, 83+ ou 84 (Solution B).

Solution A:

Laissez X = le nombre de personnes de l’échantillon qui possèdent des téléphones cellulaires. X est binomial.

X ~ B(500, \displaystyle\frac{{421}}{500}})

Pour calculer l’intervalle de confiance, vous devez trouver p′, q′, etEBP.

n = 500

x = le nombre de réussites = 421

p’= \displaystyle\frac{{x}}{{n}} =\frac{{421}}{500}} = 0,842

p′ = 0.842 est la proportion de l’échantillon ; c’est l’estimation ponctuelle de la proportion de la population.

q′ = 1 – p′ = 1 – 0,842 = 0,158

Puisque CL = 0,95, alors α = 1 – CL = 1 – 0.95 = 0,05 (α) = 0,025.

Alors \displaystyle{z}_{\frac{{\alpha}}{{2}}={z}_{0,025} = 1,96

Utilisez la commande invNorm(0,975,0,1) de la calculatrice TI-83, 83+ ou 84+ pour trouver z0,025. Rappelez-vous que l’aire à droite de z0,025 est 0,025 et que l’aire à gauche de z0,025 est 0,975. On peut également trouver cette valeur en utilisant les commandes appropriées sur d’autres calculatrices, en utilisant un ordinateur ou en utilisant une table de probabilité normale standard.

EBP = \displaystyle({z}_{\frac}{{alpha}}{2}})(\sqrt{\frac{{p’q’}}{{n}}) = (1.96)\displaystyle\sqrt{\frac{{(0.842)(0.158)}}{{500}}} = 0.032

p‘−EBP=0.842−0.032=0.81

p′+EBP=0.842+0.032=0.874

L’intervalle de confiance de la proportion binomiale vraie de la population est ( p′ – EBP, p′ + EBP) = (0,810, 0,874).

Interprétation

Nous estimons avec un niveau de confiance de 95 % qu’entre 81 % et 87,4 % de tous les résidents adultes de cette ville ont des téléphones portables.

Explication du niveau de confiance de 95 %

Nonante-cinq pour cent des intervalles de confiance construits de cette façon contiendraient la vraie valeur de la proportion de population de tous les résidents adultes de cette ville qui ont des téléphones portables.

Solution B:

Appuyez sur STAT et faites une flèche versTESTS.

Fléchissez vers le bas jusqu’à A:1-PropZint. Appuyez sur ENTER.Flèche vers le bas jusqu’à et entre 421.Flèche vers le bas jusqu’à et entre 500.Flèche vers le bas jusqu’à C-Level et entre .95.Flèche vers le bas jusqu’à Calculate et appuie sur ENTER.L’intervalle de confiance est (0,81003, 0,87397).

essayer

Supposons que 250 personnes choisies au hasard soient interrogées pour déterminer si elles possèdent une tablette. Sur les 250 personnes interrogées, 98 ont déclaré posséder une tablette. En utilisant un niveau de confiance de 95 %, calculez une estimation de l’intervalle de confiance pour la véritable proportion de personnes qui possèdent une tablette.

(0,3315, 0,4525)

Exemple

Pour un projet de classe, un étudiant en sciences politiques d’une grande université veut estimer le pourcentage d’étudiants qui sont inscrits sur les listes électorales. Il interroge 500 étudiants et constate que 300 sont inscrits sur les listes électorales. Calculez un intervalle de confiance à 90 % pour le véritable pourcentage d’étudiants inscrits sur les listes électorales, et interprétez l’intervalle de confiance.

  • La première solution se fait étape par étape (solution A).
  • La deuxième solution utilise une fonction des calculatrices TI-83, 83+ ou 84 (solution B).

Solution A:

x = 300 et n = 500

p’ =\displaystyle\frac{{x}}{n}} = \frac{{300}}{500}} = 0,600
Puisque CL = 0,90, alors α = 1 – CL = 1 – 0,90 = 0.10

\displaystyle\frac{{\alpha}}{2}} = 0,05
\displaystyle{z}_{\frac{{\alpha}{2}} = \displaystyle{z}_{0,05} = 1,645

Utilisez la commande invNorm(0,95,0,1) de la calculatrice TI-83, 83+ ou 84+ pour trouver z0,05. Rappelez-vous que l’aire à droite de z0,05 est 0,05 et que l’aire à gauche de z0,05 est 0,95. Cela peut également être trouvé en utilisant les commandes appropriées sur d’autres calculatrices, en utilisant un ordinateur ou en utilisant une table de probabilité normale standard.

EBP = \displaystyle({z}_{\frac{\alpha}}{2}})(\sqrt{\frac{{p’q’}}{n}}) = (1,645)\displaystyle\sqrt{\frac{{(0,6)(0,4)}{{500}}} = 0.036

L’intervalle de confiance pour la vraie proportion binomiale de la population est (p′ – EBP, p′ + EBP) = (0,564,0,636).

Interprétation

  • Nous estimons avec 90 % de confiance que le vrai pourcentage de tous les étudiants qui sont inscrits sur les listes électorales se situe entre 56,4 % et 63,6 %.
  • Alternative de formulation : Nous estimons avec 90 % de confiance qu’entre 56,4 % et 63,6 % de TOUS les étudiants sont inscrits sur les listes électorales.

Explication du niveau de confiance de 90 %

Nonante pour cent de tous les intervalles de confiance construits de cette façon contiennent la vraie valeur du pourcentage de la population des étudiants qui sont inscrits sur les listes électorales.

Solution B:

Appuyez sur STAT et faites une flèche versTESTS.

Fléchissez vers le bas jusqu’à A:1-PropZint.

Appuyez sur ENTER.

Fléchissez jusqu’à et entrez 300.

Fléchissez jusqu’à et entrez 500.

Défilez jusqu’à C-Level et entrez 0,90.

Défilez jusqu’à Calculate et appuyez sur ENTER.

L’intervalle de confiance est de (0,564, 0,636).

Exemple

Un étudiant sonde son école pour savoir si les élèves du district scolaire sont pour ou contre la nouvelle législation concernant les uniformes scolaires. Elle sonde 600 élèves et constate que 480 sont contre la nouvelle législation.

  1. Calculez un intervalle de confiance de 90 % pour le véritable pourcentage d’élèves qui sont contre la nouvelle législation, et interprétez l’intervalle de confiance.
  2. Dans un échantillon de 300 élèves, 68 % ont déclaré posséder un iPod et un téléphone intelligent. Calculez un intervalle de confiance à 97 % pour le vrai pourcentage d’élèves qui possèdent un iPod et un téléphone intelligent.

Solution

  1. (0,7731, 0,8269) ; Nous estimons avec un niveau de confiance de 90 % que le vrai pourcentage de tous les élèves du district qui sont contre la nouvelle législation est compris entre 77,31 % et 82,69 %.
  2. La première solution est pas à pas (solution A). La deuxième solution utilise une fonction des calculatrices TI-83, 83+ ou 84 (Solution B)

Solution A

  • Sixante-huit pour cent (68 %) des élèves possèdent un iPod et un téléphone intelligent. p′=0,68, q′=1′=1-0,68=0,32
  • Puisque CL = 0,97, on sait que α=1-0,97=0,03
  • L’aire à gauche de z0.015 est 0,015, et l’aire à droite de z0,015 est 1 – 0,015 = 0,985.
  • En utilisant la fonction InvNorm(,985,0,1) de la calculatrice TI 83, 83+ ou 84+, z0.015 = 2,17

EBP = \displaystyle({z}_{\frac{{\alpha}}{2}})(\sqrt{\frac{{p’q’}}{{n}}) = (1,645)\displaystyle\sqrt{\frac{(0,68)(0,32)}}{{300}} = 0.0269

  • Nous sommes sûrs à 97 % que la proportion réelle de tous les étudiants qui possèdent un iPod et un téléphone intelligent est comprise entre 0,6531 et 0,7069.

Solution B

  1. Appuyez sur STAT et faites une flèche vers TESTS.
  2. Flèche vers le bas sur A:1-PropZint.
  3. Presse ENTER.
  4. Flèche vers le bas sur x et entre 300*0,68.
  5. Flèche vers le bas sur n et entre 300.
  6. Flèche vers le bas sur Niveau C et entrez 0,97.
  7. Flèche vers le bas sur Calculer et appuyez sur ENTRÉE.
  8. L’intervalle de confiance est (0,6531, 0,7069).

Intervalle de confiance  » plus quatre  » pour p

Il y a une certaine quantité d’erreur introduite dans le processus de calcul d’un intervalle de confiance pour une proportion. Comme nous ne connaissons pas la véritable proportion de la population, nous sommes obligés d’utiliser des estimations ponctuelles pour calculer l’écart type approprié de la distribution d’échantillonnage. Des études ont montré que l’estimation de l’écart-type qui en résulte peut être erronée.

Heureusement, il existe un ajustement simple qui nous permet de produire des intervalles de confiance plus précis. Nous prétendons simplement que nous avons quatre observations supplémentaires. Deux de ces observations sont des réussites et deux sont des échecs. La nouvelle taille de l’échantillon est donc n + 4, et le nouveau nombre de succès est x + 2.

Des études informatiques ont démontré l’efficacité de cette méthode. Elle doit être utilisée lorsque le niveau de confiance souhaité est d’au moins 90 % et que la taille de l’échantillon est d’au moins dix.

Exemple

On a demandé à un échantillon aléatoire de 25 étudiants en statistiques : « Avez-vous fumé une cigarette au cours de la semaine passée ? ». Six étudiants ont déclaré avoir fumé au cours de la semaine écoulée. Utilisez la méthode du  » plus quatre  » pour trouver un intervalle de confiance de 95 % pour la véritable proportion d’étudiants en statistiques qui fument.

Solution A:

Six étudiants sur 25 ont déclaré avoir fumé au cours de la dernière semaine, donc x = 6 et n = 25. Comme nous utilisons la méthode du  » plus quatre « , nous utiliserons x = 6 + 2 = 8 et n = 25 + 4 = 29.

p’ = \displaystyle\frac{{x}}{{n}} =\frac{{8}}{{29}} = 0.276

q’ = 1-p’ – 1-0.276 = 0.724

Puisque CL = 0.95, nous savons que \displaystyle{z}_{0.025}={1,96}
Nous sommes sûrs à 95 % que la véritable proportion de tous les étudiants en statistiques qui fument des cigarettes est comprise entre 0,113 et 0,439.

Solution B:

Appuyer sur STAT et se placer sur TESTS.

Se placer sur A:1-PropZint. Appuyez sur ENTRÉE.

Rappellez-vous que la méthode plus quatre suppose quatre essais supplémentaires : deux succès et deux échecs. Vous n’avez pas besoin de modifier le processus de calcul de l’intervalle de confiance ; mettez simplement à jour les valeurs de x et de n pour refléter ces essais supplémentaires.

Flèche vers le bas sur x et entrez huit.

Flèche vers le bas sur n et entrez 29.

Flèche vers le bas sur C-Level et entrez 0.95.

Flèche vers le bas sur Calculer et appuyez sur ENTRÉE.

L’intervalle de confiance est (0,113, 0,439).

Exemple

Sur un échantillon aléatoire de 65 étudiants de première année à l’Université d’État, 31 étudiants ont déclaré une majeure. Utilisez la méthode du  » plus quatre  » pour trouver un intervalle de confiance de 96 % pour la véritable proportion d’étudiants de première année à l’Université d’État qui ont déclaré une majeure.

Solution A:

En utilisant le  » plus quatre « , nous avons x = 31 + 2 = 33 et n = 65 + 4 = 69.

Puisque CL = 0,96, nous savons .

z0,02 = 2,054

Nous sommes sûrs à 96% qu’entre 35,4% et 60,2% de tous les étudiants de première année de State U ont déclaré une majeure.

Solution B:

Appuyez sur STAT et faites une flèche vers TESTS.

Fléchissez jusqu’à A:1-PropZint.

Appuyez sur ENTRÉE.

Fléchissez jusqu’à x et entrez 33.

Fléchissez jusqu’à n et entrez 69.

Fléchissez jusqu’à C-Level et entrez 0,96.

Fléchissez jusqu’à Calculer et appuyez sur ENTRÉE.

L’intervalle de confiance est (0,355, 0,602).

Exemple

Le Berkman Center for Internet & Society de Harvard a récemment mené une étude analysant les habitudes de gestion de la vie privée des internautes adolescents. Dans un groupe de 50 adolescents, 13 ont déclaré avoir plus de 500 amis sur Facebook. Utilisez la méthode du  » plus quatre  » pour trouver un intervalle de confiance à 90 % pour la véritable proportion d’adolescents qui déclareraient avoir plus de 500 amis sur Facebook.

Solution A:

En utilisant le  » plus quatre « , nous avons x = 13 + 2 = 15 et n = 50 + 4 = 54.

Puisque CL = 0,90, nous savons .

z0,05 = 1,645

Nous sommes sûrs à 90 % qu’entre 17,8 % et 37,8 % de tous les adolescents déclareraient avoir plus de 500 amis sur Facebook.

Solution B:

Appuyer sur STAT et se placer sur TESTS.

Fléchissez jusqu’à A:1-PropZint.

Appuyez sur ENTRÉE.

Fléchissez jusqu’à x et entrez 15.

Fléchissez jusqu’à n et entrez 54.

Fléchissez jusqu’à C-Level et entrez 0,90.

Fléchissez jusqu’à Calculer et appuyez sur ENTRÉE.

L’intervalle de confiance est de (0,178, 0,378).

Exemple

L’étude du Berkman Center référencée dans l’exemple 6 a parlé aux adolescents dans des groupes de discussion plus petits, mais a également interrogé des adolescents supplémentaires par téléphone. À la fin de l’étude, 588 adolescents avaient répondu à la question sur leurs amis Facebook, 159 d’entre eux ayant déclaré avoir plus de 500 amis. Utilisez la méthode « plus quatre » pour trouver un intervalle de confiance à 90 % pour la proportion réelle d’adolescents qui déclarent avoir plus de 500 amis sur Facebook, sur la base de cet échantillon plus large. Comparez les résultats à ceux de l’exemple 6.

Solution A :

En utilisant la méthode  » plus quatre « , nous avons x = 159 + 2 = 161 et n = 588 + 4 = 592.

Puisque CL = 0,90, nous savons .

Nous sommes sûrs à 90 % qu’entre 24.2 % et 30,2 % de tous les adolescents déclareraient avoir plus de 500 amis sur Facebook.

Solution B:

Appuyer sur STAT et se placer sur TESTS.

Se placer sur A:1-PropZint. Appuyez sur ENTRÉE.

Fléchissez vers le bas sur xet entrez 161.

Fléchissez vers le bas sur net entrez 592.

Fléchissez vers le bas sur Niveau C et entrez 0,90.

Fléchissez vers le bas sur Calculer et appuyez sur ENTRÉE.

L’intervalle de confiance est (0,242, 0,302).

Conclusion

L’intervalle de confiance pour l’échantillon plus grand est plus étroit que l’intervalle de l’exemple 6. Les échantillons plus grands donneront toujours des intervalles de confiance plus précis que les échantillons plus petits. La méthode  » plus quatre  » a un impact plus important sur le plus petit échantillon. Elle fait passer l’estimation ponctuelle de 0,26 (13/50) à 0,278 (15/54). Elle a un impact plus faible sur le PEB, le faisant passer de 0,102 à 0,100. Dans l’échantillon plus large, l’estimation ponctuelle subit un changement plus faible : de 0,270 (159/588) à 0,272 (161/592). Il est facile de voir que la méthode plus quatre a le plus grand impact sur les petits échantillons.

Calcul de la taille de l’échantillon n
Si les chercheurs souhaitent une marge d’erreur spécifique, ils peuvent alors utiliser la formule de la limite d’erreur pour calculer la taille de l’échantillon requise.

La formule de la limite d’erreur pour une proportion de population est EBP = \displaystyle({z}_{\frac{{\alpha}}{2}})(\sqrt{\frac{{p’q’}}{{n}})

En résolvant n, on obtient une équation pour la taille de l’échantillon.

\displaystyle{n}=\frac{{{\left({z}_{\frac{{\alpha}}{{2}}}\right)}^{2}({p’}{q’})}}{{{EBP}^{2}}}

Example

Suppose une société de téléphonie mobile souhaite déterminer le pourcentage actuel de clients âgés de 50 ans et plus qui utilisent la messagerie texte sur leur téléphone portable. Combien de clients âgés de 50 ans et plus l’entreprise devrait-elle interroger pour être sûre à 90 % que la proportion (d’échantillon) estimée se situe à moins de trois points de pourcentage de la véritable proportion de population de clients âgés de 50 ans et plus qui utilisent des messages texte sur leur téléphone cellulaire.

Solution:

D’après le problème, nous savons que EBP = 0,03 (3 %=0,03) et parce que le niveau de confiance est de 90 %.

Cependant, pour trouver n, nous devons connaître la proportion (d’échantillon) estimée p′. Rappelez-vous que q′ = 1 – p′. Mais, nous ne connaissons pas encore p′. Puisque nous multiplions p′ et q′ ensemble, nous les rendons tous deux égaux à 0,5 car p′q′ = (0,5)(0,5) = 0,25 donne le plus grand produit possible. (Essayez d’autres produits : (0,6)(0,4) = 0,24 ; (0,3)(0,7) = 0,21 ; (0,2)(0,8) = 0,16 et ainsi de suite). Le produit le plus grand possible nous donne le plus grand n. Cela nous donne un échantillon suffisamment grand pour que nous puissions être sûrs à 90 % que nous sommes à moins de trois points de pourcentage de la véritable proportion de la population. Pour calculer la taille de l’échantillon n, utilisez la formule et effectuez les substitutions.

Enroulez la réponse à la valeur supérieure suivante. La taille de l’échantillon doit être de 752 clients de téléphones cellulaires âgés de 50 ans et plus afin d’être sûr à 90 % que la proportion (d’échantillon) estimée se situe à moins de trois points de pourcentage de la véritable proportion de population de tous les clients âgés de 50 ans et plus qui utilisent la messagerie texte sur leurs téléphones cellulaires.

essayer

Supposons qu’une société de marketing Internet souhaite déterminer le pourcentage actuel de clients qui cliquent sur les publicités sur leurs smartphones. Combien de clients l’entreprise doit-elle interroger pour être sûre à 90 % que la proportion estimée se situe dans une fourchette de cinq points de pourcentage de la véritable proportion de la population des clients qui cliquent sur les publicités sur leurs smartphones ?

271 clients doivent être interrogés.Consultez la section Immobilier de votre journal local

Jensen, Tom. « Démocrates, républicains divisés sur l’opinion des icônes de la musique ». Public Policy Polling. Disponible en ligne à l’adresse http://www.publicpolicypolling.com/Day2MusicPoll.pdf (consulté le 2 juillet 2013).

Madden, Mary, Amanda Lenhart, Sandra Coresi, Urs Gasser, Maeve Duggan, Aaron Smith et Meredith Beaton. « Les adolescents, les médias sociaux et la vie privée ». PewInternet, 2013. Disponible en ligne à l’adresse http://www.pewinternet.org/Reports/2013/Teens-Social-Media-And-Privacy.aspx (consulté le 2 juillet 2013).

Prince Survey Research Associates International.  » Enquête 2013 sur les adolescents et la gestion de la vie privée « . Pew Research Center : Internet and American Life Project. Disponible en ligne à l’adresse http://www.pewinternet.org/~/media//Files/Questionnaire/2013/Methods%20and%20Questions_Teens%20and%20Social%20Media.pdf (consulté le 2 juillet 2013).

Saad, Lydia. « Trois travailleurs américains sur quatre prévoient de travailler jusqu’à l’âge de la retraite : ils sont légèrement plus nombreux à dire qu’ils le feront par choix plutôt que par nécessité. » Gallup® Économie, 2013. Disponible en ligne à l’adresse http://www.gallup.com/poll/162758/three-four-workers-plan-work-past-retirement-age.aspx (consulté le 2 juillet 2013).

Le sondage Field. Disponible en ligne à l’adresse http://field.com/fieldpollonline/subscribers/ (consulté le 2 juillet 2013).

Zogby. « Nouveau sondage SUNYIT/Zogby Analytics : Peu d’Américains s’inquiètent des situations d’urgence qui se produisent dans leur communauté ; Seul un sur trois a un plan d’urgence ; 70 % soutiennent l »investissement’ dans les infrastructures pour la sécurité nationale. » Zogby Analytics, 2013. Disponible en ligne à l’adresse http://www.zogbyanalytics.com/news/299-americans-neither-worried-nor-prepared-in-case-of-a-disaster-sunyit-zogby-analytics-poll (consulté le 2 juillet 2013).

« 52% disent que le sport universitaire à grande échelle corrompt le processus éducatif. » Rapports Rasmussen, 2013. Disponible en ligne à l’adresse http://www.rasmussenreports.com/public_content/lifestyle/sports/may_2013/52_say_big_time_college_athletics_corrupt_education_process (consulté le 2 juillet 2013).

Revue des concepts

Certaines mesures statistiques, comme de nombreuses questions de sondage, mesurent des données qualitatives plutôt que quantitatives. Dans ce cas, le paramètre de population estimé est une proportion. Il est possible de créer un intervalle de confiance pour la véritable proportion de la population en suivant des procédures similaires à celles utilisées pour créer des intervalles de confiance pour les moyennes de population. Les formules sont légèrement différentes, mais elles suivent le même raisonnement.

Laissez p′ représenter la proportion de l’échantillon, x/n, où x représente le nombre de réussites et n la taille de l’échantillon. Soit q′ = 1 – p′. Alors l’intervalle de confiance pour une proportion de la population est donné par la formule suivante :

(limite inférieure, limite supérieure)

La méthode « plus quatre » pour calculer les intervalles de confiance est une tentative d’équilibrer l’erreur introduite par l’utilisation d’estimations de la proportion de la population lors du calcul de l’écart-type de la distribution d’échantillonnage. Imaginez simplement quatre essais supplémentaires dans l’étude ; deux sont des succès et deux des échecs. Calculez , puis trouvez l’intervalle de confiance. Lorsque les tailles d’échantillon sont petites, il a été démontré que cette méthode fournit des intervalles de confiance plus précis que la formule standard utilisée pour les échantillons plus grands.

Revue des formules

p′ = x / n où x représente le nombre de réussites et n la taille de l’échantillon. La variable p′ est la proportion de l’échantillon et sert d’estimation ponctuelle de la véritable proportion de la population.
q′ = 1 – p′
La variable p′ a une distribution binomiale qui peut être approximée par la distribution normale présentée ici.
EBP = \displaystyle({z}_{\frac{\alpha}}{2}})(\sqrt{\frac{{p’q’}}{{n}}})
Intervalle de confiance pour une proportion :
(limite inférieure, limite supérieure)= (p’ – EBP, p’ + EBP) = (p’ – \displaystyle({z}_{{\frac}}{2}})(\sqrt{\frac{{p’q’}}{n}}), p’+ \displaystyle({z}_{\frac{{\alpha}}{{2}}})(\sqrt{\frac{{p’q’}}{{n}}}))
n =\displaystyle\frac{{({z}_{\frac{{\alpha}}{{2}}}{p’q’}}}{{{EBP}^{2}}}provides le nombre de participants nécessaires pour estimer la proportion de la population avec une confiance de 1 – α et une marge d’erreur EBP.

Utiliser la distribution normale pour une seule proportion de la population p′ = \displaystyle\frac{{x}}{{n}}

EBP =. \displaystyle({z}_{\frac{{\alpha}}{2}})(\sqrt{\frac{{p’q’}}{{n}})(p’+q’) = 1

L’intervalle de confiance a le format (p′ – EBP, p′ + EBP).

\displaystyle\overline{x}est une estimation ponctuelle de μ

p′ est une estimation ponctuelle de ρ

s est une estimation ponctuelle de σ

.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *