Anda di halaman 1dari 32

' $

UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Mat2080 UQM

Chapitre 8: Dtermination de la taille de lchantillon

& %
H. Younes Page 1 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Introduction...

Dans les problmes quon a rsolus jusqu maintenant, la taille de


lchantillon est donne.

Si on interroge toute la population on na plus besoin de linfrence


statistique.

En pratique, on ralise que plus la taille de lchantillon est grande, plus la


prcision augmente.

Quelle taille dchantillon faut il choisir pour obtenir un certain degr de


prcision? Cest une question fondamentale pour le statisticien.

Un exemple: Combien de personnes un politicoloque devra-t-il interroger


sil veut estimer la proportion de celles qui voteront pour le condidat x,
avec une prcision de 1% et un degr de confiance de 95%?

& %
H. Younes Page 2 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Plan de lexpos

Dtermination de la taille de lchantillon.

Le cas dune moyenne ou dun total


Estimation des paramtres inconnus
Le cas dune proportion ou dun effectif

& %
H. Younes Page 3 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Le problme...

On prlve un chantillon pour estimer un paramtre.


chantillon est trop petit Lintervalle de confiance trop
large pour tre utile. Ne permet pas de tirer la conclusion
voulue avec le degr de confiance voulu.
chantillon trop grand Lintervalle de confiance est
inutilement court. Bon chantillon, mais plus coteux que
ncessaire.
La bonne formulation: dterminer la taille minimale de
lchantillon qui fournit la prcision voulue

& %
H. Younes Page 4 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Le cas de la moyenne ou du total

Question simpliste: Est-ce quun chantillon de taille 500


suffit pour une population de 10 000 ?
Oui ou non?
Fournir une estimation aussi prcise que possible de la
moyenne
La prcision augmente avec n
La meilleure prcision possible population entire.
Quelle est la taille de lchantillon assurant une prcision
fixe ?

& %
H. Younes Page 5 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Prcision en termes
dune marge derreur

On veut contrler la largeur de lintervalle de confiance :

[
y 2 y , y + 2 y]

La demi-longueur
2 y
est dite marge derreur 95%
Exiger la marge derreur soit gale une certaine valeur E.

& %
H. Younes Page 6 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Valeur de n pour une marge
derreur gale E

Marge derreur donn:


Exig: 2 y = E
Puisque
r
n S
y = 1 ,
N n
Dterminer la valeur de n telle que:
r
n S
2 1 = E.
N n

& %
H. Younes Page 7 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


n
Sans le facteur de correction 1
N

Ngligeable dans la plupart des situations relles


Lquation rsoudre devient
2S
=E
n
ce qui donne la solution provisoire
 2
2S
n0 = .
E
N.B.: Valable si N est assez grand

& %
H. Younes Page 8 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Avec facteur de correction

Si le facteur de correction est important (si n0 est grand


compar N ), un simple ajustement est ncessaire:
r r
n S n S
2 1 =E 2 1 = n
N n r N E
n
1 n0 = n
 N
n
1 n0 = n
N
Rsultat final :
n0
n=
1 + nN0

& %
H. Younes Page 9 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Exemple 1...

Un chantillon alatoire simple de 225 comptes passs dus a t


choisi parmi les 3 000 comptes percevoir dune entreprise. Cet
chantillon donne

y = 185, 35$ et s = 30$.

Utilisant linformation de cet chantillon, quelle taille dchantillon


aurait-il fallu prendre pour avoir une moyenne chantillonnale
ayant une marge derreur denviron 3$.

& %
H. Younes Page 10 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Solution
 2
2S
n0 =
E
estim par:
 s 2
n0 = 2
E
 2
2 30
=
3
= 400.

On ajuste la valeur de n0 en prenant:


n0
n =
1 + nN0
400
=
1 + 3400
000
= 353
& %
H. Younes Page 11 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Exemple 2...

Taille dun chantillon pour un cart-type de lestimateur de


moyenne, y, donn:
But: Estimer la moyenne des salaires de 1991.
Population : N = 171 professeurs
chantillon : n = 50 professeurs.
Soit
Y = salaire de lchantillon de 1990
Moyenne et lcart type
y = 397, 92 et s = 69, 05.
Quelle doit tre la taille de lchantillon si on veut que lcart
type de lestimateur y soit de 500$ (cest--dire, y = 5)?
& %
H. Younes Page 12 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Solution
un y de 5 veut dire une marge derreur 95% de 10.
Supposer que lcart type S restera peu prs constant.
Estimer S par s = 69, 05.
Premire approximation :
 2
2s 4 69, 052
n0 = = = 190, 7161.
10 100

Ajustement:
n0 190, 7161
n= = 190,7161 = 90.
1 + nN0 1 + 171

Prendre n = 90 professeurs pour avoir y = 5.

& %
H. Younes Page 13 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Solution plus raliste
Supposer que lcart type S augmentra de 5% (si nous croyons
que les salaires augmenterons de 5%).
Estimer S par s = 69, 05 1, 05 = 72, 05.
Premire approximation:
 2
2s 4 72, 052
n0 = = = 210, 2645.
10 100

Ajustement:
n0 210, 2645
n= = 210,2645 = 94, 3052.
1 + nN0 1 + 171

Prendre n = 94 professeurs pour avoir y = 5.


(Il vaut peut-tre mieux prendre n = 95).

& %
H. Younes Page 14 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Valeur de n pour une marge
derreur relative gale R

Il arrive souvent quon veuille imposer une limite R la marge


derreur relative, soit 2 y/, et quon exige alors que
2 y
= R.

Cette exigence est quivalente

2 y = R,

& %
H. Younes Page 15 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Suite...

et il vient donc
 2
2S
n0 =
R
 2
2 Cy
=
R
o Cy = / est le coefficient de variation de la variable y.

& %
H. Younes Page 16 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Exemple

But: Estimer la moyenne des salaires de 1991.


Population : N = 171 professeurs
chantillon : n = 50 professeurs.
Soit
Y = salaire de lchantillon de 1990
Moyenne et lcart type
y = 397, 92 et s = 69, 05.
Quelle doit tre la taille de lchantillon si on veut que la marge
derreur 95%, par rapport , soit de 5%?

& %
H. Younes Page 17 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Solution

Supposer que lcart type S restera peu prs constant.


Estimer S par s = 69, 05
Estimer le coefficient de variation de la population par
69, 05
Cy = = 0, 1735
397, 92

Premire approximation, donc, nous avons


 2
2 0, 1735
n0 = = 48.1636
0, 05

Ajustement:
48.1636
n= 48.1636 38
1 + 171
& %
H. Younes Page 18 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Remarque...

Contrairement ce quon a tendance croire, la taille de la


population joue un rle relativement mineur dans la dtermination
de la taille de lchantillon, moins quelle ne soit trs petite. Le
tableau ci-dessous reprend le problme prsent lexemple
prcdent: quelle est la taille ncessaire pour que la marge derreur
relative 95% dans lestimation de la moyenne soit de 5%. On
prsente la rponse en fonction de la taille de la population.
N 100 200 500 1000 1500 2500 3000
n 33 39 44 46 47 48 48 48

On constate que ds que la population atteint 3000, sa taille na


plus deffet sur la taille dchantillon ncessaire.

& %
H. Younes Page 19 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Un exemple...

Dans la soute bagages dun avion sur le point de dcoller, il y a


200 valises. Lagent de bord veut en estimer le poids total en
pesant n valises choisies au hasard.
a) Si on suppose que lcart-type du poids des valise est S = 5
(kg), quelle doit tre la taille de lchantillon qui permettra
destimer 500 kilotgrammes prs (et 95% de confiance)?

& %
H. Younes Page 20 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Solution
500 kg
Estimer 500 kg prs revient estimer N = 2.5 kg
prs. Donc: E = 2.5
 2  2
2S 25
n0 = = = 16
E 2.5
N n0 200 16
n = = = 14.8148 15
N + n0 216

& %
H. Younes Page 21 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


b) Si on suppose que le coefficient de variation du poids des valises
est Cy = 0, 3, quelle doit tre la taille de lchantillon qui
permettra destimer 10% prs (et 95% de confiance)?

Solution
R = 10% = 0.1
 2  2
2 Cy 2 0.3
n0 = = = 36
R 0.1
N n0 200 36
n = = = 30.508 31
N + n0 236

& %
H. Younes Page 22 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Cas dune proportion ou dun effecttif

Dterminer la taille de lchantillon ncessaire pour que la


marge derreur 95% de lestimateur dune proportion p,
2 pb, soit gal un nombre donn E:
Exig: 2 p = E
Dterminer la valeur de n pour laquelle
r r
p(1 p) N n
2 = E.
n N 1
On nglige provisoirement le facteur de correction:
r
p(1 p)
2 = E.
n

& %
H. Younes Page 23 de 31
' $
UQM Mat2080 - Chapitre 8

Ce qui donne la solution provisoire

Mat 2080 par Hassan Younes


4 p(1 p)
n0 =
E2
Valable si N est assez grand
Si le facteur de correction est important (si n0 est grand
compar N ), un simple ajustement est ncessaire:
n0 n0
n=
1 + n0N1 1 + nN0

On ne connait pas p, on veut lestimer. Le pire des cas est


quand p = 12 . Un simple calcul montre que
1
n0 = 2
E

& %
H. Younes Page 24 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Exemple 1...

Le responsable de marketing dans une compagnie de boissons


gazeuses veut estimer la proportion p de consommateurs qui
prfre un nouveau produit destin remplacer lancien.
Quelle est la taille de lchantillon quil doit prlever sil faut
que lcart type de son estimateur ne soit pas suprieur 0,02?

& %
H. Younes Page 25 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Solution

E = 2 pb = 0, 04
1 1
La valeur de n0 est n0 = E2 = 0,042 645
Ajustement non ncessaire, puisque la population est, toutes
fins pratiques, infinie.

& %
H. Younes Page 26 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Ne pas tre trop conservateur

Lorsque p 6= 1/2, le calcul de la taille nccessaire donne une


valeur de n0 plus grande que ncessaire.
p 0,01 0,05 0,1 0,2 0,3 0,4 0,5
n0 25 119 225 400 525 600 625
On a souvent une ide de la valeur de p.

& %
H. Younes Page 27 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Exemple 2...

On veut estimer le pourcentage dlecteurs qui voterons NPD.


Avec un peu dexprience, on sait que ce pourcentage est
infrieur , disons, 30%.
Dans ce cas, on sait que p(1 p) < 0, 30 0, 70) = 0, 21.

& %
H. Younes Page 28 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Exemple 3...

Vous voulez estimer le pourcentage de pices dfectueuses dans


un lot, avec un marge derreur de 0,04.
Vous savez que normalement, le taux de dfectuosit est de
lordre de 5%, et vous pensez quil est encore de cet ordre l. Il
est possible quil ait augment quelque peu, mais vous tes sr
quil nest pas suprieur 10%.
Quelle est la taille de lchantillon que vous devriez tirer?

& %
H. Younes Page 29 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Solution

Nous avons
4 p (1 p)
n0 =
0, 042
Le numrateur prend au maximum la valeur

4 0, 1 0, 9 = 0, 36

on a
0, 36
n0 = 225
0, 0016
Remarque: si on prend p = 1/2, alors n0 = 625, beaucoup plus
lev que ncessaire.

& %
H. Younes Page 30 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Valeur de n pour une marge
derreur relative gale R

Dterminer la taille de lchantillon ncessaire pour que la marge


derreur relative 95% de lestimateur dune proportion p, soit gal
un nombre donn R:
2 p
Exig: =R,
p
soit alors: E = 2 p = p R , et dans la formule prcdente de
n0 , nous aurons:

& %
H. Younes Page 31 de 31
' $
UQM Mat2080 - Chapitre 8

Mat 2080 par Hassan Younes


Suite...

Au cours! et rdiger prochainement!

& %
H. Younes Page 32 de 31