Anda di halaman 1dari 14

Statistiques infrentielles - BTS 2me anne - Page 1 G. COSTANTINI http://bacamaths.

net/
CHANTILLONNAGE - ESTIMATION
- Partie A - chantillonnage -
L'objectif de cette partie est de rpondre la problmatique suivante : comment, partir d'informations (couple
moyenne-cart-type ou proportion) connues sur une population, peut-on prvoir celles d'un chantillon ?
Nous distinguerons deux cas : celui o l'on tudie une moyenne dans un chantillon et celui o l'on tudie une
proportion dans un chantillon.
A.1. tude de la moyenne d'un chantillon
On dispose d'une population sur laquelle est dfinie une variable alatoire X dont on connat l'esprance (ou la
moyenne) et l'cart-type !.
On s'intresse aux chantillons de taille n. Auront-ils tous la mme moyenne ? Non, certains peuvent tre
constitus d'lments atypiques et avoir une moyenne trs diffrente de celle de la population (surtout si
l'chantillon est de petite taille).
Notons X la variable alatoire qui, chaque chantillon de taille n, associe sa moyenne ( X s'appelle encore la
distribution des moyennes des chantillons). Que peut-on dire de cette variable alatoire X ?
Thorme Central Limite - Version 1 - (Version faible)
Contexte : variable alatoire X qui suit une loi normale sur la population
X N( ; !)
On prlve, au hasard, un chantillon (tirages avec remise
(1)
ou assimils) de taille n de moyenne X .
Alors la variable alatoire X suit galement une loi normale :
X N ;
n
! " #

$ %
& '

(1)
Un tirage avec remise est encore appel "tirage non exhaustif". Si on fait un tirage sans remise (tirage exhaustif), on modifie la taille de la
population au fur et mesure des tirages, ce qui compliquerait les calculs (intervention d'un facteur d'exhaustivit). Ceci dit, pour des grandes
populations le tirage sans remise s'assimile un tirage avec remise.
Echantillons de taille n
... i 5 4 3 2 1
Population
Moyenne connue.
Ecart-type ! connu.
{

Attnuation de la dispersion par


le processus d'chantillonnage.
Statistiques infrentielles - BTS 2me anne - Page 2 G. COSTANTINI http://bacamaths.net/
Dmonstration :
Notons E = {x
1
; x
2
; ... ; x
n
} un chantillon de n lments prlevs au hasard dans la population.
Pour tout i compris entre 1 et n, notons X
i
la variable alatoire correspondant la valeur du i-me lment x
i
de
l'chantillon. Nous savons, par hypothse, que :
E(X
i
) = et !(X
i
) = !
La moyenne X des n valeurs de l'chantillon est :
X =
1 2
...
n
X X X
n
+ + +
D'aprs les proprits de la loi normale, nous savons qu'une combinaison linraire de variables alatoire qui
suivent la loi normale est encore une variable alatoire qui suit la loi normale. Comme chaque variable
alatoire X
i
suit ici la loi normale N(, !), la variable alatoire moyenne X suit donc galement une loi
normale. Calculons ses paramtres.
D'aprs la proprit de linarit de l'esprance :
E( ) X =
1 2
( ) ( ) ... ( )
n
E X E X E X
n
+ + +
=
n
n

=
D'aprs les proprits de la variance :
V( ) X =
1 2
2
( ) ( ) ... ( )
n
V X V X V X
n
+ + +
=
2
2
n
n
!
=
2
n
!
D'o : !( ) X =
n
!
Thorme Central Limite - Version 2 - (Version forte)
Contexte : variable alatoire X qui suit une loi quelconque sur la population avec E(X) = et !(X) = !.
On prlve, au hasard, un chantillon (tirages avec remise ou assimils) de taille n, avec n ! 30, de moyenne X .
Alors la variable alatoire X suit approximativement une loi normale :
X N ;
n
! " #

$ %
& '
Ce thorme d aux mathmaticiens De Moivre et Laplace est de dmonstration trs difficile. Il est admis ici.
Remarque : il ne faut pas confondre l'cart-type
n
!
de la variable alatoire X (qui est dfinie sur l'ensemble
des chantillons possibles de taille n) avec l'cart-type d'un chantillon prlev. L'cart-type de l'chantillon
prlev n'interviendra pas dans nos calculs dans cette partie. Pour viter cette confusion, la quantit
n
!
sera
parfois appele "erreur type".
Exemple :
Les statistiques des notes obtenues en mathmatiques au BAC STI en France pour l'anne 2006 sont :
Moyenne nationale : =10,44
cart-type : ! = 1,46
Une classe de BTS comporte 35 lves en 2006/2007 issus d'un BAC STI en 2006.
Statistiques infrentielles - BTS 2me anne - Page 3 G. COSTANTINI http://bacamaths.net/
Calculer la probabilit que la moyenne de cette classe soit suprieure 10.
Ici, nous ne connaissons pas la loi sur la population, mais l'effectif n de l'chantillon est suprieur 30.
Nous allons donc pouvoir utiliser le T.C.L. 2.
Notons X la variable alatoire qui, tout chantillon de taille n = 35, fait correspondre sa moyenne.
Alors : X N ;
n
! " #

$ %
& '
= N
1, 46
10, 44;
35
" #
$ %
& '
Posons T =
10, 44
1, 46
35
X (
ainsi T N(0 ; 1).
Nous obtenons alors par centrage et rduction :
P( X ! 10) = P
10, 44 10 10, 44
1, 46 1, 46
35 35
X
" #
$ %
( (
$ %
$ %
$ %
& '
!
= P(T ! (1,78)
= P(T " 1,78)
= !(1,78)
Et par lecture directe de la table de la loi normale centre-rduite :
!(1,78) = 0,9625
Conclusion : il y a environ 96% de chance que, dans cette classe de BTS, la moyenne des notes au baccalaurat
de Mathmatiques soit suprieure 10.
A.2. tude d'une proportion dans un chantillon
Cette fois-ci, on dispose d'une population sur laquelle on tudie un caractre (ou attribut) A dont on connat la
proportion p dans la population.
On s'intresse aux chantillons de taille n. La proportion du caractre A dans les chantillons sera-t-elle
toujours la mme ? Evidemment non, cette proportion varie en fonction de l'chantillon choisi. Notons F la
variable alatoire qui, chaque chantillon de taille n, associe sa proportion du caractre A (F s'appelle
distribution des frquence des chantillons). Que peut-on dire de cette variable alatoire F ?
1(!(t) !((t)
t
!t
Remarque : P(T ! t) = P(T " (t)
En effet :
P(T ! t) = 1 ( P(T " t) = 1 ( !(t) = !((t) = P(T " (t)
Echantillons de taille n ... pi p5 p4 p3 p2 p1
Population
Proportion p connue
du caractre A
{
A
1 ( p p
A A
Statistiques infrentielles - BTS 2me anne - Page 4 G. COSTANTINI http://bacamaths.net/
Thorme
Contexte : une population sur laquelle on tudie un caractre A rpandu avec une frquence p.
On prlve, au hasard, un chantillon (tirages avec remise ou assimils) de taille n avec n ! 30.
On note F la frquence du caractre A dans l'chantillon.
Alors la variable alatoire F suit approximativement une loi normale :
F N
(1 )
;
p p
p
n
" #
(
$ %
$ %
& '
Dmonstration :
Nous allons avoir ici un modle binomial ou apparent dont on sait qu'il converge vers la loi normale.
Pour tout i compris entre 1 et n, notons X
i
la variable alatoire dfinie par :
X
i
=
1 si le -me lment de l'chantillon possde l'attribut
0 sinon
i A )
*
+
La variable alatoire X
i
suit une loi de Bernoulli de paramtre p.
La variable alatoire X = X
1
+ X
2
+ ... + X
n
est donc binomiale de paramtres n et p :
X B(n, p)
En consquence : E(X) = np et !(X) = (1 ) np p (
La variable alatoire F =
X
n
correpond ainsi la frquence de l'attribut A dans l'chantillon.
D'aprs les proprits de l'esprance et de l'cart-type :
E(F) =
( ) E X
n
= p et !(F) =
( ) X
n
!
=
(1 ) p p
n
(
Exemple :
Une lection a eu lieu et un candidat a eu 40 % des voix.
On prlve un chantillon de 100 bulletins de vote.
Quelle est la probabilit que, dans l'chantillon, le candidat ait entre 35 % et 45 % des voix ?
Ici, nous avons n = 100 et p = 0,4. La variable alatoire F correspondant la frquence des votes pour le
candidat dans l'chantillon vrifie donc :
F N
0, 4 0, 6
0, 4;
100
" #
,
$ %
$ %
& '
= N
0, 24
0, 4;
10
" #
$ %
$ %
& '
Posons T =
0, 4
0, 24
10
F (
ainsi T N(0 ; 1). Nous obtenons alors par centrage et rduction :
P(0,35 " F " 0,45) = P((1,02 " T " 1,02) = 2!(1,02) ( 1
Et par lecture directe de la table de la loi normale centre-rduite !(1,02) = 0,8461.
D'o : P(0,35 " F " 0,45) = 0,6922
Il y a donc environ 69 % de chance que, dans un chantillon de taille n = 100, le candidat ait entre 35 % et
45 % des voix.
Statistiques infrentielles - BTS 2me anne - Page 5 G. COSTANTINI http://bacamaths.net/
En analysant l'exercice ci-dessus, on constate que l'on dispose des informations sur la population (ici,
l'ensemble des votes) parce que l'lection a dj eu lieu. On en dduit des informations sur l'chantillon. Mais,
dans la pratique, c'est souvent le phnomne rciproque que nous tudierons : les lections n'ont pas encore eu
lieu et on voudrait retrouver les informations sur la population grce un sondage ralis sur un chantillon.
D'o la deuxime partie de ce document consacre l'estimation.
- Partie B - Estimation -
L'objectif de cette partie est de rpondre la problmatique suivante : comment, partir d'informations (couple
moyenne/cart-type ou proportion) calcules sur un chantillon, retrouver ou plutt estimer celles d'une
population entire ? L'estimation est le problme rciproque de l'chantillonnage. (Mais nous aurons besoin des rsultats
tablis sur la thorie de l'chantillonnage pour passer la phase estimative).
Nous distinguerons deux cas : celui o l'on cherche estimer la moyenne d'une variable alatoire dfinie sur
une population et celui o l'on cherche estimer la proportion d'individus p ayant tel caractre dans la
population.
B.1. Estimation d'une moyenne
B.1.1. Estimation ponctuelle
Contexte : on considre une variable alatoire X sur une population de moyenne (ou esprance) inconnue et
d'cart-type ! inconnu (ou connu). On suppose que l'on a prlev un chantillon de taille n (tirage avec remise
ou assimil) sur lequel on a calcul la moyenne
e
et l'cart-type !
e
.
Une estimation ponctuelle ! de la moyenne de la population est :
! =
e
Une estimation ponctuelle ! ! de l'cart-type !
e
de la population est :
! ! =
1
n
n (
!
e
Proportion : p inconnue
Moyenne : inconnue
Ecart-type : ! connu ou inconnu
Echantillon de taille n Echantillon de taille n
Population Population
pe
connue
e connue
!e connu
ESTIMATION d'une PROPORTION ESTIMATION d'une MOYENNE
Statistiques infrentielles - BTS 2me anne - Page 6 G. COSTANTINI http://bacamaths.net/
Le coefficient
1
n
n (
s'appelle correction de biais. Lorsque la taille n de l'chantillon est assez grand (en
pratique n ! 30), ce coefficient est trs voisin de 1, si bien que, dans ce cas, on peut estimer ! ! ! !
e
.
Exemple :
Une universit comporte 1500 tudiants. On mesure la taille de 20 d'entre eux. La moyenne
e
et l'cart-type !
e
calculs partir de cet chantillon sont :

e
= 176 cm et !
e
= 6 cm
Nous pouvons donc estimer les paramtres de la population :
! = 176 cm et ! ! =
20
19
, 6 ! 6,16 cm
Remarque :
Nous n'avons fait qu'une estimation, il est bien sr impossible de retrouver les vraies caractristiques et ! de
la population.
L'estimation ponctuelle permet surtout de disposer d'une valeur de rfrence pour poursuivre/affiner les calculs.
On souhaiterait notamment pouvoir faire une estimation par intervalle, en contrlant le risque pris.
B.1.2. Estimation par intervalle de confiance
Le contexte est le mme que le prcdent, sauf que nous allons raisonner en deux temps, une phase a priori (ou
prvisionnelle) dans lequelle on suppose que l'chantillon n'est pas encore prlev et une phase a posteriori
dans laquelle on suppose connue la moyenne
e
et l'cart-type !
e
de l'chantillon et donc la moyenne estime !
et l'cart-type estim ! ! de la population.
- PHASE A PRIORI - Mise en place du modle prvisionnel -
Nous avons vu, dans la thorie sur l'chantillonnage, que si X est la variable alatoire correspondant la
moyenne d'un chantillon de taille n pris au hasard, alors le Thorme Central Limite permet d'affirmer que X
suit approximativement une loi normale :
X N ;
n
! " #

$ %
& '
Nous allons chercher un intervalle qui contient avec une confiance arbitraire de 95% (cela pourrait aussi tre 99% ou
un autre coefficient de confiance). Nous cherchons donc un rayon r tel que :
P( X ( r " " X + r) = 0,95
Probabilit que la moyenne de la
population tombe dans un intervalle
du type [ X ( r ; X + r]
X + r X ( r
X
Statistiques infrentielles - BTS 2me anne - Page 7 G. COSTANTINI http://bacamaths.net/
Cette disposition des ingalits n'est pas pratique mais il y a une correspondance remarquable entre deux
vnements qui va nous faciliter les calculs :
X ( r " " X + r
Retranchons X et dans chaque membre :
( ( r " ( X " r (
Multiplions par (1 : r + ! X ! ( r
Remettons les ingalits dans l'ordre croissant :
( r " X " r +
Nous sommes ainsi ramens calculer :
P( ( r " X " + r) = 0,95
On sait que la variable alatoire T =
X
n
(
!
=
( )
n
X (
!
suit la loi normale centre-rduite N(0 ; 1).
Nous obtenons donc, par centrage et rduction :
P
r X r
n n n
" #
$ %
( ( ( + (
$ %
! ! !
$ %
$ %
& '
" " = 0,95
P
r n r n
T
" #
(
$ %
$ %
! !
& '
" " = 0,95
P
r n r n
T
" #
(
$ %
$ %
! !
& '
" " = 0,95
2!
r n
" #
$ %
$ %
!
& '
( 1 = 0,95
!
r n
" #
$ %
$ %
!
& '
= 0,975
!(t) = 0,975 o t =
r n
!
Nous cherchons donc, par lecture inverse de la table de la loi normale centre rduite une borne t telle que :
!(t) = 0,975
La borne t = 1,96 convient.
La borne t dpend du coefficient de confiance choisi.
Avec un coefficient de confiance de 99%, nous aurions obtenu :
2!
r n
" #
$ %
$ %
!
& '
( 1 = 0,99
Dans la pratique, nous partirons
de cette criture pour dterminer
un intervalle de confiance.
Probabilit que la moyenne X de
l'chantillon tombe dans un
intervalle centr en .

Cette proprit dcoule de la
symtrie de la valeur absolue :
|X ( Y| " r
Cela signifie que l'cart entre X
et Y est infrieur r, ce qui s'crit
indiffremment :
(r " X ( Y " r
Y ( r " X " Y + r
Ou encore :
(r " Y ( X " r
X ( r " Y " X + r
On constate ici que le fait de ne pas
connatre n'est pas gnant, ce stade.
Rappel : si T N(0 ; 1) alors :
P((- " T " -) = 2!(-) (1
En effet :
P((- " T " -) = !(-) ( !((-)
= !(-) ( (1 ( !(-))
= 2!(-) (1
+ r ( r
X
Statistiques infrentielles - BTS 2me anne - Page 8 G. COSTANTINI http://bacamaths.net/
!(t) = 0,995
t = 2,575
Par la suite, nous noterons t le rel tel que 2!(t) ( 1 = C o C est le degr de confiance choisi.
Ainsi, notre rel r recherch est tel que :
r n
!
= t
Le rayon r de l'intervalle cherch est : r t
n
!
=
- PHASE A POSTERIORI - Utilisation des valeurs estimes ponctuellement -
Nous supposons maintenant que l'chantillon a t tir, nous obtenons donc une reprsentation
e
de la
variable alatoire X :
Nous pouvons affirmer que l'intervalle obtenu pour cet chantillon
e e
; t t
n n
! ! . /
( +
0 1
2 3
fait partie d'une famille dans laquelle 95 % contiennent la vraie moyenne de la population.
On l'appelle intervalle de confiance 95 % (ou autre selon le coefficient de confiance dcid pralablement).
Pour calculer les bornes de cet intervalle, deux cas de figure se prsentent selon que nous connaissons ou pas
l'cart-type ! de la population. S'il est connu, il n'y a rien faire :
IC =
e e
; t t
n n
! ! . /
( +
0 1
2 3
Si l'cart-type ! de la population n'est pas connu, on le remplace par son estimation ponctuelle ! ! =
1
n
n (
!
e
.
Dans ce cas, nous obtenons : r =
e
1
n
t
n n
!
(
=
e
1
t
n
!
(
Nous pouvons donc estimer avec une confiance de 95 % (ou 99 % selon le cas) que la moyenne de la
population appartient l'intervalle :
IC =
e e
e e
;
1 1
t t
n n
! ! . /
( +
0 1
( ( 2 3
Remarques :
L'intervalle de confiance est centr en la valeur
e
car c'est la seule valeur de rfrence que nous disposons.
Le centre de l'intervalle de confiance ( savoir
e
) dpend de l'chantillon choisi (puisque
e
en dpend).
Son rayon en dpend aussi lorsqu'on ne connat pas l'cart-type de la population.
La vraie valeur de la moyenne de la population peut ne pas appartenir l'intervalle de confiance.
Le rayon de l'intervalle de confiance ( savoir la quantit r =t
n
!
) dpend du degr de confiance C choisi.
Plus le degr de confiance C est proche de 100%, et plus la borne t sera leve et donc le rayon grand.
On ne retiendra pas cette formule.
Dans la pratique, on refait les calculs.
e + r e ( r
e
Statistiques infrentielles - BTS 2me anne - Page 9 G. COSTANTINI http://bacamaths.net/
Illustration :
Exemple :
Une universit comporte 1500 tudiants. On mesure la taille de 20 d'entre eux. La moyenne
e
et l'cart-type !
e
calculs partir de cet chantillon sont :

e
= 176 cm et !
e
= 6 cm
Nous avons dj estim ponctuellement les paramtres de la population :
! = 176 cm et ! ! =
20
19
, 6 ! 6,16 cm
Dterminons maintenant une estimation de par intervalle de confiance 95% (ou au risque de 5 %).
Notons X la variable alatoire correspondant la moyenne d'un chantillon de taille 20 pris au hasard.
Nous savons que : X N ;
n
! " #

$ %
& '
= N ;
20
! " #

$ %
& '
On calcule un rayon r tel que : P( ( r " X " + r) = 0,95
On pose T =
20
X r (
!
, ainsi T suit la loi normale centre-rduite N(0 ; 1).
Nous avons donc : P
20 20 r r
T
" #
(
$ %
$ %
! !
& '
" " = 0,95
2!
20 r
" #
$ %
$ %
!
& '
( 1 = 0,95
!
20 r
" #
$ %
$ %
!
& '
= 0,975
!(t) = 0,975 o t =
20 r
!
Nous cherchons donc, par lecture inverse de la table de la loi normale centre rduite une borne t telle que :
!(t) = 0,975
La borne t = 1,96 convient.
Ainsi, notre rel r recherch est tel que :
20 r
!
= 1,96

! = e
99%
99%
95%
! = e
! = e
X Population
Echantillon 1
Echantillon 2
Echantillon 3
Un intervalle de
confiance ne contient
pas forcment la
moyenne de la
population.
Un intervalle de
confiance 95 % est
plus petit qu'un
intervalle de confiance
99%. Il risque moins
de contenir la valeur
moyenne .
Statistiques infrentielles - BTS 2me anne - Page 10 G. COSTANTINI http://bacamaths.net/
r =
1, 96
20
,!
Mais une fois l'chantillon tir, nous avons obtenu un cart-type estim ! ! ! 6,16 cm.
D'o : r ! 2,7
La ralisation de l'intervalle de confiance 95% sur cet chantillon est :
IC = [176 ( 2,7 ; 176 + 2,7]
IC = [173,3 ; 178,7]
Nous pouvons donc estimer, avec une confiance de 95 % que la taille moyenne de la population est comprise
entre 173,3 cm et 178,7 cm.
B.2. Estimation d'une proportion
B.2.1. Estimation ponctuelle
Contexte : on considre un caractre (ou attribut) A sur une population dont la proportion p est inconnue. On
suppose que l'on a prlev un chantillon de taille n (tirage avec remise ou assimil) sur lequel on a calcul la
proportion p
e
d'individus ayant le caractre A.
Notons F la variable alatoire correspondant la proportion du caractre A dans un chantillon de taille n pris
au hasard. On rappelle qu'alors F suit approximativement une loi normale :
F N
( )
;
p
p ! o !
p
=
(1 ) p p
n
(
Une estimation ponctuelle p ! de la proportion p de l'attribut A dans la population est :
p ! = p
e
Une estimation ponctuelle !
p
! de l'cart-type !
p
est selon le cas :
1
n
n (
e e
(1 ) p p
n
(
=
e e
(1 )
1
p p
n
(
(
si n " 30
e e
(1 ) p p
n
(
si n > 30
1
4n
si statisticien pessimiste
Exemple :
quelques jours d'une lection, un candidat fait effectuer un sondage. Sur les 150 personnes interroges, 45 se
disent prtes voter pour lui aux prochaines lections.
La proportion d'individus prte voter pour ce candidat dans l'chantillon est ici de p
e
=
45
150
= 0,3.
On estime donc qu'il en est de mme dans la population (comment pourrait-on faire autrement ?) :
p ! = p
e
= 0,3
Quand l'indication !
p
, on peut ici l'estimer par :
!
p
! =
e e
(1 ) p p
n
(
=
0, 3 0, 7
150
,
! 0,037
Ces estimations ponctuelles de
l'cart-type ne sont pas utiles dans
l'immdiat. Elle serviront pour la
dtermination d'un intervalle de
confiance de la proportion.
Correction de biais.
Statistiques infrentielles - BTS 2me anne - Page 11 G. COSTANTINI http://bacamaths.net/
On voudrait aller plus loin et, au lieu d'une simple proportion, calculer un intervalle contenant, avec une
confiance arbitraire fixe au dpart, la proportion p d'individus prts voter pour ce candidat.
B.2.2. Estimation par intervalle de confiance
Le contexte est le mme que le prcdent. Nous avons vu, dans la thorie sur l'chantillonnage, que si F est la
variable alatoire correspondant la proportion d'un caractre dans un chantillon de taille n pris au hasard,
alors F suit approximativement une loi normale :
F N
( )
;
p
p ! o !
p
=
(1 ) p p
n
(
Nous avons dj remarqu que le fait que p soit inconnu n'est pas gnant dans les calculs a priori. Le problme
ici, c'est que nous ne connaissons pas l'cart-type
(1 ) p p
n
(
. Nous le remplaerons, dans la phase a posteriori,
par son estimation ponctuelle (qui est
e e
(1 )
1
p p
n
(
(
en gnral ou
e e
(1 ) p p
n
(
si la correction de biais n'est
pas propose ou encore
1
4n
si nous voulons une hypothse pessimiste).
Cherchons un intervalle qui contient p avec une confiance arbitraire de 90 % (cela pourrait tre un autre coefficient de
confiance). Nous cherchons donc un rayon r tel que :
P(F ( r " p " F + r) = 0,90
Nous avons dj vu que cette probabilit pouvait s'crire de manire plus pratique :
P(p ( r " F " p + r) = 0,90
On sait que la variable alatoire T =
p
F p (
!
suit la loi normale centre rduite N(0 ; 1).
Nous obtenons donc, par centrage et rduction :
P
p p p
p r p F p p r p
" #
( ( ( + (
$ %
$ %
! ! !
& '
" " = 0,90
P
p p
r r
T
" #
(
$ %
$ %
! !
& '
" " = 0,90
2!
p
r
" #
$ %
$ %
!
& '
( 1 = 0,90
!
p
r
" #
$ %
$ %
!
& '
= 0,95
On cherche une borne t telle que : !(t) = 0,95 avec t =
p
r
!
Par lecture inverse de la table de la loi normale centre rduite N(0 ; 1) :
t = 1,645
Ce qui nous permet de calculer r : r = t !
p
Supposons maintenant l'chantillon prlev. Nous avons donc une estimation pontuelle de p et !
p
.
Ainsi, la ralisation de l'intervalle de confiance dans l'chantillon est :
Statistiques infrentielles - BTS 2me anne - Page 12 G. COSTANTINI http://bacamaths.net/
IC =
e e e e
e e
(1 ) (1 )
;
1 1
p p p p
p t p t
n n
. /
( (
( +
0 1
( (
0 1
2 3
Remarques :
Si on n'effectue pas la correction de biais, l'intervalle de confiance est :
IC =
e e e e
e e
(1 ) (1 )
;
p p p p
p t p t
n n
. /
( (
( +
0 1
0 1
2 3
On peut galement se placer dans une hypothse pessimiste en choisissant un cart-type maximal. Nous
savons que la parabole d'quation y = x(1 ( x) admet un maximum gal
1
4
en
1
2
.
Ainsi l'cart-type maximal est
1
4n
. Il a, de plus, l'avantage d'tre indpendant de p.
Dans ce cas, la ralisation de l'intervalle de confiance dans l'chantillon est :
IC =
e e
1 1
;
4 4
p t p t
n n
. /
( +
0 1
2 3
Exemple :
A quelques jours d'une lection, un candidat fait faire un sondage. Sur les 150 personnes interroges, 45 se
disent prtes voter pour lui aux prochaines lections.
La proportion d'individus prte voter pour ce candidat dans l'chantillon est ici de p
e
=
45
150
= 0,3.
On a dj estim ponctuellement : p ! = p
e
= 0,3 et !
p
! ! 0,037
Dterminons maintenant une estimation de p par intervalle de confiance 80%.
Notons F la variable alatoire correspondant la proportion d'individus prts voter pour ce candidat dans un
chantillon de taille 150 pris au hasard.
Nous avons vu qu'approximativement :
F N
( )
;
p
p ! o !
p
=
(1 ) p p
n
(
On cherche un rayon r tel que : P(p ( r " F " p + r) = 0,8
2!
p
r
" #
$ %
$ %
!
& '
( 1 = 0,8
!
p
r
" #
$ %
$ %
!
& '
= 0,9
Par lecture inverse de la table de la loi normale centre-rduite, on cherche une borne t telle que :
!(t) = 0,9 avec t =
p
r
!
La valeur t ! 1,28 convient donc : r = 1,28 !
p
Supposons maintenant l'chantillon prlev. Une estimation ponctuelle de !
p
est !
p
! ! 0,037.
D'o : r ! 0,047
On ne retiendra pas cette formule.
Dans la pratique, on refait les calculs.
Statistiques infrentielles - BTS 2me anne - Page 13 G. COSTANTINI http://bacamaths.net/
La ralisation de l'intervalle de confiance dans cet chantillon est alors
IC = [0,3 ( 0,047 ; 0,3 + 0,047]
IC = [0,253 ; 0,347]
IC
%
= [25,3 ; 34,7]
Nous pouvons estimer, avec une confiance de 80 %, que la proportion d'individus dans la population prts
voter pour le candidat en question est comprise entre 25,3 % et 34,7 %.
Exercice :
Une usine fabrique des cbles. Un cble est considr comme conforme si sa rsistance la rupture X est
suprieure 3 tonnes. L'ingnieur responsable de la production voudrait connatre, en moyenne, la rsistance
la rupture des cbles fabriqus.
Il n'est, bien sr, pas question de faire le test sur toute la production (l'usine perdrait toute sa production !).
Un technicien prlve donc un chantillon de 100 cbles dans la production. Notons X la variable alatoire
correspondant la force exercer sur le cble pour le rompre. Le technicien obtient les rsultats suivants :
E( X ) = 3,5 tonnes
!( X ) = 0,4 tonne
Proportion de cbles dont la rsistance est suprieure 3 tonnes : p
e
= 0,85
1. a. Donner une estimation ponctuelle de la moyenne et de l'cart-type ! de la variable alatoire X dans la
production.
b. Dterminer une estimation par intervalle de confiance 95 % de la moyenne de X.
2. a. Donner une estimation ponctuelle de la proportion p de cbles conformes dans la production.
b. Dterminer une estimation par intervalle de confiance 90 % de cette proportion.
Statistiques infrentielles - BTS 2me anne - Page 14 G. COSTANTINI http://bacamaths.net/
- RSUM -
- Echantillonnage -
- Estimation -
Echantillons de taille n de moyenne X
X N ;
n
! " #

$ %
& '
o et ! sont la moyenne et l'cart-type
dans la population.
Echantillons de taille n avec une frquence F
F N
(1 )
;
p p
p
n
" #
(
$ %
$ %
& '
o p est la proportion dans la population.
PROPORTION MOYENNE
Proportion inconnue p dans une population.
Echantillon de taille n connu avec une proportion p
e
.
! Une estimation ponctuelle de p est p
e
.
! Une estimation ponctuelle de !
p
est
e e
(1 )
1
p p
n
(
(
si
n " 30 ou
e e
(1 ) p p
n
(
sinon (n > 30).
! Pour estimer p par intervalle avec une confiance C
(par ex 95%), on cherche un rayon r tel que :
P(p ( r " F " p + r) = C
o F N
( )
;
p
p ! avec !
p
=
(1 ) p p
n
(
On exprime r en fonction de !
p
et on remplace !
p
par
son estimation ponctuelle.
IC = [p
e
( r ; p
e
+ r]
Population de moyenne inconnue et d'cart-type ".
Echantillon de taille n connu de moyenne
e
et d'cart-type "
e
.
! Une estimation ponctuelle de est
e
.
! Une estimation ponctuelle de ! est
1
n
n (
!
e
si n " 30 ou
tout simplement !
e
sinon (n > 30).
! Pour estimer par intervalle avec une confiance C (par
ex 95%), on cherche un rayon r tel que :
P( ( r " X " + r) = C
o X N ;
n
! " #

$ %
& '
On exprime r en fonction de ! et on remplace ! par sa valeur
connue ou son estimation ponctuelle.
IC = [
e
( r ;
e
+ r]
PROPORTION MOYENNE
Coefficient de confiance 80 % 90 % 95 % 99 %
Valeur de 4(t) 0,9 0,95 0,975 0,995
Borne t 1,28 1,645 1,96 2,575

Anda mungkin juga menyukai