Anda di halaman 1dari 0

REVUE DE STATISTIQUE APPLIQUE

J. MOTHES
Principes fondamentaux de la mthode statistique
et applications industrielles (suite)
Revue de statistique applique, tome 3, n
o
2 (1955), p. 13-26.
<http://www.numdam.org/item?id=RSA_1955__3_2_13_0>
Socit franaise de statistique, 1955, tous droits rservs.
Laccs aux archives de la revue Revue de statistique applique (http://www.
sfds.asso.fr/publicat/rsa.htm) implique laccord avec les conditions gnrales duti-
lisation (http://www.numdam.org/legal.php). Toute utilisation commerciale ou im-
pression systmatique est constitutive dune infraction pnale. Toute copie ou im-
pression de ce chier doit contenir la prsente mention de copyright.
Article numris dans le cadre du programme
Numrisation de documents anciens mathmatiques
http://www.numdam.org/
13
PRINCIPES FONDAMENTAUX DE LA MTHODE STATISTIQUE
ET APPLICATIONS INDUSTRIELLES
(Suite)
par
J.
MOTHES
Ancien lve de lcole
Polytechnique,
Ingnieur
au
Dpartement
Commercial du Gaz de France
CHAPITRE IV
ESTIMATION DE LA
QUALIT
DUN PRODUIT
15
CHAPITRE IV
ESTIMATION DE LA
QUALIT
DUN PRODUIT
Des indications fournies au
chapitre 3,
il ressort
quune
des
phases
fonda-
mentales de
lanalyse statistique
consiste
passer
dune distribution observe
la distribution
thorique susceptible
de lui
correspondre.
Cela
fait,
rien ne
soppose
en effet ce
que
lon considre la distribution observe comme le rsultat
dun
chantillonnage opr
dans la
population hypothtique
infinie distribue con-
formment la loi de
probabilit
choisie comme modle de rfrence. On est
alors mme de raisonner sur un modle
mathmatique
bien dfini et den
tirer,
en sens
inverse,
des conclusions dordre
pratique.
Les distributions usuelles les
plus frquemment
rencontres en
pratique pr-
senten~ lintrt dtre entirement dfinies
par
un
petit
nombre de
paramtres.
La distribution normale
est,
par exemple,
entirement dSle
par
sa
moyenne
et son
cart-type,
la distribution de Poisson
par
sa
moyenne.
Pour
passer
dune
distribution observe une distribution
thorique,
on est donc
obligatoirement
amen,
une fois choisi le
type
de la distribution
thorique
de
rfrence,
estimer
les valeurs des
paramtres qui
dfinissent entirement cette distribution
thorique

partir
des donnes constituant la distribution observe. Les
problmes
desti-
mation
prsentent
de ce fait un caractre fondamental sur
lequel
il
parait
inutile
dinsister
davantage.
On se
propose
de
dcrire,
au cours des
pages qui
vont
suivre,
les
principes
de lestimation
statistique. Auparavant,
il nest
pas
sans intrt
danalyser
ce
que reprsente
le raccordement dune distribution observe une distribution
thorique
du
point
de vue des notions mmes de
"qualit"
et
"dhomognit"
dune fabrication.
IV. 1. - NOTIONS DE
QUALIT
ET DHOMOGNIT DUNE FABRICATION
Le raccordement dune distribution
observe une distribution
thorique
est
autoris
par
la loi des
grands
nombres.
Ayant
observ,
par exemple,
des rsultats de fabrication distribus comme
en IV-1,
on
conoit
la distribution
thorique correspondante comme
le
systme
Fig.
IV. 1.
16
limite des
frquences qui
seraient observes dans
lhypothse
o le
processus
de
fabrication, ( lorigine
de
celle-ci),
serait
capable
de
produire
une infinit de
pices
"dans des conditions de marche
identiques
aux conditions existantes lors
de la fabrication du lot examin". Raisonnant de la
sorte,
on constate
que
la
distribution
thorique
de rfrence rsume entirement ,
du
point
de vue de la
proprit
examine, linfluence -sur la fabrication- du
jeu
de lensemble des
facteurs de
production
mis en oeuvre
pour
ralisation de cette fabrication. Cela
tant,
cette distribution est trs troitement
lie la notion mme de
" qualit"
du
produit fabriqu.
Quest-ce,
en
effet,
que
la
qualit
dun
produit
donn? Cest videmment un
ensemble de conditions
imposes
une ou
plusieurs
des
proprits
du
produit
en
question.
Par
consquent, pour juger
de la
qualit
dune
fabrication,
trois
op-
rations sont ncessaires
*
a)
Dterminer les
proprits
retenir comme "critres de
qualit",
b) Imposer (ventuellement)
des conditions ces
proprits,
c) Comparer
les rsultats effectifs de la fabrication -du
point
de vue des
proprits
retenues- aux conditions
imposes
ces dernires.
Ds
labord,
il saute aux
yeux que l~opration (c) implique
la connaissance
de la
(ou des)
distribution
thorique
de rfrence relative la
(ou aux) proprit
examine
(dans
la fabrication
prise
en
considration).
Par
ailleurs,
les
oprations (a)
et
(b) nchappent pas
aussi
compltement
quon peut
le croire
premire
vue au domaine de la
Statistique.
Si
lopration (c)
est
pratiquement
rsolue une fois connue la distribution
thorique
de rfrence de la
proprit
tudie dans la fabrication
examine,
encore
faut-il tre en mesure de dfinir effectivement cette distribution
thorique

partir
de la distribution des rsultats des essais
oprs
en
pratique.
Cette dis-
tribution
thorique
est dun
usage
dautant
plus
commode
quelle
est
susceptible
dtre rsume
par
un trs
petit
nombre de valeurs
caractristiques.
Dans ces
conditions, si,
au stade de
lopration (a),
on a le choix entre deux
critres de
qualit quivalents
mais dont lun
conduit,
en
fabrication,
une dis-
tribution
thorique
plus
commode manier
que lautre,
on a
toujours
intrt
retenir celui-l.,
Au stade de
lopration (b),
il est dautre
part
souvent utile de se demander
si les conditions
imposes
aux critres de
qualit pris
en considration sont abso-
lument
impratives.
On constate souvent
que
ces conditions sont
fixes,
sans
tenir
compte
des
possibilits pratiques
de
fabrication,
des niveaux ne
prsentant,
du
pointde
vue des
usagers,
aucun caractre de stricte ncessit. Dans la mesure
ou les mthodes
statistiques permettent
de dfinir les
possibilits techniques
de
fabrication,
il
peut
tre utile de tenir
compte
de leurs
enseignements :
cest ce
qui
a t fait en
Angleterre
dans lIndustrie des Matires
Plastiques
Toutes ces
remarques
sont aises clarifier laide de
quelques petits
schmas.
Considrons
dabord, pour
un
produit
donn,
deux critres de
qualit C1
et
c2 , quivalents,
mais dont lun est
distribu,
dans les fabrications ralises
en
pratique,
conformment la
figure
IV-2
C1
et
lautre,
conformment la
figure
IV-2
C2 (distribution normale).
Fig. IV. 2. C~ .
Fig.
IV. 2.
C2.
17
Dans
lhypothse ou, techniquement,
les deux critres de
qualit c.
et
c2
sont
quivalents,
il est vident
quon
a intrt
(opration a)
retenir
C2 ,
la
distribution
thorique
normale tant
simple (elle
est entirement dfinie
par
deux
caractristiques
sa
moyenne
et son
cart-type)
et bien connue.
Cette vidence devient
flagrante si,
au stade de
lopration (b),
des conditions
techniques impratives impliquent, pour que
la fabrication soit
"bonne", que
les
valeurs de
cs
tombent entre deux
limites
et
(/)2.
Il est en effet trs ais de
dfinir la
position
de la distribution
thorique
normale
par rapport
lintervalle
01
et
r/J2.
Du
point
de vue
pratique,
les
consignes
de fabrication donner
pour
enregistrer
un minimum de
rebuts,
sont
par
ailleurs les
plus simples possibles :
il suffit de
rgler
la fabrication au centre de lintervalle
01 07
(Fig. IV-3).
Fig. IV. 3
Avec une distribution
dissymtrique
comme celle de
CI
-laurait-on
parfai-
tementdfinie- ces deux
questions
seraient, videmment, beaucoup plus
difficiles
trafter.
La
prise
en
compte
de la distribution
thorique
de rfrence dune fabrication
permet galement
une meilleure
comprhension
de la notion
dhomognit
En
pratique
industrielle on a lhabitude de lier cette notion celle de
"plus
ou moins
grande dispersion"
des rsultats de fabrication. En
prsence
de deux
fabrications
analogues F1
et
F2 . (Figure IV-4)
et constatant
que
la
dispersion
des
rsultats issus de
F1
est infrieure la
dispersion
des rsultats issus de
F2,
on
dira,
par exemple, que
la fabrication
FI
est moins
homogne que
la fabrication
F2 .
Or,
cette
conception
entraxe bien des
difficults,
ds
quon
veut dfinir la
notion
dhomognit
autrement
que
sous forme relative. A la
limite,
en
effet,
une "fabrication
homogne" (du point
de vue dune
proprit donne)
ne
pourrait
tre
quune
fabrication dont tous les individus seraient
identiques,
fabrication
inenvisageable
en
pratique.
Fig.
IV. 4
Il
parat beaucoup plus
commode de relier la notion
dhomognit
dune
fabrication la notion de stabilit des conditions de marche du
processus
de
production

lorigine
de la fabrication considre. Revenant aux fabrications
Ft
et
F2 , imaginons que F1
et
F2
soient deux lots dun mme
produit, fabriqus par
18
le mme
processus,
en deux intervalles de
temps
successifs. Nous dirons
que
FI
est
homogne
car le faitdavoir caractris la distribution
thorique
de rf-
rence revient indirectement caractriser des conditions de fabrication stables.
De
faon analogue,
nous dirons
galement que F2
est
homogne.
La diffrence entre
F1 et F2 prouve
toutefois
que,
dune fabrication
lautre,
il
y
a eu modification des conditions de fabrication. Dans ces
conditions,
nous
dirons
que
le
mlange
de
F
et
F2
est
htrogne.
IV. 2. - RSULTATS FONDAMENTAUX DE LA THORIE
DE LCHANTILLONNAGE
L-e
problme
de lestimation
statistique,
tel
que
nous lavons
dfini,
consiste

passer
des donnes constituant la distribution observe en
pratique
aux valeurs
des
paramtres qui
dfinissent la distribution
thorique
de rfrence de la fabri-
cation
examine,
cela en considrant la distribution
pratique
comme le rsultat
dun
chantillonnage opr
au sein de la
population (hypothtique)
infinie de rf-
rence.
Pour rsoudre ce
problme,
au moins dans les cas
classiques,
il est nces-
saire de connatre les
proprits
des chantillons extraits de
populations
distri-
bues conformment aux lois
thoriques
les
plus
couramment rencontres en
pra-
tique,
cest--dire les rsultats fondamentaux de la thorie de
lchantillonnage.
Tous les rsultats de cette thorie
reposent
sur une
hypothse
TRES IMPOR-
TANTE,
savoir
que
les chantillons extraits de la
population
le sont "AU HA-
SARD". Cest
pourquoi
nous reviendrons
ici,
en
premier lieu,
sur cette notion
"dEchantillonnage
au hasard"
dj
aborde au
Chapitre
II.
Echantillonner au
hasard,
cest -avons-nous dit- effectuer les
prlvements
de
faon
telle
que
tous les lments de la
population
aient,
avant chacun des
tirages,
autant de chances les uns
que
les autres dtre
prlevs.
Dans la
pratique,
cela
nquivaut
absolument
pas

"prlever nimporte
comment" : il
est,
au
contraire,
parfois
difficile de
respecter rigoureusement
cette
rgle
du
jeu pourtant
imprative.
Dans certains
cas,
le
problme
ne
prsente pas
de
graves
difficults.
Ayant,
par exemple,
faire des
prlvements
dans une caisse contenant de
petites compo-
santes
mtalliques,
on
peut
admettre si le contenu de la caisse est tout entier

porte
de la main-
qutn respecte
suffisamment le hasard ds
quon
sastreint

prlever
un
peu partout aprs brassage,
les
pices
destines constituer
lchantillon.
Dans dautres
cas,
un peu plus compliqus,
on
peut
encore
imaginer
des
plans
dchantillonnage susceptibles, bienque
trs
simples,
de donner satisfaction. Soit,
par exemple,

procder
sur des tubes de verre de
1,5
mtre de
long,
des
mesures de diamtres. Il suffit de diviser une
rgle
de
1, 5m
en 100 intervalles
numrots de 1 100 et de
disposer
dun sac de billes
galement
numrotes de
1 100.
Ayant
alors effectuer -disons- 5 mesures sur
un tube,
on tirera 5
numros dans le sac
et,
une fois
superpos
le tube la
rgle gradue,
on mesurera
les 5 diamtres des zones du tube en
regard
des numros
correspondants
de la
rgle.
Onpeut
videmment se demander sil ne suffirait
pas,
dans ce
cas y
de laisser
toute latitude
loprateur
deffectuer les mesures sa
guise,
un
peu,partout.
En
fait,
toutes les
expriences
faites ce
sujet
montrent
que
de telles
mesures,
effectues sans
prcaution,
ne sont nullement
rparties
au hasard.
Dans certaine cas, enfin,
il faut
envisager
des
plans dchantillonnage beaucoup
plus compliqus.
De tels
plans impliquent lusage
de tables dites de "nombres au
hasard". La
technique
consiste numroter de 1 N les lments constituant la
population. Ayant
alors dcid de
prlever
un chantillon de n
lments,
on litn
nombres dans la table et on
prlve
effectivement les n lments
portant
les
numros
correspondants.
19
Dans la Revue de
Statistique Applique (Vol II,
n"
4,
page 188)
est dcrit un
matriel de dmonstration
dassemblages
dont
lusage implique
certaines
pr-
cautions en vue de
respecter
les
rgles
du hasard. A titre
anecdotique
son cas
mrite dtre examin.
Ce matriel a
pour objet
de montrer
que
les tolrances
adopter
surla
longueur
dun ensemble de
pices
mises bout bout nest
pas
la somme des tol-
rances fixes sur chacune des
pices.
Les lments de base de
lappareillage
de dmonstration sont
quatre popula-
tions de
pices mtalliques. Chaque population comprend
des
pices
de
longueurs
variables,
la distribution du nombre de
pices
en fonction des
longueurs
tant
normale
(Fig. IV-5),
et le
principe
de la dmonstration consiste
prlever
au
hasard une
pice
dans
chaque population,
mettre les
quatre pices ainsi prleves
bout bout dans un bati
spcial,
cela fait constater
que
la
longueur
totale des
sries de
quatre pices
ainsi constitues varie dans un
inte.rvalle beaucoup
moins
large que
lintervalle obtenu
par
addition des
pices
les
plus petites
dune
part
et
les
plus longues
dautre
part
des
quatre populations.
Pour
respecter
la
rgle
du
jeu thorique
de
prlvements
au hasard de
chaque
pice
dans la
population

laquelle
elle
appartient,
on
peut imaginer
le
procd
trs
simple
consistant mettre
chaque population
dans un sac
puis
tirer une
pice
du sac
aprs brassage.
En
fait,
on constate
exprimentalement que
cette
mthode est trs mauvaise.
Loprateur
sent la main la
longueur
des
pices
mtalliques et, inconsciemment,
a tendance ne saisir
que
les
pices
ni
trop
courtes ni
trop longues.
Pour
respecter
les
rgles
du
"hasard",
on a t amen
passer par
linter-
mdiaire de
quatre populations
de
billes, chaque
bille
correspondant
une
pice
et
portant,
en
guise
de
numro,
la
longueur
de la
pice
dont elle est
limage.
Les
prlvements portent
ainsi sur des sries de
quatre billes,
tant entendu
quon
introduit dans le bti les
pices qui
leur
correspondent.
Aprs
ces
remarques
extrmement
importantes
sur les conditions
pratiques
de
lchantillonnage
au
hasard,
il
parait
suffisant dnumrer les
principaux
r-
sultats de la thorie de
lchantillonnage susceptibles
dtre utiliss dans la suite
de cet
ouvrage.
Ces rsultats sont
les suivants :
, a) Population
distribue de
faon quelconque
Les
moyennes
m des chantillons extraits au hasard dune
population quel-
conque
de
moyenne
m et
dcart-type
C se distribuent suivant une loi de
moyenne
m et
dcrt-type
C1 /
~n
De
plus,
cette loi tend
rapidement
vers la loi normale
lorsque limportance
M de
lchantilloa
augmente.
Graphiquement,
ce rsultat est schmatis sur la
figure
IV-6.
b) Population
distribue de
faon
normale-
1)
Les
moyennes
m des chantillons extraits au hasard dune
population
nor-
male de
moyenne
m et
dcart-type
a sont elles-mme distribues suivant une loi
normale de
moyenne
m et dcart
type 0 /
~n
et cela
quelle que
soit
limportance
de
lchantillon
Graphiquement,
le rsultat est schmatis sur la
figure
IV-7.
2)
Les distributions des Variances des
carts-types
et des tendues des
chantillons extraits auhasarddune
population normale
sont
parfaitement
connues.
Dexpressions
relativement
compliques,
on les a "tabules"
pour
les mettre sous
une forme commode utiliser en
pratique.
Dans la Revue de
Statistique Applique
(Vol
II,
n"
3, page 127) figure, par exemple,
la "fonctionde distribution" de la
20
Fil.
IV. 5.
21

0
-lu
~-
c
Ci-
~
~
.0
~
1
.!2
Q
t-:
oc
~
~0
&#x26;
tri ~
22
loi des tendues
(rapportes

lcart-type) pour
des chantillons de taille n variant
de 2 12 units
(1).
..
c) Population
dont les lments sont
distingus
en cc convenables et
dfectueux"
La
proportion
de dchets
prsente par
des chantillons extraits au hasard
dune
population
dont les lments sont
distingus
en Il convenable s" et "dfectueux"
est distribue suivant une loi binomiale dont une ormet1imite est la loi de Poisson.
Les deux distributions ont t tudies au cours du
Chapitre
II.
IV. 3. - LES
TECHNIQUES
DESTIMATION
Examinant,
au dbut du
chapitre III,
la nature des raisonnements
statistiques,
on a
longuement
insist sur
lintroduction,
dans les
raisonnements,
de
ce
quil
estconvenudappelerles "connaissancesapriori".
On a
indiqu,
cette
occasionr
quil
tait
prfrable
de se
passer
de telles connaissances
lorsquelles
ne
repo-
saient
pas
sur des lments
dapprciation objectifs.
Cela
pos,
on
dispose
de deux
catgories
de
techniques destimation
selon
quon
utilise ou non des donnes a
priori.
Nous
dsignerons les premires
sous
le vocable de
"techniques
a
prioristes",
les secondes sous le nom de
"techniques
destimation
par
estimateurs".
a)
Les
techniques prioristes
Elles
reposent
sur un thorme clbre -le thorme de
Bayes- voqu,
sans
le
citer, J
au cours de la section III.2.
Ce thorme
peut
snoncer de la
faon
suivante :
"Si lon sait
quun
vnement B sest
produit
et si lon sait
que
cet vnement.
ne
peut
tre
provoqu que par
un certain nombre de causes
At A2
...
Am
dont on
connat les
probabilits
a
priori,
les
probabilits
d inte rvention de s causes
AI A 2
...
Am, compte-tenu
de larrive effective de lvnement
B,
scrivent:
en
dsignant par

-
PrB
(A; )
La
probabilit, ayant
observ lvnement
B, que
cet vnement
ait t
provoqu par
la cause
Ai :
-
Pr~
(B)
La
probabilit
de lvnement B
lorsque
la cause
A;
se
manifeste;
(1)
La notion de "fonction de
rpartition
dune distribution" ou
plus simplement
de "fonction
de distribution" a t fournie la section II.1. De la
fonction,
on
passe
immdiatement . la loi
propreme
nt dite.
23
-
Pr
(Ai )
L~a
probabilit
a
priori
de la cause
Ai ;
m
et
par ~
Pr
(Ai) -

PrA~
(B)
la somme :
i =1
Pour ne
pas
entrer dans le dtail
mathmatique
de
lapplication
de ce thorme
qui
dborderait le cadre de cet
expos sommaire,
on se contentera de concrtiser
les formules
qui prcdent
sur un
exemple simple (et
dailleurs
artificiel).
Imaginons qu
la
rception
dun lot de
pices mcaniques,
on
reoive
une
lettre du fournisseur
indiquant
-.
1" - Quil a livr un second lot du mme
type
un autre client :
2 - Que ces deux
lots,
de
type analogue, comprenaient respectivement 2%
et
4%
de dchets
(daprs
les vrifications
100% opres
chez
lui);
3 - Quil ne sait malheureusement
plus
sur
lequel
de ses deux clients a t
dirig
le lot le meilleur.
et demandons-nous comment dterminer si le lot
rceptionn est,
ou
non,
celui
qui comprend
le s
2 %
de rebuts.
Il faut commencer
par prlever
un chantillon dans le lot examin. Admettons
quon prlve
250
pices et quon dtecte
8 rebuts
parmi
les 250
pices
cest lv-
nement
(B).
Dautre
part,
les causes
possibles
de cet vnement
sont,
soit le fait
davoir affaire au lot
2%
de rebuts
(A1 ),
soit le fait davoir affaire au lot
4%
de rebuts
(A2).
Cela
pos, appliquons
le thorme de
Bayes.
Daprs
la lettre du fournisseur on a videmment autant de chances de se
trouver en
prsence
du lot
2%
de dchets
que
de se trouver en
prsence
du lot
4%
de dchets. Les
probabilits

priori
de ce s de ux ventualits s ont donc re s -
pectivement :
En second
lieu,
dans
lhypothse
ou lon se trouve en
prsence
du lot
2%
de
rebuts,
la
probabilit
de trouver 8 rebuts dans un chantillon de 250
pices
scrit
daprs
la loi de Poisson
(cf.
Table n"
5;
np
=
5;
k
=
8).
et de
faon analogue
si lon se trouve en
prsence
dun lot
4%
de dchets
(cf.
table n"
5,
np = 10 k = 8)
-
par consquent
On constate donc
que, compte
tenu des
proprits
de lchantillon extrait du
lot,
la
probabilit
davoir affaire au lot
4%
de rebuts est
plus grande que
la
probabilit
davoir affaire au lot
2%
de rebuts.
Il est donc
logique
de
retenir4%
comme estimation de la
proportion
de rebuts
prsentes par
le lot.
b)
Les
techniques
destimation
par
estimateur
Lorsquon
ne
dispose pas
de connaissances a
priori dignes
de confiance,
il est
plus
rationnel dutiliser les
techniques
destimation
par
estimateur.
24
On
dsigne
sous le terme dendmateur une fonction
particulire
des raultats
de
lchantillon, fonction doue de certaines
proprits sur lesquelles
onva revenir.
Soit un chantillon de taille n. Cet chantillon conduit n observations
xI x2...... Xi
.......
xn
par consquent
toute fonction
f
(xi 1 x2
..............
x
de ces rsultats
prend
une certaine valeur.
Si lon recommence
lchantillonnage,
la fonction f
prend,
dans
chaque cas,
une nouvelle valeur -du fait des fluctuations
dchantillonnage- mais,
connaissant
la distribution des x dans la
population,
on sait dterminer la distribution des
valeurs
possibles
de f. Cest
ainsi, par exemple, que
la distribution de
pour
des chantillons extraits dune distribution normale de
moyenne
m et dcart-
type
a est elle-mme une distribution normale de
moyenne
m et
dcart -type
0/
.n
(cf.
section
IV-2).
Cela
tant,
on dit
que
la fonction
f(x~ x2....... , .xn) des
rsultats de
lchantillon est un estimateur dune
caractristique
c donne de la
population
lorsque
la
moyenne
et
lcart-type
de la distribution de f tendent
respectivement
vers c et o
pour
des chantillons
dimportance
n croissant indfiniment.
De
faon plus image,
f est un estimateur de c si la distribution de f se
dforme
lorsque
n
croit,
comme
indiqu
sur la
figure
IV.8
(passage
de
(1)
en
(2).
Fig. IV. 8.
Lorsque
la
moyenne
de la distribution de f est
gale a
c
quel que
soit n
(figure
IV.
9) 1
on dit
que
f est un estimateur sans
biais ,
Fig.
IV. 9.
25
Le
problme
de lestimation
par
estimateur
revient,
on le
voit,
trouver
une fonction f
rpondant
aux conditions
prcites.
Et, parmi
toutes les fonctions
possibles,
la meilleure est videmment celle
pour laquelle
le
passage
de
(1)
en
(2)
est le
plus rapide.
A titre
indicatif,
on
peut remarquer
des maintenant
qu un
estimateur de la
moyenne
dune
population
distribue de
faon quelconque
nest autre
que
la
moyenne
de lchantillon
prlev
dans cette
population.
On a en effet
signal
en IV. 2
que
la
distribution de m tend dans ce
cas,
pour
n
croissant,
vers une distribution nor-
male
-
de
moyenne
m .
Lorsque
la
population
initiale est
normale,
cet estimateur devient un estimateur
sana
biais ,
les
moyennes
m tant distribues normalement et
ayant
m
pour
moyenne quel que
soit n.
Signalons
encore
que,
y pour
une
population
distribue
normalement,
la variance
de lchantillon nest
pas
un estimateur sans biais de la variance de cette
popula-
tion. Lestimateur sans biais scrit en effet :
Dans le tableau suivant
figurent quelques
estimations
classiques.
On notera
que
les estimations des
caractristiques
considres sont
dsignes,
comme les
caractristiques
elles-mmes, avec, toutefois,
une
caractristique
en
exposant.
Bienquelle
soit assez dlicate
saisir,
on ne saurait ici
passer
sous silence
la notion dintervalle de confiance dune estimation.
Pour
lexpliciter
aisment,
il est commode de raisonner
graphiquement.
Soit n
limportance
de lchantillon et f lestimateur de la
caractristique
c
examine,
f tant distribu conformment au schma IV. 10.
Fig.IV.10.
Par dfinition de lestimateur
f,
la
moyenne
de leasemble de s vale ur s
possi-
bles de f tend ou est
gale)
c
mais,
en
pratique,
la valeur de f effectivement
obtenue,
rsultat dun seul
chantillonnage,
nest
pas
forcment
gale
ou trs
voisine de c.
Tout ce
que lon peut dire,
connaissant la distribution de
f,
cest
que
le f obte-
26
nu,
pour
un seuil de
probabilit
120130( donn
(section III. 3),
tombe entre les deux
limites
correspondantes :
A ce
stade,
nous constatons
que
nous
avons,
par
dfinition :
dans la
proportion
1- ex des cas.
Or, chaque
fois
que
nous avons
cela,
nous avons
Ainsi lintervalle
[_(~ 2013
h 2 ) , ( f +
hl fl
recouvre la vraie valeur c de la caract .
ristique
examine dans la
proportion
1- oc des cas. Cet intervalle est
appel
lin
tervalle de confiance
( au
seuil de
probabilit 1 - ot)
On
remarquera -
cest trs
important - quonne
dit
pas que
c a la
probabilit
1-oc de se trouver dans lintervalle de confiance. On dit
que
lintervalle de
confiance recouvre la valeur c dans le
proportion
1-oc des cas. On ne
peut logi-
quement,
en
effet,
lie r une
probabilit
c. Sans doute la valeur c est-elle inconnue
mais,
elle nen existe
pas
moins de
faon parfaitement
dfinie : elle nest donc
pas
une variable alatoire.
Cest exactement le contraire de ce
qui
se
passe
dans les
techniques
destima-
tion a
priori.
Celles-ci
considrent,
en
effet,
c comme une variable alatoire et
mettent dailleurs en
jeu
sa loi de
probabilit
(ce
sont les Pr
(A~
)~
IV. 4. - CONCLUSIONS DORDRE
PRATIQUE
Les rsultats
qui prcdent
nont
pas
fait
lobjet
de
dveloppements
math-
matiques.
De tels
dveloppements
nous
auraient,
en
effet,
conduit assez loin.
Dans le cadre de cette
brochure,
il nous a
paru beaucoup plus important
de
parler
de lestimation
statistique
en termes -disons-
philosophiques.
Cest dans la mesure
ou lon commence saisir la diffrence de nature existant entre les
techniques

prioristes
et les
techniques par
estimateur
que
lon commence devenir sta-
tisticien.
Des indications
prcdentes,
un certain nombre de conclusions dordre
pratique
doivent tre tires.
Il
est,
enpremier
lieu trs
clairque laprcision
dune estimation est dautant
meilleure,
cest--dire
que
lintervalle de confiance est dautant
rduit, que
limportance
de lchantillon est
grande.
Ltendue de lintervalle de confiance
est,
en
effet,
lie
la dispersion de
la distribution des f. Or,
par
dfinition,
cette
dispersion
diminue
quand
n
augmente.
Mais,
du mme
coup,
il devient aussi trs
clair
que,dans
le cadre des
prlvements (exhaustifs
ou assimilables des
prl,
vemente
exhaustifs) qui
sont la base de la
thorie,limportance
de la
population
initiale na rien voir laffaire.

On voit
encore,
dans bien des
entreprises
dcider de
limportance
du
prl-
vement en fonction de la taille du lot examin. Dans
la plupart
des
cas,
cest un
non-sens.
Il
y
a dautre
part
lieu de noter
que
la dcision
dappliquer
les
rgles
desti-
mation
par
intervalle de confiance
revient,
une fois le seuil 1- oc
choisi,

accepter
de se
tromper,
en
moyenne,
dans la
proportion
oc des cas. Cest en
effet, par
dfinition,
dans cette
proportion
oc des cas
que
lintervalle de confiance
4e
recouvre 1
pas
la vraie valeur c cherche.
Il devient alors vident
que,
la dtermination du seuil de
probabilit -
consi-
dr comme
ngligeable-nest pas statistique
mais
dpend
de la
plus
ou moins
grande gravit
des
consquences
des erreurs
possibles.
(1)
Nous
nexpliciterons pas, ici,
les calculs.

Anda mungkin juga menyukai