4me Sciences
I.
Mai 2010
A. LAATAOUI
Nuage de points
1. Introduction
Une srie statistique deux variables, X et Y, est le rsultat de lobservation des deux caractres X et Y pour
chaque individu dune population.
Lorsque les caractres sont quantitatifs , on peut associer, chaque individu i, un couple de nombres rels not
( xi , yi ) .
Exemple :
Le tableau suivant donne, en millions de dinars, le chiffre daffaires xi et la somme consacre aux dpenses de
publicit yi pour cinq entreprises :
Entreprises
xi
yi
30
55
4,5
60
20
1,5
50
-1
10
11
12
13
14
15
2. Dfinition
Dans un repre orthogonal du plan, le nuage de points associs la srie statistique deux variables, X et Y,
est lensemble des points M i de coordonnes ( xi , yi ) reprsentatifs de tous les individus i de la population.
3. Point moyen
1
www.espacemaths.com
1
1
1
X = ni xi , V ( X ) = ni ( xi - X ) = ni xi - X et s ( X ) = V ( X ) .
N i =1
N i =1
N i =1
. x1 , x2 ,......, xN dsignent les valeurs distinctes prises par la variable X si elle est discrte , ou les centres des
classes si la variable X est continue
. N est la taille de lchantillon
. Dans notre exemple ni = 1 , pour tout 1 i N
Entreprises
xi
yi
30
55
4,5
60
20
1,5
50
xi2
yi2
xi yi
Somme
X = ; V ( X ) = . ; s ( X ) =
Y = ; V (Y ) = . ; s (Y ) = .
Dfinition
Liaison entre deux caractres Mthode dajustement par les moindres carrs
1. Droite dajustement
Lorsque le nuage a tendance de saccumuler autour dune droite, alors on cherche une quation de la droite D
qui approche le mieux possible les points du nuage, cest ce quon appelle un ajustement linaire.
Cet ajustement est lie deux paramtres appels Covariance et Coefficient de corrlation linaire.
2. Covariance
Dfinition
Soit (X,Y) une srie statistique double caractres quantitatifs donns par des observations individuelles
( xi , yi ) o 1 i n , n tant leffectif de la population observe.
On appelle covariance de (X,Y) le rel not cov( X , Y ) dfini par : cov( X , Y ) =
encore cov( X , Y ) =
1
N
( x
-x
)( y - y ) ou
i
1
xi yi - x y .
N i
Remarque
Comme pour le calcul de la variance, la formule cov( X , Y ) =
1
xi yi - x y est souvent la plus simple
N i
www.espacemaths.com
cov( X , Y ) = cov(Y , X ) .
cov( X , X ) = V ( X ) .
cov 2 ( X , Y ) V ( X ) V (Y ) cov( X , Y ) s ( X ) s (Y ) .
Avec la calculatrice :
Pour programmer le tableau statistique de la page 1 :
. Choisir le mode de fonctionnement de statistique deux variables
MODE 3 Stat 1
. Entrer les couples xi
STO y j
M+
cov( X , Y )
.
s ( X ) s (Y )
Proprits
cov( X , Y ) s ( X ) s (Y ) 0
cov( X , Y )
s ( X ) s (Y )
1 -1 r 1
Si r
3
alors la corrlation linaire entre X et Y est forte. On peut trouver une droite approximative
2
liant X et Y.
Si r <
3
alors la corrlation linaire entre X et Y est faible. Il est inutile de chercher exprimer Y
2
4. Droites de rgression
Soient X et Y deux sries statistiques quantitatives non constantes et observes dans une population donne.
On suppose que le coefficient de corrlation r vrifie : r
3
alors il est possible dapprocher la liaison
2
( )
www.espacemaths.com
Exemple
1) Donner une quation de chacune des droites D et D.
a = ; b = .
D : .
a ' = ; b ' =
D ' : .
2) Tracer D et D dans le mme repre R.
3) Quelle estimation peut on faire quant la somme consacre aux dpenses de publicit pour une entreprise
ayant un chiffre daffaire gal 200 millions de dinars
Exercice
Le tableau ci-dessous donne lvolution de la dette des pays du tiers-monde entre
1978 et 1992 ( en milliards de dollars ).
Anne
1978
1982
1986
1990
1992
Rang de lanne xi
12
14
Dette yi
383
753
1089
1346
1510
1. Le plan est rapport un repre orthogonal. Reprsenter le nuage de points ( xi , yi ) , et le point moyen G
de cette srie.
2. a) Calculer le coefficient de corrlation linaire de cette srie double.
Un ajustement affine peut il tre envisag ? Pourquoi ?
b) Ecrire une quation de la droite de rgression D de Y en X. Tracer D.
c) Estimer, 1 milliard de dollars prs, le montant prvisible de la dette des
pays du tiers monde en 2010.
Remarque : il existe une autre mthode dajustement dite mthode de Mayer
( Voir paragraphe du livre page (106 Sc) ou page (217 Maths) )
Exercice :
Le tableau ci-dessous donne la consommation quotidienne Y en fuel dune chaudire ( en litres) en
fonction des relevs de temprature extrieure X
www.espacemaths.com
.
..
2) Retrouver cet ajustement par la mthode des moindres carrs
3) A quelle temprature, la consommation en fuel dpassera elle 100 litres par jour
III.
Distributions marginales
1. Construction dun tableau double entre :
Activit
Dans une population de 50 mnages on a observ les deux caractres quantitatifs discrets suivants :
X nombre denfants dans chaque mnage
Y nombre de pices du logement habit par chaque mnage
Les rsultats de ces observations sont consigns dans les tableaux suivants :
Numro
du mnage
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Nombre
Denfants
0
3
0
3
1
3
2
1
4
3
2
1
1
1
0
3
2
2
0
1
2
2
4
1
2
Nombre
De pices
1
3
2
2
1
3
2
2
2
2
1
4
2
3
1
3
2
3
2
2
3
2
3
2
3
Numro
du mnage
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Nombre
Denfants
4
2
2
2
3
1
1
4
2
2
3
0
4
0
4
2
3
5
1
3
5
2
2
3
2
Nombre
De pices
4
2
4
3
3
1
3
3
3
2
4
1
4
3
4
3
3
4
2
4
3
3
4
2
3
2) Les donnes prsentes dans le tableau prcdent tant nombreuses , on se propose, dans la suite , de les prsenter
sous une forme plus rduite et laide dun tableau double entre . Complter le tableau suivant :
www.espacemaths.com
Total
Total
50
ij
2. Distributions marginales :
Du tableau prcdent, on peut extraire deux sries statistiques une variable. La premire donne la rpartition
de 50 mnages selon le nombre denfants X dans chaque mnage et la seconde donne la rpartition de 50
mnages selon le nombre de pices Y du logement habit par chaque mnage.
On obtient alors les deux tableaux suivants :
Tableau 1 :
Nbre denfants X
Total
10
16
10
50
Nbre de pices Y
Total
16
19
50
Tableau 2 :
Chacun des tableaux 1 et 2 dfinit une srie statistique une variable, appele distribution marginale.
www.espacemaths.com
cov( X , Y ) =
1 p q
ni j xi - X
N i =1 j =1
cov( X , Y ) =
)( y
j -Y =
1
N
n x y
i =1 j =1
ij i
-X Y .
1 6 4
nij xi y j - XY
50 i =1 j =1
Cette formule parait complique, pour cela on considre le tableau suivant qui
nous facilite la tache
Y
1
Totaux
X
0
1
2
3
4
5
Totaux
www.espacemaths.com
Avec la calculatrice :
Pour programmer le tableau statistique double entre :
. Choisir le mode de fonctionnement de statistique deux variables MODE 3
. Entrer les triplets xi
Stat
[ 20,30[
[30, 40[
[ 40,50[
[50, 60[
60 ans et plus
]0,5[
[5,15[
[15, 25[
[ 25,35[
[35, 45[
15
50
90
80
25
10
45
60
50
20
30
40
35
12
40
35
25
20
15
20
45 et plus
15
10
10
Y
X
1989
1990
1991
1992
1993
1994
Rang de lanne x i
yi
591,3
106,7
96,5
63,2
21
9,4
1) On considre la srie statistique double ( x i , y i ) . Calculer le coefficient de corrlation entre x et y. Expliquer pourquoi
un ajustement linaire ne parat pas bien adapt
zi
Calculer le coefficient de corrlation de cette srie. Justifier lutilisation dun ajustement affine pour la srie
( xi , z i )
d) Dterminer lquation de la droite de rgression de z en x. Tracer cette droite dans le repre de la question 2) b)
3) On suppose que lvolution de cette population se poursuit sur le mme modle
a) A partir de quelle anne, cette population sera-t-elle strictement infrieure 1000 ?
b) Donner une estimation de la population de cette rivire en lan 2010.
8
www.espacemaths.com
20
25
0
5
8
20
30
7
30
25
X, Y, s X et s Y
xi ( Km / h )
27
43
62
80
98
115
yi ( distance d'arrt en m )
6,8
20,5
35,9
67,8
101,2
135,8
1) Dans un repre orthogonal , construire le nuage des points associs la srie statistique ( xi , yi ) .
2) a)
b)
c)
d)
e)
Calculez x , y , V ( X ) , V (Y ) et cov( X , Y ) .
Calculez le coefficient de corrlation linaire .
Dterminez et tracez la droite de rgression de y en x .
Dduire la valeur estime de x correspondante une distance d'arrt de 180 m .
Quelle est la distance d'arrt en mtre , correspondante une vitesse de 150 Km / h ?
Exercice n3 :
Ltude de la population dune ville a donn les rsultas suivants : h est le nombre dhabitants par milliers.
Anne
2001 2002 2003 2004 2005
Rang de lanne xi
1
2
3
4
5
Nombre dhabitants hi 24,5 27,38 31,205 36,125 37,845
rr
1. Reprsenter dans un repre orthonorm le nuage de points de la srie (x , h) dans un repre orthogonal R(O, i, j ) . Sur
laxe des abscisses placer 0 lorigine 1 cm reprsente 1
Sur laxe des ordonnes placer 20 lorigine 1 cm reprsente mille
2. a) Calculer le coefficient de corrlation linaire entre x et h
b) Justifier lutilisation dun ajustement affine pour la srie (x , h)
c) Dterminer lquation de la droite de rgression de h en x
3. On suppose que lvolution de cette population se poursuit sur le mme modle et que les
dpenses de la municipalit de cette ville en une anne en milliers des dinars not y obit
la loi : y = 10 hi + 200
a) Donner une estimation de la population de cette ville lanne 2010 ?
b) Donner une estimation des dpenses de cette municipalit lanne 2010
www.espacemaths.com
c) A partir de quelle anne les dpenses de cette municipalit dpasseront-elles les 300 milles dinars.
Exercice n4 :
Pour une srie ( xi , yi ) avec (1 i 15) deux variables , la mthode des moindres carrs a permit de trouver : Lquation de
la droite (D) de rgression de y par rapport x. D : y = 0,37 x + 12,59
Lquation de la droite (D) de rgression de x par rapport y . D ' : x = 0,9 y + 14, 07
1. Dterminer le coefficient de corrlation linaire de cette srie
2. Dterminer les coordonnes du point moyen G associ cette srie
15
3. On suppose que
15
xi yi et
i =1
15
y
i =1
2
i
Exercice n5 :
Le tableau suivant donne les rsultats obtenus partir de six essais de laboratoire concernant la charge de rupture dun
acier en fonction de sa teneur en carbone
Teneur en carbone X ( pour 10000)
60
62
64
68
70
74
Charge de rupture Y ( en Kg )
70
75
80
82
85
100
10
www.espacemaths.com