Anda di halaman 1dari 32

quipe de recherche en Ingnierie des Connaissances

Laboratoire ERIC
1
Caractriser la liaison entre deux variables X et Y
Ricco Rakotomalala
Ricco.Rakotomalala@univ-lyon2.fr
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
2
Position du problme
X et Y sont deux grandeurs statistiques quantitatives, on
souhaite :
dterminer lexistence dune relation (liaison) entre X et Y ;
caractriser la forme de le relation ;
quantifier lintensit de la liaison si elle existe.
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
3
quantifier lintensit de la liaison si elle existe.
Remarque : la osition des varia!les est s"mtrique, on ne
cherche as # savoir si lune dtermine lautre ou as (ce sera
le r$le de la rgression)
Analyse graphique
%eux oints de vue :
en termes dvolution (quand
X augmente, Y augmente ou
diminue ; quelques mots cls :
monotonie, linarit, sens &'()
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
4
monotonie, linarit, sens &'()
en termes de ositionnement
(quand X est lev, Y est lev
ou fai!le ; lev ar raort #
quoi ))
Notations
*aria!le : +ote en ma,uscule (X est une varia!le)
*aleur : *aleur mesure che- un individu i (x
i
) ou # la date t (x
t
)
.oulation : /
o
0chantillon o!serv : / (fraction de la oulation)
1aille de lchantillon : n 2 card(/)
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
5
1aille de lchantillon : n 2 card(/)
.our la corrlation : coules de oints / 2 3(x
i
,"
i
), i24,5,n6
%eux indicateurs usuels

=
=
n
i
i
x
n
x
1
1
( )

=
=
n
i
i x
x x
n
s
1
2
2
1
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
6
Covariance : dfinition, interprtation
%finition :
[ ] ( ) [ ] ( ) { }
[ ] [ ] [ ] Y E X E XY E
Y E Y X E X E Y X COV
=
= ) , (
0srance du roduit des varia!les centres
7esurer la tendance des deux varia!les # 8tre simultanment au
dessus ou en dessous de leurs esrances resectives.
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
7
9ignification :
dessus ou en dessous de leurs esrances resectives.
:a rfrence est lesrance mathmatique des varia!les
(mo"enne)
;aractrise les liaisons monotones et linaires
<ournit une indication sur le sens de la liaison :
;=*(X,Y) > ?, liaison ositive ; ;=*(X,Y) @ ?,liaison ngative
0t sur son intensit : lus A;=*A est lev, lus forte est la liaison
;=*(X,X) 2 *(X)
Covariance : proprits
Symtrie : ;=*(X,Y) 2 ;=*(Y,X)
Distributivit : ;=*(X,Y&B) 2 ;=*(X,Y) & ;=*(X,B)
Covariance avec une constante : ;=*(X,a) 2 ?
Covariance avec une variable transforme : ;=*(X,a&!.Y) 2 !.;=*(X,Y)
Variance de la somme de 2 variables : *(X&Y) 2 *(X) & *(Y) & C.;=*(X,Y)
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
8
Variance de la somme de 2 variables : *(X&Y) 2 *(X) & *(Y) & C.;=*(X,Y)
Covariance de deux variables indpendantes : ;=*(X,Y) 2 ?
Dmonstrations faire en exercice par la suite.
%omaine de dfinition : ( @ ;=* @ &
0lle est non normalise DDD
Covariance : estimation sur un chantillon
;ovariance emirique :
( )( )

=
=
n
i
i i xy
y y x x
n
S
1
1
[ ] ) , (
1
Y X COV
n
n
S E
xy

= ;est un estimateur !iais :


quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
9
0criture simlifie :

=
=
n
i
i i xy
y x y x
n
S
1
.
1
0stimateur corrig (sans !iais) :
xy
S
n
n
Y X V O C
1
) , (

= Jamais utilis
Covariance : estimation sous Excel
Numero Modele Cylindree Puissance XY
1 Daihatsu Cuore 846 32 27072
2 Suzuki Swift 1.0 GLS 993 39 38727
3 Fiat Panda Mambo L 899 29 26071
4 VW Polo 1.4 60 1390 44 61160
5 Opel Corsa 1.2i Eco 1195 33 39435
6 Subaru Vivio 4WD 658 32 21056
7 Toyota Corolla 1331 55 73205 Cov.Empirique 18381.4133
8 Opel Astra 1.6i 16V 1597 74 118178 Cov.Non-Biais 19062.2063
9 Peugeot 306 XS 108 1761 74 130314
10 Renault Safrane 2.2. V 2165 101 218665
11 Seat Ibiza 2.0 GTI 1983 85 168555 Cov.Excel 18381.4133
12 VW Golt 2.0 GTI 1984 85 168640
13 Citroen ZX Volcane 1998 89 177822
14 Fiat Tempra 1.6 Liberty 1580 65 102700
15 Fort Escort 1.4i PT 1390 54 75060
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
10
15 Fort Escort 1.4i PT 1390 54 75060
16 Honda Civic Joker 1.4 1396 66 92136
17 Volvo 850 2.5 2435 106 258110
18 Ford Fiesta 1.2 Zetec 1242 55 68310
19 Hyundai Sonata 3000 2972 107 318004
20 Lancia K 3.0 LS 2958 150 443700
21 Mazda Hachtback V 2497 122 304634
22 Mitsubishi Galant 1998 66 131868
23 Opel Omega 2.5i V6 2496 125 312000
24 Peugeot 806 2.0 1998 89 177822
25 Nissan Primera 2.0 1997 92 183724
26 Seat Alhambra 2.0 1984 85 168640
27 Toyota Previa salon 2438 97 236486
28 Volvo 960 Kombi aut 2473 125 309125
n Somme
28 1809.07 77.71 4451219
Moyenne
Coefficient de corrlation de Pearson (Bravais-Pearson)
%finition :
y x
xy
Y X COV
Y V X V
Y X COV
r
.
) , (
) ( ). (
) , (
= =
+ormalisation de la covariance ar le roduit des carts t"e.
.remiEre consquence : domaine de dfinition 1 1 +
xy
r
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
11
;ommentaires :
7esure lintensit de la liaison monotone linaire entre C varia!les
(X,Y) indendants r 2 ? (la rciroque est en gnral fausse)
;orrlation dune varia!le avec elle(m8me : r
xx
2 4
;orrlation 2 ;ovariance our les varia!les rduites 2 0srance du
roduit des varia!les centres et rduites
Corrlation :
quelques exemples
Notions voir :
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
12
Notions voir :
monotonie, linarit,
absence de liaison
Pourquoi le calcul nest
pas possible ici ?
Corrlation : estimation sur un chantillon
y x
xy
s s
S
r
.

=
;orrlation
emirique :
;est un estimateur
as"mtotiquement !iais
[ ]
n
r r
r r E
2
) 1 (

=
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
13
Fn estimateur non !iais
:e !iais est trEs fai!le dEs que n augmente5
( )
2

1
2
1
1

r
n
n
r
aj

=
Trs peu utilis en pratique, la correction est
trs minime, ngligeable ds que n augmente
Corrlation : un exemple sous Excel
Numero Modele Cylindree Puissance XY X Y
1 Daihatsu Cuore 846 32 27072 715716 1024
2 Suzuki Swift 1.0 GLS 993 39 38727 986049 1521
3 Fiat Panda Mambo L 899 29 26071 808201 841
4 VW Polo 1.4 60 1390 44 61160 1932100 1936
5 Opel Corsa 1.2i Eco 1195 33 39435 1428025 1089
6 Subaru Vivio 4WD 658 32 21056 432964 1024
7 Toyota Corolla 1331 55 73205 1771561 3025
8 Opel Astra 1.6i 16V 1597 74 118178 2550409 5476
9 Peugeot 306 XS 108 1761 74 130314 3101121 5476
10 Renault Safrane 2.2. V 2165 101 218665 4687225 10201
11 Seat Ibiza 2.0 GTI 1983 85 168555 3932289 7225
12 VW Golt 2.0 GTI 1984 85 168640 3936256 7225
13 Citroen ZX Volcane 1998 89 177822 3992004 7921
14 Fiat Tempra 1.6 Liberty 1580 65 102700 2496400 4225
15 Fort Escort 1.4i PT 1390 54 75060 1932100 2916
16 Honda Civic Joker 1.4 1396 66 92136 1948816 4356
17 Volvo 850 2.5 2435 106 258110 5929225 11236
( )( )
( ) ( )
2 2 2 2
2 2

y x n y x
y y x x
y y x x
r
i
i i
i
i
i
i
i
i i

=


=




quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
14
17 Volvo 850 2.5 2435 106 258110 5929225 11236
18 Ford Fiesta 1.2 Zetec 1242 55 68310 1542564 3025
19 Hyundai Sonata 3000 2972 107 318004 8832784 11449
20 Lancia K 3.0 LS 2958 150 443700 8749764 22500
21 Mazda Hachtback V 2497 122 304634 6235009 14884
22 Mitsubishi Galant 1998 66 131868 3992004 4356
23 Opel Omega 2.5i V6 2496 125 312000 6230016 15625
24 Peugeot 806 2.0 1998 89 177822 3992004 7921
25 Nissan Primera 2.0 1997 92 183724 3988009 8464
26 Seat Alhambra 2.0 1984 85 168640 3936256 7225
27 Toyota Previa salon 2438 97 236486 5943844 9409
28 Volvo 960 Kombi aut 2473 125 309125 6115729 15625
n
28 1809.07 77.71 4451219 102138444 197200
Numrateur 514679.571
Dnominateur 543169.291
Corrlation 0.9475
Coef.Corr.Excel 0.9475
Moyenne Somme
2 2 2 2
y n y x n x
i
i
i
i

=

Corrlation : analyse graphique
40
60
80
100
120
140
160
P
u
i
s
s
a
n
c
e
Lien "Cylindre - Puissance"
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
15
Fn indicateur numrique ne fait as tout, lanal"se grahique est un comlment
indisensa!le (ex. our rerer les situations at"iques, insolites)
0
20
0 500 1000 1500 2000 2500 3000 3500
Cylindre
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
16
Test de significativit

=
0 :
0 :
1
0
r H
r H
1ester lexistence dun lien
linaire entre X et Y
Gttention : (X,Y) indendants r 2 ? ; mais r 2
? ne veut as dire que (X,Y) indendants, ils ne
sont as lis linairement simlement DDD
;omment rocder )
rH
Ngligeable ?
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
17
;omment rocder )
=n disose dune estimation de r (rH).
=n cherche # savoir si rH sloigne significatiement de ?.
.our dfinir les I seuils J autour de ?, on fixe (contr$le) la
ro!a!ilit de conclure # tort K 2 .(Re,eter L? au vu de rH '
en ralit L? est vrai c.(#(d. r 2 ?) seuil critique : r
K
.ro!lEme : il faut connaMtre la loi de distri!ution de rH
quand L? est vrai
r 2 ? (4 &4
r 2 ?
(4 &4 ( r
K
& r
K
Rgion critique : re,et de L?
Rgion daccetation : accetation de L?
Test de significativit Test de Student
Nde : 9ous L?, on ne connaMt as la loi de rH, en
revanche on connaMt celle dune transformation de rH
) 2 (
2
1

= n
n
r
r
t

2 / 1 0
ssi ) 0 ( Rejeter
ssi ) 0 ( H Accepter


< =
t t r H
t t r
:a rEgle de dcision devient :
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
18
2 / 1 0
ssi ) 0 ( Rejeter

t t r H
Remarque :
9ouvent les logiciels fournissent la (value (ro!a!ilit critique)
:a loi de 9tudent nest vala!le que dans le voisinage (r 2 ?), on ne
eut donc as lutiliser our les autres tests de conformit (L? : r 2 a)
oO (a P ?) et our le calcul des intervalles de conQance.
Test de significativit Un exemple
+umero 7odele ;"lindree .uissance
4 %aihatsu ;uore RST UC
C 9u-uVi 9Wift 4.? X:9 YYU UY
U <iat .anda 7am!o : RYY CY rH ?.YSZ[
S *\ .olo 4.S T? 4UY? SS n CR
[ =el ;orsa 4.Ci 0co 44Y[ UU ddl (n(C) CT
T 9u!aru *ivio S\% T[R UC
Z 1o"ota ;orolla 4UU4 [[
R =el Gstra 4.Ti 4T* 4[YZ ZS t 4[.44Z4
Y .eugeot U?T X9 4?R 4ZT4 ZS t(thorique ([]) C.?[[[
4? Renault 9afrane C.C. * C4T[ 4?4 (value C.4SR4T0(4S
44 9eat N!i-a C.? X1N 4YRU R[
4C *\ Xolt C.? X1N 4YRS R[
4U ;itroen BX *olcane 4YYR RY
4S <iat 1emra 4.T :i!ert" 4[R? T[
Test de significativit
1171 . 15
2 28
9475 . 0 1
9475 . 0
2
1

2 2
=

=
n
r
r
t
0555 . 2 ) 26 ( ) 2 (
975 . 0
2
1
= =

t n t

quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
19
4S <iat 1emra 4.T :i!ert" 4[R? T[
4[ <ort 0scort 4.Si .1 4UY? [S
4T Londa ;ivic ^oVer 4.S 4UYT TT
4Z *olvo R[? C.[ CSU[ 4?T
4R <ord <iesta 4.C Betec 4CSC [[
4Y L"undai 9onata U??? CYZC 4?Z
C? :ancia _ U.? :9 CY[R 4[?
C4 7a-da Lacht!acV * CSYZ 4CC
CC 7itsu!ishi Xalant 4YYR TT
CU =el =mega C.[i *T CSYT 4C[
CS .eugeot R?T C.? 4YYR RY
C[ +issan .rimera C.? 4YYZ YC
CT 9eat Glham!ra C.? 4YRS R[
CZ 1o"ota .revia salon CSUR YZ
CR *olvo YT? _om!i aut CSZU 4C[
;onclusion : =n re,ette lh"othEse
nulle (r 2 ?). ;ette h"othEse nest
as comati!le avec les donnes
au risque K 2 []
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
20
Intervalle de confiance
.ro!lEme : rH est un estimateur qui dend de lchantillon, on dit quil est soumis aux fluctuations
dchantillonnage (avec dautres donnes, on aura un rsultat ` lgErement ` diffrent).
9olution : %terminer un intervalle qui a une ro!a!ilit de (4 ` K) de contenir la I vraie J valeur de r.
(4 ` K) est le niveau de confiance, lintervalle ainsi dfinit est lintervalle de confiance.
.our " rondre, il faut connaMtre la loi de distri!ution de rH (quelle que soit la vraie valeur de r), et
disoser (ou ouvoir estimer) des aramEtres de la loi.
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
21
:a loi de 9tudent ne convient lus, elle nest vala!le que si I r 2 ? J
=n ne disose (tou,ours) as de la loi de
rH, on asse ar une autre transformation
:a I transformation de <isher J.
r
r
z
1
1
ln
2
1

+
=
-H suit une loi normale (quelle
que soit la valeur de r)
Gvec :
[ ]
[ ]
3
1

1
1
ln
2
1

n
z V
r
r
z E
Intervalle de confiance : Calcul pratique
0taes :
4. ;alculer rH
C. .asser # la transformation -H
U. ;alculer les !ornes de lintervalle de
confiance de -H au niveau de
confiance (4(K)
S. Ramener ces !ornes dfinies our
+umero 7odele ;"lindree .uissance
4 %aihatsu ;uore RST UC
C 9u-uVi 9Wift 4.? X:9 YYU UY rH ?.YSZ[
U <iat .anda 7am!o : RYY CY n CR
S *\ .olo 4.S T? 4UY? SS
[ =el ;orsa 4.Ci 0co 44Y[ UU
T 9u!aru *ivio S\% T[R UC - 4.R?ZC
Z 1o"ota ;orolla 4UU4 [[ *ariance(-) ?.?S??
R =el Gstra 4.Ti 4T* 4[YZ ZS 0cart t"e(-) ?.C???
Y .eugeot U?T X9 4?R 4ZT4 ZS
4? Renault 9afrane C.C. * C4T[ 4?4
44 9eat N!i-a C.? X1N 4YRU R[
4C *\ Xolt C.? X1N 4YRS R[ u(?.YZ[) 4.YT??
4U ;itroen BX *olcane 4YYR RY
4S <iat 1emra 4.T :i!ert" 4[R? T[
Calcul de z
Quantile 0.97 ! "oi normale
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
22
S. Ramener ces !ornes dfinies our
-H # des !ornes our rH (en
utilisant la fonction inverse de la
transformation de <isher)
4S <iat 1emra 4.T :i!ert" 4[R? T[
4[ <ort 0scort 4.Si .1 4UY? [S
4T Londa ;ivic ^oVer 4.S 4UYT TT
4Z *olvo R[? C.[ CSU[ 4?T
4R <ord <iesta 4.C Betec 4CSC [[ !!(-) 4.S4[C
4Y L"undai 9onata U??? CYZC 4?Z !h(-) C.4YYC
C? :ancia _ U.? :9 CY[R 4[?
C4 7a-da Lacht!acV * CSYZ 4CC
CC 7itsu!ishi Xalant 4YYR TT
CU =el =mega C.[i *T CSYT 4C[
CS .eugeot R?T C.? 4YYR RY !!(r) ?.RRRT
C[ +issan .rimera C.? 4YYZ YC !h(r) ?.YZ[Z
CT 9eat Glham!ra C.? 4YRS R[
CZ 1o"ota .revia salon CSUR YZ
CR *olvo YT? _om!i aut CSZU 4C[
#ntervalle de conf. pour $%
#ntervalle de conf. pour r%
;onclusion : il " a Y[] de chances que
lintervalle (?.RRRT ; ?.YZ[Z) couvre la
I vraie J valeur de r.
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
23
Liaison non linaire Transformation de variables
.
.
.
.
..
.
.
.
Y X X
9.31 -3 9
4.14 -2 4
1.04 -1 1
0.45 0 0
1.47 1 1
4.82 2 4
9.42 3 9
:inarisation ar
transformation de varia!les
(ex. B 2 Xa)
:iaison non linaire, et non
monotone
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
24
.
..
.
Corrlation (Y,X) 0.04369908
Corrlation (Y,X) 0.99772156
.ro!lEme : comment deviner la !onne
transformation ) 0lle nest as tou,ours
aussi vidente5
Liaison non linaire Passage par les rangs
0.00
2.00
4.00
6.00
8.00
10.00
12.00
:iaison non linaire, mais monotone
X Y RX RY
1.00 3.00 1 1
1.10 6.80 2 2
1.25 8.30 3 3
1.50 9.30 4 4
2.00 9.81 5 6
2.25 9.78 6 5
Corrlation (XY) 0.77588403 0.94285714
1ransformation des donnes en rangs
;oefficient de .earson calcul sur les
rangs 2 I coefficient de 9earman J
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
25
0.00
0.00 0.50 1.00 1.50 2.00 2.50
rangs 2 I coefficient de 9earman J
1oute la artie infrentielle (test
dh"othEses, intervalle de confiance)
reste vala!le
7ais as !on our les liaisons non
monotones

age rang moyen rang alatoire
15 4 5
18 7 7
12 1 1
13 2 2
15 4 3
16 6 6
15 4 4
0n cas dex(aequo :
rangs alatoires (simle)
rangs mo"ens (ncessite lus de calculs, mais lus rcis)
Problme des points atypiques
0.00
1.00
2.00
3.00
4.00
5.00
6.00
7.00
8.00
9.00
10.00
0.00 2.00 4.00 6.00 8.00 10.00
X Y
1 0.30 0.70
2 0.35 0.65
3 0.54 0.37
4 0.28 0.54
5 0.21 0.83
6 0.03 0.31
7 9.34 9.67
r (6 points) 0.0185
r (7 points) 0.9976
:e coefficient de corrlation de .earson
est trEs sensi!le aux oints at"iques
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
26
0.00 2.00 4.00 6.00 8.00 10.00
r (7 points) 0.9976
X Y RX RY
1 0.30 0.70 4 5
2 0.35 0.65 5 4
3 0.54 0.37 6 2
4 0.28 0.54 3 3
5 0.21 0.83 2 6
6 0.03 0.31 1 1
7 9.34 9.67 7 7
Coef. Rangs0.39285714
:e coefficient calcul sur les rangs
(coefficient de 9earman) est moins
sensi!le aux oints a!errants ` .arce
quil I lisse J les valeurs.
.assage aux rangs
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
27
Corrlations suspectes
4.00
5.00
6.00
7.00
8.00
L
o
n
g
u
e
u
r

d
e
s

c
h
e
v
e
u
x
Liaison "taille et longueur des cheveux"
bui eut croire quil " a un lien
entre la taille des ersonnes (X) et
la longueur des cheveux (Y) )
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
28
0.00
1.00
2.00
3.00
1.40 1.50 1.60 1.70 1.80 1.90
L
o
n
g
u
e
u
r

d
e
s

c
h
e
v
e
u
x
Taille
Nl " a screment une tierce varia!le (B)
qui Ese simultanment sur X et Y.
0t, de fait, la relation entre Y et X est
essentiellement dtermine ar B.
Cas particulier : Z est binaire
Cheveux (cm) Taille (m)
1 1.64 1.65
2 0.32 1.74
3 1.00 1.76
4 2.80 1.71
5 4.35 1.81
6 2.33 1.71
7 0.01 1.78
8 1.75 1.69
9 3.22 1.77
10 3.53 1.65
11 2.55 1.61
12 3.08 1.77
13 0.46 1.73
14 3.22 1.69
15 2.19 1.75
16 0.73 1.87
17 0.16 1.74
18 0.90 1.69
19 4.14 1.78
20 1.61 1.73
H
o
m
m
e
s
3.00
4.00
5.00
6.00
7.00
8.00
L
o
n
g
u
e
u
r

d
e
s

c
h
e
v
e
u
x
Liaison "taille et longueur des cheveux"
Hommes Femmes
:a corrlation est
essentiellement dfinie
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
29
20 1.61 1.73
1 4.66 1.70
2 3.25 1.54
3 3.88 1.63
4 2.84 1.63
5 4.88 1.44
6 3.77 1.68
7 5.64 1.64
8 4.41 1.63
9 3.84 1.54
10 7.58 1.54
11 7.51 1.62
12 6.90 1.58
13 4.76 1.56
14 6.70 1.50
15 7.86 1.62
r (hommes) -0.074
r (femmes) -0.141
r (global) -0.602
F
e
m
m
e
s
0.00
1.00
2.00
1.40 1.50 1.60 1.70 1.80 1.90
L
o
n
g
u
e
u
r

d
e
s

c
h
e
v
e
u
x
Taille
essentiellement dfinie
ar le dcalage entre
les nuages de oints.
:es corrlations intra(
nuages sont nulles.
Corrlation partielle (Z quantitative galement)
;oefficient de corrlation artielle
(corrlation entre X et Y, en
contr$lant leffet de B)
) 1 ( ) 1 (
2 2
.
yz xz
yz xz xy
z xy
r r
r r r
r


=
;orrlation !rute (", x)
=n retranche leffet de
- sur x et sur "
+ormalisation our
que (4 d r
x".-
d &4
0stimation : il faut utiliser
les estimations des

2 2
.
yz xz xy
z xy
r r r
r


=
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
30
les estimations des
corrlations !rutes
) 1 ( ) 1 (

2 2
.
yz xz
z xy
r r
r

=
;orrlation artielle
dordre ( >4) : formule
de rcurrence
) 1 ( ) 1 (
2
.
2
.
. . .
.
z yw z xw
z yw z xw z xy
zw xy
r r
r r r
r


=
2 C ici, on utilise
un calcul de roche
en roche
Corrlation partielle Infrence statistique
(Noter les degrs de libert)
X Y Z
Numero Modele Puissance Conso Cylindree n 28
1 Daihatsu Cuore 32 5.7 846
2 Suzuki Swif t 1.0 GLS 39 5.8 993
3 Fiat Panda Mambo L 29 6.1 899 Puissance Conso 0.88781
4 VW Polo 1.4 60 44 6.5 1390 Puissance Cylindre 0.94755
5 Opel Corsa 1.2i Eco 33 6.8 1195 Conso Cylindre 0.89187
6 Subaru Vivio 4WD 32 6.8 658
7 Toyota Corolla 55 7.1 1331
8 Opel Astra 1.6i 16V 74 7.4 1597 r_xy.z 0.29553
9 Peugeot 306 XS 108 74 9.0 1761
10 Renault Saf rane 2.2. V 101 11.7 2165
11 Seat Ibiza 2.0 GTI 85 9.5 1983 Test de significativit
Corrlations brutes
Corrlation partielle
2955 . 0
) 8919 . 0 1 ( ) 9475 . 0 1 (
8919 . 0 9475 . 0 8878 . 0

2 2
.
=


=
z xy
r
) 2 (
2
1

2
.
.

= p n
p n
r
r
t
z xy
z xy
1est de significativit
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
31
11 Seat Ibiza 2.0 GTI 85 9.5 1983
12 VW Golt 2.0 GTI 85 9.5 1984 t 1.54673
13 Citroen ZX Volcane 89 8.8 1998 t(0.975 ; 25) 2.38461
14 Fiat Tempra 1.6 Liberty 65 9.3 1580
15 Fort Escort 1.4i PT 54 8.6 1390 p-value 0.13450
16 Honda Civic Joker 1.4 66 7.7 1396
17 Volvo 850 2.5 106 10.8 2435
18 Ford Fiesta 1.2 Zetec 55 6.6 1242
19 Hyundai Sonata 3000 107 11.7 2972 f 0.30461
20 Lancia K 3.0 LS 150 11.9 2958
21 Mazda Hachtback V 122 10.8 2497 e.t. 0.20000
22 Mitsubishi Galant 66 7.6 1998 u(0.975) 1.95996
23 Opel Omega 2.5i V6 125 11.3 2496
24 Peugeot 806 2.0 89 10.8 1998 bb(f) -0.08738
25 Nissan Primera 2.0 92 9.2 1997 bh(f) 0.69661
26 Seat Alhambra 2.0 85 11.6 1984
27 Toyota Previa salon 97 12.8 2438 bb ( r) -0.08716
28 Volvo 960 Kombi aut 125 12.7 2473 bh ( r) 0.60221
Test de significativit
Intervalle de confiance 95%
Nntervalle de ;onfiance
(via la transformation de <isher)
r
r
z
1
1
ln
2
1

+
=
[ ]
[ ]
2
1

1
1
ln
2
1

p n
z V
r
r
z E
qui suit une loi normale de aramEtres5
Bibliographique
R. Bourbonnais ! "conomtrie # $unod %&&'.
Y.$od(e ).Rousson ! *nalyse de r(ression a++li,ue # $unod 2--..
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
32
Y.$od(e ).Rousson ! *nalyse de r(ression a++li,ue # $unod 2--..
/. 0enen1aus ! 2tatisti,ue 3 /t1odes +our dcrire ex+li,uer et
+rvoir # $unod 2--4.