Anda di halaman 1dari 11

Universit Lyon 2

Laboratoire ERIC
1
Ricco RAKOTOMALALA
Rgression Linaire Multiple
Universit Lyon 2
Laboratoire ERIC
2
PLAN
1. Changements structurels
2. Test de Chow Principe
3. Stabilit de la constante
4. Stabilit de la pente
Universit Lyon 2
Laboratoire ERIC
3
Changements structurels
Donnes longitudinales
Principe : La relation entre lendogne et les exognes est modifie au cours du
temps, partir dune date donne. La rgression sur lensemble de la priode est
diffrente de la rgression sur les sous-priodes.
Ex. Niveau de production au cours du temps.
Mutation technologique
(Acclration de la production)
Modification de la pente
Crise, guerre, accidents
(Recul, puis poursuite avec la mme pente)
Modification de lorigine
Universit Lyon 2
Laboratoire ERIC
4
Changements structurels
Donnes transversales
Principe : Vrifier que la rgression est la mme dans des sous-parties de
lchantillon. Soit parce la relation est non-linaire (point dinflexion), soit parce
quelles correspondent des sous-populations diffrentes.
Relation non-linaire ou
linaire par morceaux.
Problme : comment deviner ces points
dinflexion dans une rgression multiple ?
Souvent sen tenir des techniques graphiques
simples (cf. les rsidus partiels : rsidus + aj x Xj
[ordonne] vs. Xj [abscisse])
Rgression sur 2 populations.
Problme : comment dtecter lexistence de
sous populations ?
Connaissances experte
Sappuyer sur des variables disponibles (utilises ou
non dans la rgression)
Universit Lyon 2
Laboratoire ERIC
5
Tester les changements structurels Test de Chow
Principe de la rgression contrainte vs. Rgressions non-contraintes
Principe : (1) Rgression contrainte = rgression sur lensemble de lchantillon SCR ; (2)
Rgressions non-contraintes = rgressions sur les deux sous-chantillons dfinies sur les
populations (ou sur les dates) SCR1 et SCR2
Par construction :
2 1
SCR SCR SCR +
SCR = SCR1 + SCR2 si les rgressions
sont exactement les mmes
SCR >> SCR1 + SCR2 mesure que
les rgressions diffrent
Principe : Le test de Chow est aussi un test dhypothses

+ = + + + + =
= + + + + =
= + + + + =
.] [ ) , , 1 (
) , , 1 (
) 2 (
) , , 1 ( ) 1 (
2 1 2 , , 2 , 1 , 2 , 1 2 , 0
1 1 , , 1 , 1 , 1 , 1 1 , 0
, 1 , 1 0
obs n n n i x a x a a y
n i x a x a a y
n i x a x a a y
i p i p i i
i p i p i i
i p i p i i
K L
K L
K L

Les rgressions comparer


|
|
|
|
|

\
|
=
|
|
|
|
|

\
|
=
|
|
|
|
|

\
|
2 ,
2 , 1
2 , 0
1 ,
1 , 1
1 , 0
1
0
0
:
p p
p
a
a
a
a
a
a
a
a
a
H
M M
M
Statistique du test :
[ ]
( )
d n
d 2 1
n 2 1
ddl , ddl
ddl ) (
ddl ) (
F
SCR SCR
SCR SCR SCR
F
+
+
=
Rgion critique (au risque ) :
( )
d n 1
ddl , ddl

> F F
[ ]
1
) 1 ( ) 1 ( 1 ddl
) 1 ( 2
2 2 ) 1 ( ) 1 ( ddl
2 1 n
2 1 d
+ =
+ =
+ =
= + =
p
p n p n ) (n-p-
p n
p n p n p n
Plus que les valeurs gnriques, cest la
dmarche quil faut retenir. On y reviendra
pour tester des configurations particulires
Comment calculer les d.d.l. ?
Universit Lyon 2
Laboratoire ERIC
6
Test de Chow
Un exemple
Tester si les rgressions sont globalement identiques sur les 2 sous-priodes
91 . 5
11
16 . 3
2
40 . 3
= = F
comparer avec 3.98 pour un test 5%
Le rsultat est cohrent avec la p-value
Au risque 5%, on conclut que les rgressions (le lien
entre Y et X) sont diffrentes sur les 2 sous-priodes.
Universit Lyon 2
Laboratoire ERIC
7
Dtecter la nature de la rupture
Tester la stabilit de la constante
Principe : Dtecter si, sur les 2 sous-priodes (sous-populations), la constante de la rgression est la mme.
Rg. Contrainte : Rgression normale sur tous les points (SCR)
Rg. Non-Contrainte : Rgression avec 2 constantes , une pour chaque sous-priode (SCR3)
) , , 1 ( ) 2 (
) , , 1 ( ) 1 (
1 , , 1 , 1 , 1 , 1 2 , 2 , 0 1 , 1 , 0
, 1 , 1 0
n i x a x a d a d a y
n i x a x a a y
i p i p i i i i
i p i p i i
K L
K L
= + + + + + =
= + + + + =

Pourquoi pas 2 rgressions distinctes pour (2) ?


Pourquoi ne pas mettre de constante dans la rgression (2) ?
Un test de comparaison entre a
0,1
et a
0,2
dans (2) aurait fait laffaire aussi.

+ =
=
=

+ =
=
=
n n i
n i
d
n n i
n i
d
i
i
, , 1 , 1
, , 1 , 0
, , 1 , 0
, , 1 , 1
1
1
2 ,
1
1
1 ,
K
K
K
K
avec
12 3 15 ddl
1 12 ) 2 15 ( ddl
d
n
= =
= =
D.D.L.
54 . 10
/
/ ) (
3
3
=

=
d
n
ddl SCR
ddl SCR SCR
F
Statistique F
La constante nest
pas la mme dans
les 2 rgressions !
Universit Lyon 2
Laboratoire ERIC
8
Dtecter la nature de la rupture
Stabilit de la pente sur une variable : une formulation errone
Principe : Dtecter si, sur les 2 sous-priodes (sous-populations), le coefficient
dune des variables de la rgression est le mme.
Rg. Contrainte : Rgression normale sur tous les points (SCR)
Rg. Non-Contrainte : Rgression avec la variable scinde en 2 parties, une
pour chaque sous-priode c.--d.

+ =
=
=

+ =
=
=
n n i x
n i
z
n n i
n i x
z
i
i
i
i
, , 1 ,
, , 1 , 0
, , 1 , 0
, , 1 ,
1 1 ,
1
2 ,
1
1 1 ,
1 ,
K
K
K
K
) , , 1 ( ) 2 (
) , , 1 ( ) 1 (
, 2 , 2 2 , 2 , 1 1 , 1 , 1 0
, 2 , 2 1 , 1 0
n i x b x b z b z b b y
n i x a x a x a a y
i p i p i i i i
i p i p i i i
K L
K L
= + + + + + + =
= + + + + + =

On opposerait ainsi
Mais ce nest pas une bonne approche !
Un changement de pente entrane
forcment un changement dorigine
Forcer lgalit de lorigine dans les deux
sous-parties fausse lapprciation de la pente
Universit Lyon 2
Laboratoire ERIC
9
Dtecter la nature de la rupture
Stabilit de la pente sur une variable : la formulation correcte
Principe : Dtecter si, sur les 2 sous-priodes (sous-populations), le coefficient dune des variables de la
rgression est le mme. Il faut relcher la contrainte dgalit de constante dans le modle de rfrence.
Rg. Contrainte : Rgression avec constantes diffrentes sur les 2 sous-priodes (SCR3)
Rg. Non-Contrainte : En plus, la variable est scinde en 2 parties pour chaque sous-priode (SCR4)
) , , 1 ( ) 2 (
) , , 1 ( ) 1 (
, 2 , 2 2 , 2 , 1 1 , 1 , 1 2 , 2 , 0 1 , 1 , 0
, 2 , 2 1 , 1 2 , 2 , 0 1 , 1 , 0
n i x b x b z b z b d b d b y
n i x a x a x a d a d a y
i p i p i i i i i i
i p i p i i i i i
K L
K L
= + + + + + + + =
= + + + + + + =

On oppose donc
11 4 15 ddl
1 11 ) 3 15 ( ddl
d
n
= =
= =
D.D.L.
15 . 1
/
/ ) (
4
4 3
=

=
d
n
ddl SCR
ddl SCR SCR
F
Statistique F
La pente est la mme
dans les 2 rgressions !
Universit Lyon 2
Laboratoire ERIC
10
Conclusion
Assez facile mettre en uvre pour les donnes longitudinales.
Plus difficile apprhender pour les donnes transversales.
Dtecter des ruptures de structures est primordial pour viter les
interprtations infondes.
Attention la tentation de la recherche systmatique. En
programmant des procdures testant toutes les ventualits par
exemple. A force de chercher, on finit toujours par trouver quelque
chose de significatif. Ici aussi, linterprtation conomique (lexpertise
du domaine) est absolument ncessaire pour valider les rsultats.
Le principe du test repose sur une opposition entre rgression
contrainte (pas de rupture) et une rgression non-contrainte
(intgrant la rupture).
Universit Lyon 2
Laboratoire ERIC
11
Bibliographie
Ouvrages
M. Tenenhaus, Statistique Mthodes pour dcrire, expliquer et prvoir , Dunod, 2006.
R. Bourbonnais, Economtrie Manuel et exercices corrigs , Dunod, 1998.
Y. Dodge, V. Rousson, Analyse de rgression applique , Dunod, 2004.
En ligne
R. Rakotomalala, Pratique de la Rgression Linaire Multiple Diagnostic et
slection de variables . Support de cours.
http://eric.univ-lyon2.fr/~ricco/cours/cours/La_regression_dans_la_pratique.pdf
R. Rakotomalala. Portail.
http://eric.univ-lyon2.fr/~ricco/cours/cours_econometrie.html
Wikipdia.
http://fr.wikipedia.org/wiki/Rgression_linaire_multiple

Anda mungkin juga menyukai