Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
1/31
Copyright Andr Bouchier. 2006, Andr Bouchier (20 Janvier 2006) Permission est accorde de copier et distribuer ce document, en partie ou en totalit, dans n'importe quelle langue, sur n'importe quel support, condition que la notice ci-dessus soit incluse dans toutes les copies. Permission est accorde de traduire ce document, en partie ou en totalit, dans n'importe quelle langue, condition que la notice ci-dessus soit incluse.
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
2/31
l Une inertie nulle signifie que tous les individus sont presque identiques.
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
3/31
l Son objectif est de reprsenter sous forme graphique lessentiel de linformation contenue dans un tableau de donnes quantitatif.
l Dans un tableau de donnes j variables, les individus se trouvent dans un espace j dimensions.
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
4/31
l Mais au del de 3 dimensions, il est impossible de reprsenter les donnes sur un plan ou mme de les visualiser mentalement.
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
5/31
l Nous avons lhabitude de dessiner ou photographier la ralit. l Nous naturellement passons dun espace 3 dimensions un espace 2 dimensions. l Selon le point de vue, linformation retenue ne sera pas la mme. l LACP nous propose un point de vue permettant de voir au mieux les individus dun tableau.
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
6/31
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
8/31
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
9/31
l Nous sommes donc passs dun tableau de donnes j dimensions (impossible projeter sur un plan) un tableau de j composantes principales.
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
10/31
Donnes techniques sur 62 vhicules - anne modle 1994 Variables quantitatives : Puiss_admi, Cylindree, Longueur, Largeur, Surface, Poids_Tota, Vit_Maxi, Dep_arret, Conso_Moye NOMBRE D'INDIVIDUS SELECTIONNES : 62 Individus manquants : 10 Effectif pris en compte : 52
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
11/31
supplmentaires : 0 supplmentaires : 0 Hors norme : 0 % CUMULE 71.635 84.298 91.635 95.319 97.946 99.063 99.547 99.996 100.000 HISTOGRAMME ============================== ===== === = =
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
13/31
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
14/31
Dep_arret
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
15/31
VARIABLES ACTIVES QLT Puiss_admi Cylindree Longueur Largeur Surface Poids_Tota Vit_Maxi Dep_arret Conso_Moye TOTAL 74.1 77.5 89.2 85.4 98.0 92.2 91.4 78.6 72.2
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
16/31
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
17/31
INDIVIDUS ACTIFS Alfa-Rom Alfa-Rom Alfa-Rom Alfa-Rom BMW 316i BMW 325 T BMW 518i BMW 730i Citron A Citron A Poids 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
18/31
17.LACP en rsum
i
J
Matrice diagonale des valeurs propres
Matrice de Corrlation
Diagonalisation
J
Matrice des vecteurs propres
J
Histogramme des valeurs propres
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
19/31
l Limportance que prendront les variables dans le calcul des composantes principales est fonction de leur ordre de grandeur. l Une variable ayant un cart-type important aura plus de poids quune variable de faible cart-type. l Des variables de fort cart-type "construiront" les premires composantes. l Les calculs ne sont pas faux, mais la lecture des rsultats dune ACP peut devenir complique. l Cest pour remdier a quil convient de centrer et rduire les variables.
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
20/31
Exemple : Identif 001 002 003 004 005 Prix HT 41.5 28.6 19.3 52.9 28.2 Quantit 27 42 51 12 14 Prix HT (rang) 4 3 1 5 2 Quantit (rang) 3 4 5 1 2
l La transformation en rang peut permettre de dtecter des relations non linaires et rapproche les valeurs extrmes. l En cas de transformation en rang des donnes, il nest pas utile de les rduire.
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
21/31
l Les vecteurs propres sont les coefficients affecter aux variables initiales pour obtenir les composantes principales. l Par exemple la premire composante sobtient (pour chaque individu): 0.287*Puiss_admin + 0.347*Cylindree + + 0.322*Conso_Moye
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
22/31
l L'utilisation et l'tude des vecteurs propres n'est pas d'un grand intrt pratique
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
23/31
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
24/31
l De nouveaux individus pourront tre mis en supplmentaires dans lanalyse (nouvelles varits, nouveaux traitement, etc) l On peut aussi mettre en supplmentaires des donnes (variables ou individus) dont on doute de la fiabilit. Ces donnes seront positionnes sur le plan principal sans participer activement aux calculs. l Par opposition, les individus ou les variables qui ne sont pas supplmentaires sont dits actifs (sous entendu: actifs dans le calcul des composantes principales)
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
25/31
J variables
J vecteurs propres
J composantes
l Les individus supplmentaires sont introduits en fin danalyse, aprs le calcul des vecteurs propres.
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
26/31
Individus supplmentaires
Individus supplmentaires
J composantes
On utilise la matrice des vecteurs propres (dj connue) pour calculer la valeur des composantes principales pour les individus supplmentaires
Individus supplmentaires
27/31
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
Comp 1 Comp 2 0.730 0.457 0.880 -0.012 0.913 -0.244 0.774 -0.505 0.919 -0.369 0.932 -0.233 0.903 0.315 -0.717 -0.521 0.817 0.233
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
28/31
Puiss_admi Cylindree Longueur Largeur Surface Poids_Tota Vit_Maxi Dep_arret Conso_Moye Assurance
Comp 1 Comp 2 0.730 0.457 0.880 -0.012 0.913 -0.244 0.774 -0.505 0.919 -0.369 0.932 -0.233 0.903 0.315 -0.717 -0.521 0.817 0.233 0.852 -0.325
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
29/31
Analyses multivaris. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
31/31