Anda di halaman 1dari 7

LACP sous SPSS

Propos de ce document .................................................................................. 1 Introduction ................................................................................................... 1 La dmarche suivre sous SPSS ........................................................................ 2 1. Descriptives ...................................................................................... 2 2. Extraction ......................................................................................... 2 3. Rotation ........................................................................................... 3 4. Scores ............................................................................................. 3 5. Options ............................................................................................ 4 Analyse des rsultats ....................................................................................... 4 1. Les donnes sont-elles factorisables ? ........................................................... 4 2. Combien de facteurs retenir ? ...................................................................... 5 3. Interprtation des rsultats ......................................................................... 6

Propos de ce document
Ce document a t cr dans le but daider toute personne qui dbute dans SPSS, logiciel tr puissant mais trs peu sympathique. Ce document se base sur la version 11.0 Base de SPSS, en version anglaise. La plupart des exemples sont issus des dictatiels du programme SPSS en lui-mme. Toutes les remarques, tant sur le fond que sur la forme, sont les bienvenues. Nhsitez pas me contacter ladresse suivante : <lemoal@lemoal.org> ou venir visiter mon site internet : http://www.lemoal.org/spss/ Merci.

Introduction
LAnalyse en Composante Principale (ACP) fait partie des analyses descriptives multivaries. Le but de cette analyse est de rsumer le maximum dinformations possibles en en perdant le moins possible pour : Faciliter linterprtation dun grand nombre de donnes initiales Donner plus de sens aux donnes rduites LACP permet donc de rduire des tableaux de grandes tailles en un petit nombre de variables (2 ou 3 gnralement) tout en conservant un maximum dinformation. Les variables de dpart sont dites mtriques.

LAnalyse en Composantes Principales Ludovic LE MOAL 2002

La dmarche suivre sous SPSS


Aller dans Analyze > Data Reduction > Factor La bote de dialogue suivante apparat alors :

On choisit les variables qui nous paraissent les mieux adaptes lanalyse en les slectionnant dans la partie de droite puis en cliquant sur la flche qui pointe vers la droite. Cinq boites de dialogue doptions soffrent maintenant nous : 1. Descriptives 2. Extraction 3. Rotation 4. Scores 5. Options que nous allons maintenant examiner une une.

1. Descriptives
La bote de dialogue Factor Analysis : Descriptives apparat.

Dans Correlation Matrix , cliquer sur Coefficients et KMO and Bartletts test of sphericity .

2. Extraction
La bote de dialogue Factor Analysis : Extraction apparat.

LAnalyse en Composantes Principales Ludovic LE MOAL 2002

Cliquer sur Scree Plot (Graphique des valeurs propres). Ne pas toucher aux autres options.

3. Rotation
La bote de dialogue Factor Analysis : Rotation apparat.

Pour linstant, il ne faut rien toucher dans Method . Loption Varimax pourra tre choisie si les rsultats ne sont pas suffisants dans un premier temps. Par contre, cocher loption Loading plot(s) (Carte(s) factorielle(s)). Cette option permet davoir une reprsentation des diffrents axes.

4. Scores
La bote de dialogue Factor Analysis : Factor Scores apparat.

Pour linstant, il ne faut toucher rien. Loption Save as variables (enregistrer dans des variables) permettra dattribuer chaque individu ses coordonnes factorielles une fois lanalyse termine.
LAnalyse en Composantes Principales Ludovic LE MOAL 2002

5. Options
La bote de dialogue Factor Analysis : Options apparat.

Choisir loption Sorted by size (Classement des variables par taille) dans Affichage des projections.

Analyse des rsultats


Analyser les rsultats dune ACP, cest rpondre trois questions : 1. Les donnes sont-elles factorisables ? 2. Combien de facteurs retenir ? 3. Comment interprter les rsultats ?

1. Les donnes sont-elles factorisables ?


Pour rpondre cette question, dans un premier temps, il convient dobserver la matrice des corrlations ( Correlation Matrix ). Si plusieurs variables sont corrles (> 0.5), la factorisation est possible. Si non, la factorisation na pas de sens et nest donc pas conseille.
Correlation Matrix Vehicle type 1,000 -,040 ,268 ,013 ,391 ,251 ,141 ,524 ,599 Price in thousands -,040 1,000 ,623 ,838 ,106 ,323 ,150 ,526 ,424 Engine size ,268 ,623 1,000 ,836 ,470 ,688 ,537 ,760 ,667 Horsepower ,013 ,838 ,836 1,000 ,283 ,536 ,387 ,610 ,504 Wheelbase ,391 ,106 ,470 ,283 1,000 ,682 ,840 ,651 ,654 Width ,251 ,323 ,688 ,536 ,682 1,000 ,709 ,721 ,658 Length ,141 ,150 ,537 ,387 ,840 ,709 1,000 ,627 ,565 Curb weight ,524 ,526 ,760 ,610 ,651 ,721 ,627 1,000 ,864 Fuel capacity ,599 ,424 ,667 ,504 ,654 ,658 ,565 ,864 1,000

Correlation

Vehicle type Price in thousands Engine size Horsepower Wheelbase Width Length Curb weight Fuel capacity

Dans notre exemple, plusieurs variables sont correlles entre elles : Dans un deuxime temps, il faut observer lindice de KMO (Kaiser-Meyer-Olkin) qui doit tendre vers 1. si ce nest pas le cas, la factorisation nest pas conseille. Pour juger de lindice de KMO, on peut utiliser lchelle suivante : 0,50 et moins est misrable entre 0,60 et 0,70, cest mdiocre entre 0,70 et 0,80 cest moyen entre 0,80 et 0,90 cest mritoire et plus 0,9 cest merveilleux.

LAnalyse en Composantes Principales Ludovic LE MOAL 2002

Enfin, on utilise le test de sphricit de Bartlett. : si la signification (Sig.) tend vers 0.000, cest trs significatif, infrieur 0.05 significatif, entre 0.05 et 0.10 acceptable et au dessus de 0.10, on rejette.
KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity Approx. Chi-Square df Sig. ,810 1212,128 28 ,000

Si lACP satisfait au moins deux de ces trois conditions, on peut continuer.

2. Combien de facteurs retenir ?


Trois rgles sont applicables : 1ere rgle : la rgle de Kaiser qui veut quon ne retienne que les facteurs aux valeurs propres suprieures 1. 2eme rgle : on choisit le nombre daxe en fonction de la restitution minimale dinformation que lon souhaite. Par exemple, on veut que le modle restitue au moins 80% de linformation.

Pour ces deux premires rgles, on examine le tableau Total Variance Explained .
Total Variance Explained Initial Eigenvalues % of Variance Cumulative % 64,008 64,008 18,874 82,882 6,205 89,087 4,100 93,187 2,793 95,980 1,757 97,736 1,433 99,169 ,831 100,000 Extraction Sums of Squared Loadings Total % of Variance Cumulative % 5,121 64,008 64,008 1,510 18,874 82,882

Component 1 2 3 4 5 6 7 8

Total 5,121 1,510 ,496 ,328 ,223 ,141 ,115 6,645E-02

Extraction Method: Principal Component Analysis.

3eme mthode : le Scree-test ou test du coude. On observe le graphique des valeurs propres et on ne retient que les valeurs qui se trouvent gauche du point dinflexion. Graphiquement, on part des composants qui apportent le moins dinformation (qui se trouvent droite), on relie par une droite les points presque aligns et on ne retient que les axes qui sont au dessus de cette ligne.

LAnalyse en Composantes Principales Ludovic LE MOAL 2002

Scree Plot
6

Eigenvalue

0 1 2 3 4 5 6 7 8

Component Number
Dans notre exemple, nous ne retenons que les deux premiers axes.

3. Interprtation des rsultats


Cest la phase la plus dlicate de lanalyse. On donne un sens un axe grce une recherche lexicale (ou recherche de mots) partir des coordonnes des variables et des individus. Ce sont les lments extrmes qui concourent llaboration des axes.
Component Matrixa Component 1 2 ,912 -2,57E-02 ,878 ,265 ,847 -,109 ,843 -,221 ,772 ,554 ,760 -,487 ,742 -,569 ,606 ,715

Curb weight Engine size Fuel capacity Width Horsepower Length Wheelbase Price in thousands

Extraction Method: Principal Component Analysis. a. 2 components extracted.

Dans notre concoure le variables ne individus qui

exemple, ce sont les variables Curb Weight et Engine Size qui plus la construction de laxe 1. Si la recherche lexicale partir des donne rien, il faut alors donner un sens laxe en sappuyant l aussi aux ont les coordonnes extrmes.

Note : Des axes peuvent trs bien ne pas avoir de sens, auquel cas il ne faut pas les retenir. Si la variance explique est trop faible, on peut choisir dexclure certaines variables. Pour choisir les variables liminer, on observe leur qualit de reprsentation : plus la valeur associe la ligne Extraction est faible, moins la variable explique la variance.

LAnalyse en Composantes Principales Ludovic LE MOAL 2002

Communalities Price in thousands Engine size Horsepower Wheelbase Width Length Curb weight Fuel capacity Initial 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 Extraction ,879 ,841 ,903 ,874 ,759 ,815 ,832 ,729

Extraction Method: Principal Component Analysis.

Il faut galement tenir compte du positionnement de chaque variable sur chaque axe : les variables liminer sont les variables qui sont Soit proches du centre sur lensemble des axes retenus. Soit au milieu dun quart de cercle sur les axes retenus. Soit les variables qui forment un axe elles toute seule.

LAnalyse en Composantes Principales Ludovic LE MOAL 2002