Anda di halaman 1dari 17

Dmarche de la conduite de lanalyse factorielle exploratoire

Lanalyse factorielle est lune des plus anciennes mthodes danalyses


multivarie et elle a fait lobjet du plus grand nombre dapplications en
sciences sociales (Evrard, Pras et Roux, 2009 1). Elle correspond une
dmarche statistique de structuration des donnes. Elle fournit une
mthodologie qui sert au dveloppement dchelles et la rduction du
nombre des items tout en fiabilisant les donnes collectes. Il sagit dune
dmarche psychomtrique de mesure de concepts non observables (Hair
et al, 20082). Lanalyse factorielle peut tre exploratoire ou confirmatoire
Conditions de ralisation dune ACP
Lapprciation de la qualit des mesures requiert une dmarche en deux
temps, dabord exploratoire par le biais dune ACP, sans spcification a
priori des liens entre les variables latentes et leurs indicateurs, puis
confirmatoire afin de tester une structure prdtermine.
Jolibert et Jourdan (20063) mettent en avant trois principaux objectifs
assigns lanalyse factorielle exploratoire en composantes principales (1)
Identifier un ensemble de dimension latente partir dun ensemble plus
grand de variables initiales. Il sagit de dcouvrir une structure sous-
jacente. (2) Rduire le nombre de variables en un ensemble plus restreint.
(3) Mettre au point un indice caractrisant un groupe. Pour conduire une
analyse factorielle exploratoire, le recours une srie danalyse semble
ncessaire : ltude de ladquation des donnes lanalyse factorielle, le
choix des mthodes danalyse et dextraction, le choix du nombre de
facteurs extraire, le choix de la rotation appliquer aux facteurs et
lpuration et interprtation des facteurs.
Matrice de covariance ou de corrlation
Les variables retenir pour une analyse factorielle doivent avoir t
mesures sur des chelles dintervalle ou de rapport. Il est souhaitable
davoir 3 5 fois plus de variables que de facteurs (Jolibert et Jourdan,
1
Evrard Y., Pras B. et Roux E. (2009), Market : tudes et recherches en marketing, Dunod

2
Hair J. F., Black W.C., Babin B.J. et Anderson R.E. (2008), Multivariate Data Analysis, Pearson New
International Edition
3
Joliber A. et Jourdan P. (2006), Marketing Research - Mthodes de recherche et d'tudes en marketing, Dunod.
20064). Si les variables ont t mesures sur des chelles comparables
(par exemple, notations sur des chelles qui comprennent le mme
nombre dchelons), les diffrences de variance dune variable lautre
peuvent tre considres comme normales . Dans ce cas, on peut
utiliser la matrice de covariance ou la matrice de corrlation (Evrard et al,
2000). En revanche, si les variables sont mesures suivant des formats de
rponse trs diffrents cest--dire le nombre dchelons ne sont pas
identique, il est recommand de les standardiser, cest--dire de les
centrer et de les rduire pour neutraliser leffet de la diffrence. Lindice
de proximit entre les variables sera alors le coefficient de corrlation, la
variance de chaque variable est alors gale lunit. Dans ce cas, on
utilisera la matrice des corrlations uniquement (Evrard et al, 2009). Il
sagit de vrifier que les items forment "un ensemble suffisamment
cohrent pour quil soit raisonnable dy chercher des dimensions
communes qui aient un sens et ne soient pas des artefacts statistiques"
(Evrard et al, 2009). Avec une matrice de corrlation, la variance des
variables faible cart type a autant dimportance que la variance des
variables fort cart-type.
Le test de Kaiser-Meyer-Olkin (KMO)
Pour examiner la nature factorisable des donnes, deux tests formels
sont disponibles : le test de sphricit de Bartlett qui fournit des
indications sur la forme du nuage de points ; le test de Kaiser, Meyer et
Olkin (KMO) qui mesure ladquation de lchantillon avec lensemble des
variables (Evrard et al., 2009). Le test KMO varie entre 0 et 1. Il permet de
quantifier le degr de corrlations entre les items. La valeur 1 indique
que chaque variable est explique sans erreur par les autres variables
(Hair et al., 20085). Sil est proche de 0, les corrlations partielles sont
identiques aux corrlations brutes. Dans ce cas, une compression efficace
nest pas possible. Les variables sont deux deux orthogonales. Sil est
proche de 1, nous aurons un excellent rsum de linformation sur les
premiers axes factoriels. Selon Jolibert Jourdan (2006), si le KMO est
suprieur 0,9 la solution factorielle est trs bonne, et la solution factorielle
4
Op. cit.
5
Op. cit
est acceptable pour les relations entre les variables. Le KMO gal 0,7 et
0,8 est correct. Un KMO infrieur 0,6 nest pas acceptable.
La formule de KMO snonce comme suit :
'

et

(aij) correspond la matrice de corrlations partielles 6. Les (aij) sont


calculs de la matrice de corrlation brute. En inversant cette dernire,
nous obtenons la matrice R -1 = (vij). La matrice de corrlation partielle A
= (aij) est forme laide de la formule prsente en haut. V ii sont les
valeurs de la diagonale de la matrice anti-image.
R2ij sont les valeurs des corrlations brutes des items i et j.
Le test de sphricit
Le test de sphricit de Bartlett examine si la matrice des corrlations est
statistiquement diffrente dune matrice identit. Selon Malhotra (2004),
une grande valeur du test permet de rejeter cette hypothse nulle et
autorise la factorisation. Pour mesurer le lien entre les variables, nous
calculons le dterminant |R| de la matrice de corrlation. Sous H0, |R| = 1 ;
sil y a des colinarits parfaites, nous aurions |R| = 0. Fixer des valeurs
seuils est difficile. Gnralement, lorsque |R| est infrieur 0.00001, on
considre quil y a de trs fortes redondances dans les donnes c.--d.
elles ne reclent quun seul type dinformation. Le rsultat sera dune trs
grande trivialit. A linverse, lorsque |R| se rapproche de 1, lACP ne
servira pas grand-chose car les variables sont quasiment orthogonales
deux deux. Le test de Bartlett vise justement vrifier si lon scarte
significativement de cette situation de rfrence |R| = 1. La statistique de
test scrit :

Avec n taille de lchantillon et p le nombre ditems ou de variables.


6
Nous utilisons la corrlation partielle pour mesurer la relation (nette) entre deux variables en retranchant
linfluence des autres
Sous H0, elle suit une loi du [p x (p-1) / 2] degrs de libert.
Stewart (1981) nuance la porte de ce test car, selon lui, il conduit
presque systmatiquement un rejet de H0, mme dans des conditions
douteuses dassociations entre les variables
Qualit de reprsentation des items
La qualit de la reprsentation des items correspond la mesure du
pourcentage de la variance explique par chacune des variables de
lanalyse. Il sagit de vrifier si les items dune variable contribuent bien
lexplication de la variance. Autrement dit, lanalyse de la qualit de la
reprsentation permet de dfinir si les items sont bien reprsents par la
ou les dimensions du construit. Cette qualit est mesure par un indice
appel communaut, communalities ou Loading. Les items dont la
communaut est infrieure 0.5 seraient candidats llimination en
adoptant une dmarche itrative dpuration en commenant par les
items dont la communaut est la plus faible. Par ailleurs, nous soulignons
que Har et al (1998)7 prcisent que le choix de ce seuil est fonction de la
taille de lchantillon et du seuil de signification souhait.
Qualit de reprsentation des items 5%
Taille de 50 60 70 8 10 12 15 20 25 35
lchantillon 5 0 0 0 0 0 0
Seuil de 0,7 0,7 0,6 0, 0,5 0, 0,4 0, 0,3 0,3
signification 5 5 6 5 5 5 4 5 0

Analyse de la variance explique


Pour dterminer le nombre de facteurs retenir, on calcule le pourcentage
de variance explique. Celle-ci permet de dterminer si le ou les facteur(s)
retenu (s) restitue(nt) bien linformation contenue dans les variables. On
dispose de deux indicateurs :
- la valeur propre qui correspond au pourcentage de variance explique
par facteur ;
- le pourcentage de variance explique cumule totale pour lensemble
des facteurs.

7
Hair J. F., Anderson R. E., Tatham R. L. et Black W. C. (1998), Multivariate data analysis,
5me dition, Englewood Cliffs, Prentice-Hall.
Le nombre daxes retenir dpend essentiellement de deux critres. Il
faut tout dabord retenir les facteurs qui satisfont le critre de Kaiser,
cest--dire, tous les facteurs dont la valeur propre est suprieure 1. Ce
critre repose sur lide que les facteurs associs des valeurs propres
infrieures 1 expliquent moins de variance quun seul item. Ce critre
particulirement strict doit tre pondr par le test du coude (scree-
test) et par la thorie. Un examen rapide de la courbe reprsentant les
valeurs propres permet de dterminer partir de quelle composante la
courbe sinflchit et ainsi didentifier le nombre daxes retenir.
Le deuxime critre observer est la part de variance cumule explique
par les facteurs retenus. Celui-ci est particulirement important car il
indique la capacit de lanalyse condenser les variables avec une perte
limite dinformation. Il est conseill de respcifier le modle lorsque la
variance cumule explique est infrieure 60% .
Globalement, il convient de sassurer que la solution retenue explique un
minimum de variance pour chaque construit : en gnral, le pourcentage
de 60% est gnralement admis (Hair et al., 19988).
Choix de la rotation retenir : La rotation repose sur le principe
daugmentation artificielle des corrlations entre les items et les diffrents
facteurs. Il existe deux types de rotation : rotation orthogonale et rotation
oblique. Plusieurs types de rotations sont possibles parmi les rotations
orthogonales qui prservent lorthogonalit des axes (Varimax, Quartimax,
Equamax). Iacobucci et al. (2001 9) prconisent une dmarche itrative de
choix de la rotation appliquer. Ils recommandent de commencer
lanalyse en supposant une corrlation entre les facteurs et deffectuer
une rotation oblique. Dans le cas o une forte corrlation entre les
facteurs, ils proposent dutiliser une rotation oblique contre une rotation
orthogonale lorsque la corrlation reste faible entre les facteurs.
Mthode varimax : mthode de rotation orthogonale qui minimise le
nombre de variables ayant de fortes corrlations sur chaque facteur. Elle
simplifie l'interprtation des facteurs. La rotation Varimax vise optimiser
8
Hair J.F., Anderson R.E., Tatham R.L., Black W.C. (1998), Multivariate data analysis (5th), Prentice Hall,
Upper Sadle River, New Jersey
9
Iacobucci D., Barnes J., Cote J., Cudeck R., Malthouse E., and Stewart D.W. (2001), "Factor analysis," Journal
of Consumer Psychology, 10(1/2), 75-82.
les saturations ou loadings dans chaque composante en maximisant les
carts entre saturations. Lobjectif est dobtenir au final des saturations
proches de 1 ou de 0 ; plus une saturation est proche de 0, plus faible est
son lien avec le facteur. Cette rotation est la plus utilise car le problme
le plus frquemment rencontr en analyse factorielle est de simplifier et
de clarifier la signification de chaque facteur.
Mthode quartimax : mthode de rotation qui rduit le nombre de
facteurs requis pour expliquer chaque variable. Chaque variable est
fortement corrle avec un seul facteur et le moins corrle possible avec
tous les autres facteurs. Linconvnient est que plusieurs variables
peuvent tre fortement corrles avec le mme facteur. La rotation
quartimax a pour objectif de maximiser les carts entre saturations par
variable. Elle peut donc se traduire par une accumulation de saturations
importantes sur un mme facteur, ce qui est peu recherch. Elle vise
rduire le nombre de facteurs expliquant chaque variable.
Mthode equamax : mthode de rotation qui est une combinaison de la
mthode Varimax (qui simplifie les facteurs) et de la mthode Quartimax
(qui simplifie les variables). Le nombre de variables pesant sur un facteur
et le nombre de facteurs ncessaires pour expliquer une variable sont
minimiss La rotation Equimax est trs peu utilise car elle donne des
rsultats peu probants.
Mthodes de rotation oblique
Une rotation oblique est recommande lorsque rien nindique a priori que
les composantes doivent tre indpendantes les unes des autres (option la
plus raliste), ou lorsque lon souhaite aboutir une modlisation
thorique. Cette rotation est imprative lorsque le chercheur souhaite faire
des analyses factorielles dordre suprieur.
- Rotation oblimin direct : il sagit dune rotation oblique selon la
mthode oblimin ;
- Rotation Promax : rotation oblique qui permet aux facteurs d'tre
corrls. Elle peut tre calcule plus rapidement qu'une rotation oblimin
directe, aussi est-elle utile pour les vastes ensembles de donnes (SPSS,
20.0).
La rotation oblique prsente linconvnient dtre parfois dlicate
interprter, mais elle a lavantage de pouvoir mieux rendre compte de
certaines situations (par exemple, le cas de plusieurs facteurs, distincts
mais relis un mme concept. Lorsque les corrlations entre les facteurs
sont leves, linterprtation avec une rotation oblique savre difficile,
cest la raison pour laquelle les techniques de rotation oblique ne sont pas
trs populaires. Si le chercheur postule lexistence de plusieurs dimensions
ou facettes au sein dun mme concept, il suppose implicitement que
celles-ci sont corrles entre elles. Dans ce cas, la rotation oblique est
celle quil faut adopter.
Fiabilit des mesures
Perrien et al10 soulignent que la fiabilit mesure le degr avec lequel les
instruments de recherche utiliss mesurent de faon constante, le
construit tudi. Le premier indicateur utilis dans les recherches
marketing est lalpha de Cronbach. La formule est donne par Cronbach
(1951)11 :

K
i 2i
1
K 1


i
ii2 2 i,
i, j
j


k : Nombre de questions (ou items)
2i : La variance de litem i (erreur alatoire)
i, j : La covariance entre litem i et litem j

Le coefficient alpha a une valeur comprise entre 0 et 1. Un coefficient de 0


reprsente une fiabilit nulle et un coefficient de 1 traduit une fiabilit
parfaite. Entre ces deux valeurs, il est ncessaire de se demander quelle
est la valeur partir de laquelle un instrument doit tre considr comme
fiable. Peterson12 a conduit une mta analyse pour inventorier et vrifier
empiriquement les diffrents coefficients obtenus dans les tudes faites
dans le domaine du marketing et les rapprocher des recommandations de
Nunnaly. Lexamen de 4286 coefficients procdant de 1030 chantillons et

10
Perrien J., Cherone E.J. et Zins M. (1984), "Recherche en marketing ", Gaetan Morin, Paris
11
Cronbach L.J. (1951), Coefficient alpha and the internal structure of tests, Psychometrica, vol. 16, n3, sept
12
Peterson A.D. (1994,
de 832 recherches montre un alpha moyen de 0.77 et que 75% des
coefficients ont une valeur suprieure 0.7 (49% suprieurs 0.8 et 14%
suprieurs 0.9). En outre, Evradet al jugent que alpha est acceptable sil
est compris entre 0.6 et 0.8 alors que Perrienet al retiennent un alpha
dont la valeur est comprise entre 0.5 et 0.6. Dans notre recherche, nous
allons considrer que les diffrents items mesurant un phnomne sont
fiables si lalpha est suprieur 0.6. Prcisons que alpha peut tre calcul
pour chaque item. Les auteurs recommandent de retirer les items dont
lindice est suprieur lindice global de la variable.
Le comportement de lalpha est sensible au nombre ditems, ce qui invite
le considrer avec prudence. En effet, un autre indice est introduit, il
sagit du rh de Joreskog.
La qualit des mesures utilise fait rfrence lcart entre les valeurs
observes et les vraies valeurs pour les mmes variables chez le mme
chantillon. La mesure dun construit comprend deux lments : la vraie
valeur (mesure parfaite) et les termes derreurs. Deux types derreurs
sont considrs : systmatiques et alatoires qui renvoient respectivement
la validit et la fiabilit des mesures retenues. La dmarche
mthodologique largement utilise en marketing pour gnrer des
mesures valides et fiables est introduite par Churchill (1979). Cette
dmarche convient parfaitement aux mesures rflectives appeles aussi
chelles de mesure.
La fiabilit renvoie au degr avec lequel un instrument mesure de faon
permanente le construit objet dtude (Evrard et al, 2004). La fiabilit peut
tre vrifie par alpha de Cronbach dans le cadre de lanalyse factorielle
exploratoire. Cet indice est sensible au nombre ditems. Pour pallier cette
faiblesse, un autre indice est prconis, il sagit de (rh) de Jreskog, calcul
partir des rsultats de lanalyse factorielle confirmatoire, en intgrant les termes
derreur. La formule snonce comme suit :

(1 2 3 ... n )
Rh de Joreskog
(1 2 3 ... n )2 Var ( i )

Avec i = coefficient de rgression standardise de litem i


Et Var ( i ) est lerreur de mesure de litem i. Var ( i ) 1 i2
Le coefficient de Jreskog sinterprte de la mme faon que le
coefficient alpha de Cronbach : la fiabilit est dite satisfaisante lorsque le
coefficient est suprieur 0,6.
La validit concerne la relation entre la thorie et les concepts qui lui
sont relis dune part et la mesure dautre part : elle est concerne par
ladquation de la traduction du concept en mesure (Bagozzi et Yi ,
201213).
La validit convergente consiste vrifier si les items mesurant un mme
construit sont bien corrls. Elle sapprcie en deux temps : dune part,
par lexamen des communalits de chaque variable manifeste sa
variable latente (communalit intra) et dautre part, par lexamen de lAVE
(Average Variance Extracted) ou variance moyenne extraite, calcule sur
la variable latente. La dmarche de bootstrap est mene afin de vrifier
que chacune des communalits (intra) est significativement diffrente de
la valeur 0, et suprieure 0,5. Le bootstrap procure en effet pour
chacune des communalits des intervalles de confiance fixs 95%. Ds
lors que la valeur 0 nappartient pas lintervalle propos et que la borne
infrieure de lintervalle propose une valeur suprieure 0,5, la
communalit (intra) peut tre considre comme acceptable. La valeur 0,5
tant le seuil minimum recommand pour accepter la fois la
communalit de la variable manifeste et lAVE de la variable latente
(Fornell et Larcker, 198114). Cela signifie que la variance due aux erreurs
de mesure doit tre infrieure la variance capture par le construit.
Certains chercheurs soulignent que le seuil de 0,4 est acceptable (Roussel
et al., 2002). Le calcul de rh de la validit convergente se fait laide de
la formule suivante :

13
Bagozzi R.P. et Yi Y. (2012), Specification, evaluation, and interpretation of structural
equation models, Journal . of the Academy. Marketing Science, vol 40, n8.
14
(12 22 32 ... 2n )
Rh de Joreskog 2
(1 22 23 ... 2n ) Var ( i )

Avec i = coefficient de rgression standardise


de litem i
Et Var ( i ) est lerreur de mesure de litem i.

Var ( i ) 1 2i

La validit discriminante a pour objectif de vrifier que les items senss


mesurer les dimensions distinctes dun mme construit, sont faiblement
corrls entre eux. Pour que cette condition soit satisfaite, on vrifie que la
variance moyenne extraite (rh de validit convergente) de chaque
construit est suprieure au carr des corrlations que celui-ci partage avec
les autres construits. Lindice de validit discriminante not lindice Root
AVE et correspond la racine carre de lindice AVE.
La rgression multiple

La rgression linaire multiple est une technique danalyse multi varie. Elle se
prsente comme une gnralisation, plusieurs variables explicatives, de la
rgression linaire simple. La rgression multiple permet alors dexaminer la
force de dpendance dune variable dpendante et un ensemble de variables
indpendantes. Pour pouvoir appliquer cette technique, il faut que toutes les
variables envisages soient mtriques. Prcisons que la rgression multiple se
distingue en deux grandes classes : la premire pour faire des prdictions ou des
prvisions et la seconde se rattache lexplication de la force de la dpendance
dune variable expliquer par plusieurs variables explicatives.

Le modle gnral dun modle de rgression multiple peut tre formul comme
suit :

Y a1 x1 a 2 x 2 ... a n x n

Avec :

Y : Variable dpendante ou expliquer

x1 , x2 : Variables indpendantes ou explicatives

a1 , a2 : Coefficients de rgression qui expriment force explicative de ces

,.. relations de la variable dpendante vis--vis des variables


indpendantes
: Constante

: Le biais ou le terme derreur qui suit une loi normale N (0, )

Le recours la rgression multiple est tributaire au respect des conditions :

Type de variables envisages : La premire condition dutilisation de la


rgression repose sur la nature des variables. Celles-ci doivent tre nature
mtrique. Rappelons que les variables mobilises dans notre recherche sont
mesures par une chelle dintervalle. Cette premire condition est vrifie pour
notre recherche.
Linarit de la variable dpendante et des variables indpendantes :
pour pouvoir appliquer la rgression linaire multiple, il est essentiel de sassurer
que les variables tudies forment une combinaison linaire et non logarithmique
ou quadratique en loccurrence. Deux mthodes peuvent tre utilises afin de
vrifier lexistence dune relation linaire : le coefficient de corrlation de Pearson
et le graphe de dispersion des observations entre les variables (Jolibert et
Jourdan, 2006).

Colinarit des variables explicatives : elle signifie que les variables


explicatives sont fortement corrles entre elles. Elle, lorsquelle existe, fausse
lestimation des coefficients de rgression. En dautres termes, la rgression
linaire multiple suppose que les variables explicatives sont indpendantes les
unes des autres (Evrard et al, 2000) 15. Deux variables sont dites colinaires
partir du moment o la corrlation entre les deux est statistiquement significative
(>0,5). Cette colinarit implique que les variables partagent une partie de leur
variance. La multi colinarit est le fait quune variable indpendante est
prdictible par une combinaison linaire des autres variables aussi
indpendantes. Pour pouvoir dtecter ce problme, il est recommand de
rgresser la variable indpendante considre sur les autres variables
indpendantes et calculer lindice "Facteur d'inflation de la variance " Variance
Inflation Factor (VIF). VIF = 1/tolrance o la tolrance correspond 1-R
(principal de la rgression). De faibles valeurs de VIF sont un indicateur de
labsence de colinarit. Les seuils acceptables pour ces deux indicateurs sont
respectivement les suivants : VIF < 3,3 et Tolerance > 0,3.

Normalit de la distribution des termes derreurs ou rsidus : les rsidus


doivent respecter la condition dhomoscdasticit, tre indpendants les uns des
autres cest dire points reprsents ne doivent pas suivre de tendance
particulire, ils doivent tre rpartis alatoirement. Aussi, les rsidus doivent tre
distribus selon une loi normale. La vrification des trois dernires conditions
sappuie respectivement sur lanalyse du graphique des rsidus, sur la conduite
du test de Durbin-Watson (idalement autour de 2). La normalit des donnes
peut tre teste par le calcul du coefficient dasymtrie (Skewness) et
daplatissement (Kurtosis), le premier ne devant pas dpasser |3|, le second
tant parfois accept jusqu |8|. Ces tests permettent de vrifier que chaque

15
Op cit
variable a bel et bien une distribution proche dune distribution normale (courbe
de Gauss) dont la moyenne est nulle et lcart type est lunit.

Une fois, les conditions dapplication de la rgression linaire multiple sont


remplies, il importe dinterprter les rsultats obtenus. Ceci, selon lapproche
prconise par Jolibert et Jourdan (2006), se fait au niveau global, au niveau de
chaque variable et enfin au niveau des rsidus.

Au niveau global valider la significativit statistique globale de la rgression par


lexamen du test F de Fisher. La valeur de ce test indique si la variance ou lajout
de variance explique sont significatifs, c'est--dire si, quelle que soit la force de
la relation entre les variables indpendantes et la variable dpendante, cette
relation est susceptible dexister dans la population et nest pas due simplement
lerreur dchantillonnage.

Au niveau de chaque variable : on vrifie la significativit statistique de chaque


coefficient de rgression par ltude du test t associ chaque estimateur des
coefficients de la rgression. Les valeurs du test t pour les coefficients sont
constitues par la division de la valeur du coefficient de rgression par son erreur.
Cet indice doit tre suprieur 2 (1.96 cart type) pour quil soit tre significatif.
Il indique si chacun des coefficients des variables prsentes dans lquation est
significatif. Un autre indicateur vrifier, il sagit de coefficient standardis Bta
appel aussi les coefficients de rgression partiel. La standardisation consiste
convertir les variables en chelles commune, ceci revient centrer (autour de la
moyenne) et rduire (par rapport lcart type) ces variables. Cette opration
permet alors de rendre faisable la comparaison entre les diffrentes variables du
modle de rgression par le biais de llimination des effets de mesure
diffrentes. Par exemple, la taille du foyer et le revenu (Hait et al, 1998). Nous
affirmons que nos questions utilisent le mme nombre dchelons savoir 5, ce
problme de standardisation ne se posera pas.

De mme, il importe de tester la significativit pratique de la rgression. Ce test


est examin par le coefficient de dtermination (R) qui se prsente comme le
pourcentage de la variation totale de la variable expliquer explique par la
rgression. Pour juger des valeurs du R, Hair et al. (1998) proposent des seuils
minimums de cet indice en fonction de la taille de lchantillon et du nombre de
variables indpendantes ainsi que le seuil de signification souhait. De faon
gnrale, plus R proche de 1, plus le modle est fiable. Toutefois, il est
recommand dutiliser le R ajust qui est une mesure modifie du coefficient de
dtermination qui tient compte du nombre de variables indpendantes
envisages dans le modle de rgression et la taille de lchantillon pour tenir
compte de rendements dcroissants. Cet indice est particulirement utile, par
exemple, lors de la comparaison dquations de rgression, ayant un nombre
diffrent de variables indpendantes, des tailles dchantillons diffrentes ou les
deux (Hair et al., 1998 ; Malhotra et al., 2007).

Tableau 6.3- des valeurs de R en fonction de la taille de lchantillon et


seuil de signification

Taille de Niveau de signification Niveau de signification


lchantil 0,01 0,05
lon
Nombre de variables Nombre de variables

2 5 10 20 2 5 10 20

20 45 56 71 ----- 39 48 64 -----

50 23 29 36 49 19 23 29 42

100 13 16 20 26 10 12 15 21

250 5 7 8 11 4 5 6 8

500 3 3 4 6 3 4 5 9

1000 1 2 2 3 1 1 2 2

Bta : Le coefficient standardis permet de comparer la contribution de chaque


variable puisquil sagit du coefficient de rgression ramen sur une chelle
standard (variant de -1 +1).

Selon Jolibert et Jourdan (2006), si le test de Fisher permet de vrifier la


significativit statistique globale de la rgression, le t de Student teste la
significativit des estimations des coefficients de corrlation. Labsence de
significativit dun coefficient signifie que la variable explicative auquel il est
attach na quun impact marginal sur la variable dpendante. La significativit
statistique de chaque coefficient de rgression permet de dtecter si les
variables explicatives tudies ont un effet sur la variable expliquer.

A- Test de relations indirectes avec variable mdiatrice


Une variable mdiatrice est, selon Baron et Kenny 16 "le mcanisme par lequel une
variable indpendante influe sur une variable dpendante, et constitue en tant
que tel, le cur du modle causal. La variable mdiatrice permet donc
dexpliquer la manire, le processus par lequel une variable indpendante
influence une variable dpendante. Une variable mdiatrice est la fois une
variable consquente et une variable dterminante". Afin de clarifier davantage
leur dfinition, ils proposent la reprsentions graphique suivante :

Figure 6.1 variable mdiatrice

La technique statistique prconise pour vrifier le rle mdiateur, complet ou


partiel, est la rgression la fois simple et multiple (Baron et Kenny (1986 ;
Caceres et Vanhamme, 200317). trois conditions vrifier :

1re condition : la variable initiale X, qui est dterminante, doit tre corrle
avec la variable rsultat Y. Cela revient rgresser Y sur X et montrer que le
chemin a (coefficient de rgression) est significatif. Y aX erreur . Le
coefficient a reprsente leffet total : direct et indirect, de X sur Y.

16
Baron R.M. et Kenny D.A. (1986), "The moderator-mediator variable distinction in social
psychological research: conceptual, strategic and statistical considerations", Journal of
Applied Social Psychology, vol.51, n16, pp. 1173-1182
17
Caceres, R.C. et Vanhamme, J. (2003), Les processus modrateurs et mdiateurs :
distinction conceptuelle, aspects analytiques et illustrations, Recherche et Applications en
Marketing, 18, 2. 67-100.
2me condition : la variable X doit aussi avoir un impact consquent sur la
variable mdiatrice M. il sagit alors de rgresser M sur X et montrer que le
chemin b est significatif :

M bX erreur

3me condition : vrifier que la variable mdiatrice M influence positivement la


variable rsultat Y. pour ce faire, il importe de rgresser Y sur M. Toutefois, il
importe de souligner que le mdiateur M et le rsultat Y peuvent tre corrls
parce quils sont les deux la consquence de la variable initiale X. Par
consquent, la variable mdiatrice M doit avoir un effet significatif sur Y lorsque
linfluence de la variable X sur Y est contrle. Cela revient alors de rgresser Y
sur X et sur M et montrer que le coefficient dans lquation suivante est
significatif.

Y X M erreur

Les coefficients b dans la deuxime condition et dans la troisime condition


servent mesurer limpact de X sur Y cest--dire linfluence de X qui est
transfre par M. cet effet vaut b *

Le coefficient permet de mesurer leffet direct de X sur Y. pour dterminer la


nature de leffet mdiateur : partiel ou total, il est judicieux dvaluer la
significativit de ce coefficient. Si est faible, le mdiateur M est qualifi de
total ou complet. Cependant, quand limpact de X sur Y est moins lev mais
existe, on parle dune mdiation partielle (Baron et Kenny).

Pour apprcier la significativit de leffet mdiateur de M, le test Z de Soble 18


(1996) est prconis. Il snonce comme suit :

b*
Z Sobel
* s b 2 * s 22 s12 * s 22
2 2
1

Avec s1 et s2 correspondent respectivement aux erreurs standards de et de b .


Ce test sinterprte selon une distribution de loi normale. Pour quil soit
significatif, il est recommand quil soit suprieur 1,96 pour un niveau de
signification de 1%.

18
Preacher K.J. et Hayes A.F. (2004), SPSS and SAS procedures for estimating indirect
effects in simple mediation models, Behavior Research Methods, Instruments, &
Computers, vol. 36, n4, pp. 717-731
La part de leffet mdiateur par rapport leffet total peut tre calcul par le

b*
ratio : * 100 . Leffet total de la variable X sur la variable Y peut apprcier en
a
faisant la somme de leffet direct et leffet indirect b * .

Anda mungkin juga menyukai