Anda di halaman 1dari 12

I.

ACP
Dans le cadre de lpuration des mesures, il est inluctable de vrifier la
dimensionnalit du construit utilis. Ceci se fait par le biais du nombre de
facteurs qui restituent le plus dinformations de lchelle. Toutefois, il faut
signaler que deux tapes pralables doivent tre entreprises.
Examen de la matrice de corrlation ou de covariance : lobjectif de
lanalyse factorielle exploratoire est de rduire ou de restituer linformation
contenue en un grand nombre ditems en un nombre trs rduit de facteur
sans pour autant dformer cette information. Ceci dit, les rponses des
items doivent tre fortement lies. Afin dexaminer lintensit du lien, le
chercheur doit choisir entre la matrice de corrlation et la matrice de
covariance. Si la batterie ditems utilise utilise le mme nombre
dchelons, la matrice de corrlation simpose sinon le choix de la matrice
de covariance devient inluctable. Dans notre cas de figure, nous avons
prvu lchelle de Likert cinq chelons tous les items.
Test de factorisabilit des donnes :Tet KMO et test de sphricit
de Bartlett : le premier test donne une prcision sur la qualit des
corrlations inter-items. Le test KMO varie entre 0 et 1. il permet de
quantifier le degr de corrlations entre les items. Cet indice varie entre 0
et 1. La valeur 1 indique que chaque variable est explique sans erreur par
les autres variables, Il est considr comme inacceptable en dessous du
seuil de 0.5, et doit tre de prfrence suprieur 0.8 voire 0.9 (Hair et
al., 20131). Le deuxime a pour objectif de tester lhypothse nulle selon
laquelle les variables sont indpendantes les unes des autres. Ce test est
significatif un seuil (p < 0.05), soit le rejet de lhypothse nulle et donc
les variables sont corrles entre elles.
Choix de la procdure danalyse factorielle : pour entreprendre une
analyse factorielle, le chercheur peut opter pour :
Une analyse en composante principale (ACP) : elle implique que les
variables forment une combinaison linaire exacte des facteurs. Elle
prsente lavantage dtre facile utiliser et interprter, do sa large
utilisation. Son inconvnient est quelle ne tient pas en compte les erreurs
1
Hair J. F., Anderson R. E., Tatham R. L. et Black W. C. (1998), Multivariate data analysis, 5me dition,
Englewood Cliffs, Prentice-Hall.

1
de mesure pour les variables non observables appeles aussi variables
latentes.
Une analyse factorielle classique (analyse en facteurs communs) (AFC) :
elle implique par contre que les variables forment une combinaison
linaire des facteurs avec des termes derreurs qui sont indpendants de
ceux-ci. Elle prsente lavantage dtre plus rigoureuse. Elle est
recommande lorsque lon cherche identifier des construits latents dont
les variables observes sont leur reflet soit rflectif soit formatif. cet
effet, lextraction des facteurs, dans une analyse en composante
principale (ACP), utilise la variance totale des variables et, dans une
analyse en facteurs communs (AFC), la variance de chaque variable
partage avec les autres. Cette mthode requiert lutilisation des
techniques des quations structurelles ou les techniques statistiques de
deuxime gnration.
Une fois que la mthode dextraction est retenue, il est possible de
dterminer le nombre de facteurs extraire partir de lanalyse des
valeurs propres. Dans notre cas, nous avons privilgi la premire
mthode.
Qualit de reprsentation des items : La qualit de la reprsentation
des items correspond la mesure du pourcentage de la variance
explique par chacune des variables de lanalyse. Il sagit de vrifier si les
items contribuent bien lexplication de la variance ou de linformation
restitue. Autrement dit, lanalyse de la qualit de la reprsentation
permet de dfinir si les items sont bien reprsents par la ou les
dimensions du construit. Cette qualit est mesure par un indice appel
communaut ou Loading. Les items dont la communaut est infrieure
0.5 seraient candidats llimination en adoptant une dmarche itrative
dpuration en commenant par les items dont la communaut est la plus
faible. Par ailleurs, nous soulignons que Hair et al (2013) 2 prcisent que le
choix de ce seuil est fonction de la taille de lchantillon et du seuil de
signification souhait.
Qualit de reprsentation des items 5%
2
Hair J. F., Anderson R. E., Tatham R. L. et Black W. C. (2013), Multivariate data analysis, 5me dition,
Englewood Cliffs, Prentice-Hall.

2
Taille de 50 60 70 85 100 120 150 200 250 350
lchantillon
Seuil de 0,7 0,7 0,6 0,6 0,5 0,5 0,4 0,4 0,3 0,3
signification 5 de 245 individus.
Notre chantillon est 5 En 5effet, le seuil
5 retenir5 doit 0tre

suprieur 0.35.
La qualit de reprsentation des items dterminent en grande partie le
nombre de facteur retenir et le pourcentage de la variance explique.
La variance explique et le nombre de facteur retenir : deux mthodes
sont prconises cet effet :
Lanalyse de la valeur propre : le nombre de facteurs conserver est
celui qui restitue une variance suprieure 100/p (avec p le nombre
ditems). En gnral, le chercheur peut prciser la valeur propre minimale
des facteurs retenir. Toutefois, le logiciel de lanalyse des donnes en
loccurrence SPSS fournit par dfaut les facteurs dont cette valeur est
suprieure lunit. Une autre technique conforte cette mthode, il sagit
de la mthode du coude qui par le biais de la reprsentation des valeurs
propres des facteurs indique le nombre de facteurs conserver aprs le
point de linflexion de la courbe.
La variance explique minimum : le nombre de facteurs retenir se fait
galement en fonction de la variance explique restitue par le ou les
facteurs. De nombreux auteurs saccordent dire que le (s) facteur (s)
retenir doit (vent) resituer au moins 60% de linformation de lchelle. Pour
augmenter artificiellement la variance explique, le chercheur dplacer les
axes factoriels retenus. Dans ce cadre, deux types de rotation sont
possibles : la rotation orthogonale, qui suppose une indpendance des
dimensions, les facteurs sont orthogonaux et donc non corrls, et la
rotation oblique, qui suppose des facteurs lis entre eux. La rotation
redistribue la variance dans la solution factorielle afin quil ny ait pas un
facteur qui explique toute la variance et ensuite une srie de plus petits
facteurs. La rotation orthogonale la plus utilise est la rotation Varimax
dveloppe par Kaiser (1958). Toutefois, si la structure simple et
facilement lisible ne peut pas tre fournie, la rotation oblique simpose au
chercheur. La mthode la plus frquente de la rotation oblique est oblimin.

3
Analyse de la fiabilit ou de la cohrence interne de lchelle : une
fois que lanalyse factorielle est ralise, il importe de sassurer de la
fiabilit interne de lchelle de mesure. En dautres termes, il sagit de
vrifier le degr dhomognit des items du construit. Classiquement,
lindice le plus utilis tait introduit par Cronbach en 1951. Le coefficient
alpha a une valeur comprise entre 0 et 1. Un coefficient de 0 reprsente
une fiabilit nulle et un coefficient de 1 traduit une fiabilit parfaite. Entre
ces deux valeurs, il est ncessaire de se demander quelle est la valeur
partir de laquelle un instrument doit tre considr comme fiable. Un mta
analyse conduite par Peterson (1994)3 donne une synthse et prescrit
recommandations sur le niveau de lalpha retenir. Cette mta analyse a
port sur 4286 coefficients choisis de 1030 chantillons et de 832
recherches montre un alpha moyen de 0.77 et que 75% des coefficients
ont une valeur suprieure 0.7 (49% suprieurs 0.8 et 14% suprieurs
0.9). En outre, alpha est acceptable sil est compris entre 0.6 et 0.84.
Prcisons que alpha de la valeur de cet indice est fonction de la qualit de
reprsentation des items. Si alpha nest pas acceptable, les items mal
reprsents et ceux dont la valeur de cet alpha par item dpasse la valeur
globale de lchelle doivent tre retirs.
Nous synthtisons dans le tableau suivant les seuils retenir pour la
conduite de lanalyse factorielle exploratoire.
Tableau 4.2. Synthse des seuils dacceptabilit des indices de
lACP
Indices Seuil dacceptabilit
Kaiser Meyer et Olkin P > 0,50
P < 0,50 de prfrence
Test de sphricit de Bartlett
proche de 0
Valeurs propres initiale P>1
Variance cumule explicative P > 60%
des facteurs
Qualit de reprsentation de P > 0,35
litem
3
Peterson A.D. (1994), "Une mta analyse du coefficient alpha de Cronbach ", Recherche et Application en
Marketing, Vol. 10, n2, pp. 75-88
4
Noreen M. W., Shavelson R. et Haertel E.H. ( 2006), Reliability Coefficients and Generalizability Theory in
Handbook of Statistics Psychometrics

4
Indice de corrlation entre les P > 0,20
facteurs
Alpha de Cronbach >0,7

II.Rgression
La rgression linaire multiple est une technique danalyse multi varie.
Elle se prsente comme une gnralisation, plusieurs variables
explicatives, de la rgression linaire simple. La rgression multiple
permet alors dexaminer la force de dpendance dune variable
dpendante, expliquer ou endogne et un ensemble de variables
indpendantes dites explicatives ou exognes. Pour pouvoir appliquer
cette technique, il faut que toutes les variables envisages soient
mtriques. Prcisons que la rgression multiple se distingue en deux
grandes classes : la premire pour faire des prdictions ou des prvisions.
Les prdictions consistent analyse les donnes collectes en temps
gnralement appeles big data pour faire une analyse discriminante
laide de lanalyse prdictive alors prvisions recourent aux donnes
passes appeles aussi observations releves pour faire des prvisions
avec lhypothse fondamentale le futur nest que le prolongement du
pass. Le modle gnral dun modle de rgression multiple peut tre
formul comme suit :
Y a1 x1 a 2 x 2 ... a n x n

Avec :
Y : Variable dpendante ou expliquer
x1 , x2 : Variables indpendantes ou explicatives

a1 , a2 : Coefficients de rgression qui expriment force explicative de


,.. ces relations de la variable dpendante vis--vis des variables
indpendantes
: Constante
: Le biais ou le terme derreur qui suit une loi normale N (0, )

Le recours la rgression multiple est tributaire au respect des


conditions :

5
Type de variables envisages : comme dj soulign, la premire
condition dutilisation de la rgression repose sur la nature des variables.
Celles-ci doivent tre nature mtrique. Rappelons que les variables
mobilises dans notre recherche sont mesures par une chelle
dintervalle de type Likert. Cette premire condition est vrifie pour notre
recherche.
Linarit de la variable dpendante et des variables
indpendantes : pour pouvoir appliquer la rgression linaire multiple, il
est indispensable de sassurer que les variables retenues forment une
combinaison linaire et non logarithmique ou quadratique en loccurrence.
Deux mthodes peuvent tre utilises afin de vrifier lexistence dune
relation linaire : le coefficient de corrlation de Pearson et le graphe de
dispersion des observations entre les variables (Jolibert et Jourdan, 2006).
Colinarit des variables explicatives : elle signifie que les variables
explicatives sont fortement corrles entre elles. Elle, lorsquelle existe,
fausse lestimation des coefficients de rgression. En dautres termes, la
rgression linaire multiple suppose que les variables explicatives soient
indpendantes les unes des autres (Evrard et al, 2000) 5. Deux variables
sont dites colinaires partir du moment o la corrlation entre les deux
est statistiquement significative (>0,5). Cette colinarit implique que les
variables partagent une partie de leur variance. La multi colinarit est le
fait quune variable indpendante est prdictible par une combinaison
linaire des autres variables aussi indpendantes. Pour pouvoir dtecter ce
problme, il est recommand de rgresser la variable indpendante
considre sur les autres variables indpendantes et calculer lindice
"Facteur d'inflation de la variance " Variance Inflation Factor (VIF). VIF =
1/tolrance o la tolrance correspond 1-R (principal de la rgression).
De faibles valeurs de VIF sont un indicateur de labsence de colinarit.
Les seuils acceptables pour ces deux indicateurs sont respectivement les
suivants : VIF < 3,3 et Tolerance > 0,3.
Normalit de la distribution des termes derreurs ou rsidus : les
rsidus doivent respecter la condition dhomoscdasticit, tre

5
Op cit

6
indpendants les uns des autres cest dire points reprsents ne doivent
pas suivre de tendance particulire, ils doivent tre rpartis alatoirement.
Aussi, les rsidus doivent tre distribus selon une loi normale.
La vrification des trois dernires conditions sappuie respectivement sur
lanalyse du graphique des rsidus, sur la conduite du test de Durbin-
Watson (idalement autour de 2). La normalit des donnes peut tre
teste par le calcul du coefficient dasymtrie (Skewness) et
daplatissement (Kurtosis), le premier ne devant pas dpasser |3|, le
second tant parfois accept jusqu |8|. Ces tests permettent de vrifier
que chaque variable a bel et bien une distribution proche dune
distribution normale (courbe de Gauss) dont la moyenne est nulle et
lcart type est lunit.
Une fois, les conditions dapplication de la rgression linaire multiple sont
remplies, il importe dinterprter les rsultats obtenus. Ceci, selon
lapproche prconise par Jolibert et Jourdan (2006), se fait au niveau
global, au niveau de chaque variable et enfin au niveau des rsidus.
Au niveau global valider la significativit statistique globale de la
rgression par lexamen du test F de Fisher. La valeur de ce test indique si
la variance ou lajout de variance explique sont significatifs, c'est--dire
si, quelle que soit la force de la relation entre les variables indpendantes
et la variable dpendante, cette relation est susceptible dexister dans la
population et nest pas due simplement lerreur dchantillonnage.
Au niveau de chaque variable : on vrifie la significativit statistique de
chaque coefficient de rgression par ltude du test t associ chaque
estimateur des coefficients de la rgression. Les valeurs du test t pour les
coefficients sont constitues par la division de la valeur du coefficient de
rgression par son erreur. Cet indice doit tre suprieur 2 (1.96 cart
type) pour quil soit tre significatif. Il indique si chacun des coefficients
des variables prsentes dans lquation est significatif. Un autre indicateur
vrifier, il sagit de coefficient standardis Bta appel aussi les
coefficients de rgression partiel. La standardisation consiste convertir
les variables en chelles commune, ceci revient centrer (autour de la
moyenne) et rduire (par rapport lcart type) ces variables. Cette

7
opration permet alors de rendre faisable la comparaison entre les
diffrentes variables du modle de rgression par le biais de llimination
des effets de mesure diffrentes. Par exemple, la taille du foyer et le
revenu (Hair et al, 1998). Nous affirmons que nos questions utilisent le
mme nombre dchelons savoir 5, ce problme de standardisation ne
se posera pas.
De mme, il importe de tester la significativit pratique de la rgression.
Ce test est examin par le coefficient de dtermination (R) qui se
prsente comme le pourcentage de la variation totale de la variable
expliquer explique par la rgression. Pour juger des valeurs du R,
Hair et al. (1998) proposent des seuils minimums de cet indice en fonction
de la taille de lchantillon et du nombre de variables indpendantes ainsi
que le seuil de signification souhait. De faon gnrale, plus R proche de
1, plus le modle est fiable. Toutefois, il est recommand dutiliser le R
ajust qui est une mesure modifie du coefficient de dtermination qui
tient compte du nombre de variables indpendantes envisages dans le
modle de rgression et la taille de lchantillon pour tenir compte de
rendements dcroissants. Cet indice est particulirement utile, par
exemple, lors de la comparaison dquations de rgression, ayant un
nombre diffrent de variables indpendantes, des tailles dchantillons
diffrentes ou les deux (Hair et al., 1998 ; Malhotra et al., 2007).
Tableau 4.22- des valeurs de R en fonction de la taille de lchantillon
et seuil de signification
Taille de Niveau de signification Niveau de signification
lchantil 0,01 0,05
lon Nombre de variables Nombre de variables
2 5 10 20 2 5 10 20
20 45 56 71 ----- 39 48 64 -----
50 23 29 36 49 19 23 29 42
100 13 16 20 26 10 12 15 21
250 5 7 8 11 4 5 6 8
500 3 3 4 6 3 4 5 9
1000 1 2 2 3 1 1 2 2
Bta : Le coefficient standardis permet de comparer la contribution de
chaque variable puisquil sagit du coefficient de rgression ramen sur
une chelle standard (variant de -1 +1).

8
Selon Jolibert et Jourdan (2006), si le test de Fisher permet de vrifier la
significativit statistique globale de la rgression, le t de Student teste la
significativit des estimations des coefficients de corrlation. Labsence de
significativit dun coefficient signifie que la variable explicative auquel il
est attach na quun impact marginal sur la variable dpendante. La
significativit statistique de chaque coefficient de rgression permet de
dtecter si les variables explicatives tudies ont un effet sur la variable
expliquer.
III.1.2. Test de relations indirectes avec variable mdiatrice
Une variable mdiatrice est, selon Baron et Kenny 6, le mcanisme par
lequel une variable indpendante influe sur une variable dpendante, et
constitue en tant que tel, le cur du modle causal. La variable
mdiatrice permet donc dexpliquer la manire, le processus par lequel
une variable indpendante influence une variable dpendante. Une
variable mdiatrice est la fois une variable consquente et une variable
dterminante". Afin de clarifier davantage leur dfinition, ils proposent la
reprsentions graphique suivante :
Une variable mdiatrice est, selon Baron et Kenny "le mcanisme par
lequel une variable indpendante influe sur une variable dpendante, et
constitue en tant que tel, le cur du modle causal. La variable
mdiatrice permet donc dexpliquer la manire, le processus par lequel
une variable indpendante influence une variable dpendante. Une
variable mdiatrice est la fois une variable consquente et une variable
dterminante". Afin de clarifier davantage leur dfinition, ils proposent la
reprsentions graphique suivante :

6
Baron R.M. et Kenny D.A. (1986), "The moderator-mediator variable distinction in social psychological
research: conceptual, strategic and statistical considerations", Journal of Applied Social Psychology, vol.51,
n16, pp. 1173-1182

9
Figure variable mdiatrice
La technique statistique prconise pour vrifier le rle mdiateur,
complet ou partiel, est la rgression la fois simple et multiple
(Baron et Kenny (1986 ; Caceres et Vanhamme, 2003 7, Borau et al,
20158). trois conditions vrifier :
1re condition : la variable initiale X, qui est dterminante, doit tre
corrle avec la variable rsultat Y. Cela revient rgresser Y sur X et
montrer que le chemin a (coefficient de rgression) est significatif.
Y aX erreur . Le coefficient a reprsente leffet total : direct et indirect,
de X sur Y.
2me condition : la variable X doit aussi avoir un impact consquent sur la
variable mdiatrice M. il sagit alors de rgresser M sur X et montrer que le
chemin b est significatif :
M bX erreur
3me condition : vrifier que la variable mdiatrice M influence
positivement la variable rsultat Y. pour ce faire, il importe de rgresser Y
sur M. Toutefois, il importe de souligner que le mdiateur M et le rsultat Y
peuvent tre corrls parce quils sont les deux la consquence de la
variable initiale X. Par consquent, la variable mdiatrice M doit avoir un
effet significatif sur Y lorsque linfluence de la variable X sur Y est
contrle. Cela revient alors de rgresser Y sur X et sur M et montrer que
le coefficient dans lquation suivante est significatif.
Y X M erreur
Les coefficients b dans la deuxime condition et dans la troisime
condition servent mesurer limpact de X sur Y cest--dire linfluence de
X qui est transfre par M. cet effet vaut b *
Le coefficient permet de mesurer leffet direct de X sur Y. pour
dterminer la nature de leffet mdiateur : partiel ou total, il est judicieux
dvaluer la significativit de ce coefficient. Si est faible, le mdiateur
7
Caceres, R.C. et Vanhamme, J. (2003), Les processus modrateurs et mdiateurs : distinction conceptuelle,
aspects analytiques et illustrations, Recherche et Applications en Marketing, 18, 2. 67-100.
8
Borau A.. El Akremi A., Elgaaied-Gambier L., Hamdi-Kidar L. et Ranchoux C. (2015), Lanalyse des effets
de mdiation modre: Applications en marketing, Recherche et Applications en Marketing , Vol. 30, n4, pp.
95-138

10
M est qualifi de total ou complet. Cependant, quand limpact de X sur Y
est moins lev mais existe, on parle dune mdiation partielle (Baron et
Kenny).
Pour apprcier la significativit de leffet mdiateur de M, le test Z de
Soble9 (1996) est prconis. Il snonce comme suit :
b*
Z Sobel
* s b 2 * s 22 s12 * s 22
2 2
1

Avec s1 et s2 correspondent respectivement aux erreurs standards de et


de b . Ce test sinterprte selon une distribution de loi normale. Pour quil
soit significatif, il est recommand quil soit suprieur 1,96 pour un
niveau de signification de 1%.
La part de leffet mdiateur par rapport leffet total peut tre calcul par

b*
le ratio : * 100 . Leffet total de la variable X sur la variable Y peut
a
apprcier en faisant la somme de leffet direct et leffet indirect b * .
Limpact de X sur Y cest--dire linfluence de X qui est transfre par M.
cet effet vaut b *
Le coefficient permet de mesurer leffet direct de X sur Y. pour
dterminer la nature de leffet mdiateur : partiel ou total, il est judicieux
dvaluer la significativit de ce coefficient. Si est faible, le mdiateur
M est qualifi de total ou complet. Cependant, quand limpact de X sur Y
est moins lev mais existe, on parle dune mdiation partielle (Baron et
Kenny).
Pour apprcier la significativit de leffet mdiateur de M, le test Z de
Soble10 (1996) est prconis. Il snonce comme suit :
Avec s1 et s2 correspondent respectivement aux erreurs standards de et
de b . Ce test sinterprte selon une distribution de loi normale. Pour quil
soit significatif, il est recommand quil soit suprieur 1,96 pour un
niveau de signification de 1%.

9
Preacher K.J. et Hayes A.F. (2004), SPSS and SAS procedures for estimating indirect effects in simple
mediation models, Behavior Research Methods, Instruments, & Computers, vol. 36, n4, pp. 717-731
10
Preacher K.J. et Hayes A.F. (2004), SPSS and SAS procedures for estimating indirect effects in simple
mediation models, Behavior Research Methods, Instruments, & Computers, vol. 36, n4, pp. 717-731

11
La part de leffet mdiateur par rapport leffet total peut tre calcul par

b*
le ratio : * 100 . Leffet total de la variable X sur la variable Y peut
a
apprcier en faisant la somme de leffet direct et leffet indirect b * .

12