Anda di halaman 1dari 21

Chapitre I : Les mthodes statistiques

danalyse de donnes

Trois grandes classes de mthodes


statistiques sont utilises :
(i) Les mthodes explicatives ;
(ii) Les mthodes descriptives ;
(iii) Les mthodes de prvision.

I. Les mthodes explicatives


Dans les mthodes explicatives, on
cherche relier une variable expliquer Y
un ensemble de variables explicatives
X1, , Xk.
Pour cela, on dispose dun tableau
individusvariables, tableau dont les lignes
reprsentent les valeurs des variables Y, X1,
, Xk sur les diffrents individus tudis.
2

suite I. Les mthodes

explicatives
Il sagit dajuster sur les donnes disponibles
le modle :
Y = f(X1, , Xk) + Rsidu
o f est le plus souvent, mais pas
toujours, une fonction linaire, et de
quantifier la fiabilit de la prvision de Y
partir des X1, , Xk.
Les mthodes statistiques utiliser
dpendent de la nature quantitative ou
qualitative des variables.
3

suite I. Les mthodes

explicatives
Tableau 1

Les mthodes explicatives


Variable
expliquer
Y

Variables explicatives
X1, , Xk
Quantitatives

Qualitatives

Rgression simple (k=1)

Quantitative

Analyse de la variance
Rgression multiple (k>1)

Mlange
Analyse de la
covariance

Analyse discriminante

Qualitative

Modle linaire gnralis


Rgression logistique

II. Les mthodes descriptives


Les mthodes descriptives sappliquent
aux tableaux individusvariables o
toutes les variables jouent le mme rle.
Il ny a pas de variable expliquer Y.
Il sagit donc de rsumer, de voir , de
comprendre le tableau de donnes
[X1,,Xk].
Ainsi, lobjectif des mthodes descriptives
est de visualiser et classer les donnes.
5

suite II. Les mthodes


descriptives
Figure 1 Mthodes descriptives
Axe 2

X1

X2

X3

X4

.4
X3

1
2
3
4
5

Tableau
individus

variables

1
X1

Axe 1
X2
5

X4

suite II. Les mthodes


descriptives
La visualisation des donnes consiste
associer au tableau IndividusVariables
une carte des individus (les points de la
figure 1), et des variables (les flches de
la figure 1) de telle sorte :

suite II. Les mthodes


descriptives
La position des individus sur la carte
traduit des ressemblances entre les
individus. Par exemple les individus 1 et
2 se ressemblent, mais sont trs
diffrents de lindividu 3.

suite II. Les mthodes


descriptives
La position des variables sur la carte
reflte les corrlations entre les variables
: les variables X1 et X2 sont fortement
corrles positivement, les variables X3
et X4 sont corrles ngativement, et les
variables X1, X2 sont faiblement
corrles aux variables X3, X4.

suite II. Les mthodes


descriptives
Les projections des individus sur les axes
variables refltent les valeurs des
variables sur les individus :
Les individus 1 et 2 sont forts sur X1, X2,
alors que lindividu 3 est faible sur ces
mmes variables ; lindividu 4 est moyen
sur X3, mais faible sur X4 et cest le
contraire pour lindividu 5.

10

suite II. Les mthodes


descriptives
Les mthodes de visualisation dpendent
de la nature des variables et sont
prsentes dans le tableau 2 :

11

suite II. Les mthodes


descriptives
Tableau 2

Mthodes descriptives : Mthodes de visualisation


Nature des variables X1, , Xk
Qualitatives
Quantitatives
k=2
Analyse en
composantes
principales (ACP)

Analyse
factorielle
des
correspondances (AFC)

k>2
Analyse factorielle
des
correspondances
multiples (AFCM)
12

suite II. Les mthodes


descriptives
Par ailleurs, les mthodes de classification
ont pour objectif de former des classes
dindividus et de variables de telle sorte
que :

13

suite II. Les mthodes


descriptives
des individus appartenant une mme
classe sont proches et des individus
appartenant des classes distinctes sont
loignes ;
des variables appartenant une mme
classe sont corrles entre elles, et des
variables appartenant des classes
distinctes sont faiblement corrles entre
elles.
14

suite II. Les mthodes


descriptives
Sur la figure 1, nous avons form une
typologie des individus en deux classes
{1,2,5} et {3,4}, et il apparat une
typologie des variables en deux classes
{X1,X2} et {X3,X4}.

15

suite II. Les mthodes


descriptives
Les mthodes de classification les plus
utilises en gestion sont :
La classification ascendante
hirarchique ;
Les nues dynamiques (nombre dindividus
lev).

16

suite II. Les mthodes


descriptives
Les mthodes descriptives (mthodes de
visualisation et mthodes de
classification) correspondent ce quon
appelle en France lanalyse de donnes.

17

III. Les mthodes de prvision


Cette troisime classe de mthodes
concerne lanalyse et la prvision
dune srie chronologique.
La description dune srie
chronologique consiste rechercher
une tendance, ventuellement une
composante saisonnire, et
identifier les valeurs extrmes.
18

suite III. Les mthodes de


prvision
La tendance est une courbe lisse
passant au milieu des donnes. Elle
est le plus souvent dtermine par
des mthodes de moyenne mobile,
mais on peut aussi utiliser un lissage
polynomial ou un lissage robuste
bas sur la mdiane mobile.
19

suite III. Les mthodes de


prvision
Une srie chronologique peut tre
dcompose en une tendance Tt,
une composante saisonnire St, et
des rsidus Rt laide dun modle
multiplicatif Xt=TtStRt .

20

suite III. Les mthodes de


prvision
La prvision repose sur la
construction dun modle reliant la
prsent au pass :
Xt=f(Xt-1,Xt-2, ...)+Bruit.

21

Anda mungkin juga menyukai