Anda di halaman 1dari 6

Detection et isolation de defauts par analyse en

composantes principales robuste.


Yvon Tharrault, Gilles Mourot, Jose Ragot
Centre de Recherche en Automatique de Nancy (CRAN), Nancy Universite, CNRS,
2, Avenue de la foret de Haye, 54516 Vandoeuvre-l`es-Nancy, France
prenom.nom@ensem.inpl-nancy.fr
http://cran.uhp-nancy.fr
ResumeLAnalyse en Composantes Principales (ACP) est
une methode ecace pour la detection et la localisation
de defauts. Cependant, lACP classique est tr`es sensible
`a la presence de valeurs aberrantes. Cette communication
presente un algorithme `a deux niveaux pour la detection et
la localisation de defauts de mesures. Tout dabord un MM-
estimateur est utilise pour determiner un mod`ele robuste.
Cet estimateur est calcule avec un algorithme iteratif, initia-
lise par une estimation robuste de la matrice de covariance.
Cette approche consiste `a minimiser une mesure robuste
des distances orthogonales des observations au sous-espace
de lACP (espace residuel). Ensuite, des residus structures
sont generes pour detecter et localiser des defauts multiples.
La generation de ces residus structures est basee sur lutili-
sation dun indicateur combine qui permet de detecter des
defauts sur lensemble des variables et sur le principe de
reconstruction des variables. De plus, lanalyse, limitee aux
defauts isolables, permet deviter lexplosion combinatoire
des scenarios de defauts dans le cas de defauts multiples.
Cette procedure est appliquee avec succ`es sur un syst`eme
soumis `a des defauts multiples.
Mots-cles ACP, Valeurs aberrantes, robustesse, signature
de defauts, diagnostic, MM-estimateur.
I. Introduction
Lanalyse en composantes principales (ACP) a ete uti-
lisee avec succ`es dans la surveillance de syst`emes com-
plexes. LACP est essentiellement basee sur la mise en
evidence de relations lineaires entre les variables et presente
un caract`ere doptimalite au sens dun crit`ere portant
sur lerreur quadratique destimation en valeur moyenne
(MSE). Il est bien connu que lestimation basee sur lutili-
sation de crit`ere de type MSE nest pas robuste aux va-
leurs aberrantes. Rappelons que lapproche classique de
lACP utilise un calcul preliminaire de la moyenne des
donnees et de leur matrice de variance-covariance ; comme
la moyenne et la variance sont sensibles `a la presence de
valeurs aberrantes, les resultats obtenus sav`erent souvent
inexploitables car trop biaises par linuence de ces va-
leurs aberrantes. En general, dans un jeu de donnees, la
majorite des observations est associee `a des conditions de
fonctionnement normal. Le reste des observations (obte-
nues durant des periodes de demarrage, darret, de fonc-
tionnement degrade, erreurs de mesure, ...) sont nommees
valeurs aberrantes. Pour tolerer la presence de valeurs
aberrantes, une analyse en composantes principales ro-
buste peut etre conduite. Plusieurs methodes permettant
de rendre robuste lanalyse en composantes principales ont
ete proposees. Elles peuvent etre regroupees de la mani`ere
suivante. Un premier groupe remplace la matrice classique
de variance-covariance par une estimation robuste de celle-
ci, comme par exemple lestimateur MCD (Minimum Co-
variance Determinant) [1]. Cette methode necessite des
co uts de calcul importants et poss`ede un param`etre de
reglage, deni par lutilisateur, qui doit etre optimise en
fonction du nombre de valeurs aberrantes (inconnu). Une
seconde approche utilise les projections revelatrices. Ces
methodes maximisent une mesure robuste de la disper-
sion des donnees an dobtenir les directions sur lesquelles
projeter les donnees [2], [3]. Cependant pour permettre
le calcul de cet estimateur, les directions robustes obte-
nues ne sont que des approximations des vraies directions.
Les derni`eres approches consistent `a minimiser une me-
sure robuste des distances orthogonales des observations au
sous-espace de lACP (espace residuel), similaires aux LTS
estimateur, MM-estimateur [4]. Ces methodes, basees sur
des procedures iteratives, sont simples `a mettre en oeuvre.
Cependant elles necessitent deux types de param`etres de
reglages inconnus, la taille de lespace residuel, cest-` a-dire
le nombre de composantes principales du syst`eme, ainsi que
les valeurs initiales de lalgorithme.
Notre presentation est consacree au probl`eme de
detection et de localisation de defauts dans des donnees.
Dans cet article, un algorithme `a deux niveaux est pro-
pose. Un estimateur appartenant au dernier groupe dap-
proches presentees est choisi, en eet, un MM-estimateur
est utilise pour determiner un mod`ele robuste. Cet estima-
teur calcule avec un algorithme iteratif, est initialise avec
un estimateur robuste de la matrice de covariance. De plus,
pour determiner le nombre de composantes principales, une
procedure robuste est proposee. Ensuite, des residus struc-
tures sont utilises pour detecter et localiser des defauts mul-
tiples. La generation de ces residus structures est basee sur
lutilisation dun indicateur combine qui permet de detecter
des defauts sur lensemble des variables et sur le principe
de reconstruction. De plus, lanalyse des defauts isolables
permet deviter lexplosion combinatoire des scenarios de
defauts dans le cas de defauts multiples. La section 2 est
un bref rappel, dune part, de lanalyse en composantes
principales dans le cas classique et, dautre part, de lana-
lyse en composantes principales robuste aux valeurs aber-
rantes. Section 3, une methode robuste pour determiner
le nombre de composantes principales est presentee. Puis,
une procedure de detection et de localisation des valeurs
aberrantes est ensuite proposee en section 4. Finalement
en section 5, cette methode est appliquee `a un exemple
de synth`ese avec des defauts aectant plusieurs variables
simultanement.
II. Principe de lanalyse en composantes
principales
Soit une matrice de donnees X
Nm
, de vecteurs
lignes x
T
i
, qui rassemble les N mesures eectuees sur les m
variables du syst`eme.
A. Approche classique
Dans le cas de lACP classique, les donnees sont sup-
posees etre recueillies sur un syst`eme en fonctionnement
normal (absence de defauts).
LACP determine une transformation optimale (vis-` a-vis
dun crit`ere de variance) de la matrice de donnees X :
T = XP et X = TP
T
(1)
avec T
Nm
, matrice des composantes principales et
P = [p
1
p
2
. . . p
m
]
mm
o` u les vecteurs orthogonaux p
i
sont les vecteurs propres correspondant aux valeurs propres

i
de la decomposition en valeurs et vecteurs propres de la
matrice de covariance de X :
= PP
T
avec PP
T
= P
T
P = I
m
(2)
avec une matrice diagonale o` u les termes diagonaux sont
ordonnes dans lordre decroissant.
Les relations (1) trouvent leur interet lorsquon dimi-
nue la dimension de lespace de representation. Une fois
determine le nombre de composantes `a retenir, la matrice
X des donnees peut etre approximee. Pour cela la matrice
des vecteurs propres est partitionnee sous la forme :
P =
_

P

P
_

P R
m
(3)
Les premiers vecteurs propres

P constituent lespace prin-
cipal alors que les (m ) derniers vecteurs propres

P
constituent lespace residuel. A partir de la decomposition
(1), on peut alors expliciter la partie

X des donnees ex-
pliquees par les premiers vecteurs propres et la partie
residuelle

X expliquee par les composantes restantes :

X = X

P

P
T
= X

C

(4)
E = X

X = X(I

C

) (5)
o` u lon notera que la matrice

C

=

P

P
T
nest pas egale `a
la matrice identite. De plus, on note

la matrice diagonale
contenant les valeurs propres les plus importantes.
Le residu r
i
, pour i = 1..N, est deni par :
r
i
= ||

P
T
x
i


P
T
||
2
(6)
o` u est le vecteur contenant la moyenne des dierentes
variables de la matrice X.
Minimiser la fonction (7) des erreurs destimation sous
la contrainte

P
T

P = I
m
, correspond `a choisir

P comme
les m vecteurs propres de la matrice de covariance .
=
1
N
N

i=1
r
i
(7)
B. Approche robuste
Lapproche proposee consiste `a appliquer directement
lACP sur un jeu de donnees qui peut-etre aecte par
des valeurs aberrantes. Pour cela, un estimateur robuste
simple est utilise, appele MM-estimateur. Cependant cet
estimateur est calcule en utilisant une procedure iterative,
ce qui necessite une bonne initialisation de lalgorithme an
deviter de converger vers des minimums locaux. Pour ini-
tialiser ce MM-estimateur, une version robuste de la ma-
trice de covariance est dabord calculee [5].
B.1 Covariance robuste
Dans [6] les auteurs denissent une matrice de variance
et covariance locale en ce sens que la forme proposee
tend `a privilegier la contribution dobservations proches au
detriment dobservations eloignees dues `a la presence de
valeurs aberrantes. Cette matrice est denie en fonction
des observations x
i
:
T =
N1

i=1
N

j=i+1
w
i,j
(x
i
x
j
)(x
i
x
j
)
T
N1

i=1
N

j=i+1
w
i,j
(8)
o` u les poids w
i,j
sont eux-memes denis par :
w
i,j
= exp
_

2
(x
i
x
j
)
T

1
(x
i
x
j
)
_
(9)
etant un param`etre `a regler pour obtenir eectivement
une reduction de linuence des observations eloignees, les
auteurs preconisant une valeur voisine de 2. On remarque
que pour = 0, on retrouve la matrice de covariance clas-
sique . De plus pour une valeur elevee de , seul les ob-
servations proches sont prises en compte.
B.2 MM-estimateur
Deux M-estimateurs sont utilises, un pour lestimation
de la fonction objectif (7) et un autre pour lestimation
robuste de la dispersion des residus. Le MM-estimateur mi-
nimise le crit`ere suivant sous contrainte

P
T

P = I
m
[4] :
1
N
N

i=1

_
r
i

_
(10)
avec r
i
le residu deni par (6), la dispersion robuste des
residus r
i
. La fonction :
+
[0, 1] est non decroissante
et derivable, avec (0) = 0 et () = 1.

P est la matrice des vecteurs propres de la matrice de cova-


riance robuste S (12) correspondant aux m plus petites
valeurs propres. La moyenne ponderee et la covariance S
sont denies comme suit :
=

N
i=1
w
i
x
i

N
i=1
w
i
avec w
i
=
_
r
i

_
(11)
S =
N

i=1
w
i
(x
i
)(x
i
)
T
(12)
De plus le facteur de dispersion est deni comme la
solution de :
1
N
N

i=1

_
r
i

_
= (13)
avec (0, 1). Ce param`etre est directement lie au
nombre dobservations considerees comme saines dans le
jeu de donnees.
Lalgorithme utilise est le suivant :
1. it = 1 et
0
=
2. Calculer

P la matrice des vecteurs propres de la matrice
de covariance robuste T correspondant aux m plus pe-
tites valeurs propres.
3. Calculer a = mediane(X

P)
4. Calculer = trace(
_

P
T
T

P)
5. Faire tant que it N ou que tol
(a) Calculer r
i
= ||

Px
i
a||
2
pour i = 1...N
(b) Si it > 1, calcul `a partir de (13)
(c) Calculer = 1 /
0
et
0
=
(d) Calculer w
i
= (r
i
/ ) pour i = 1...N
(e) Calculer `a partir de (11)
(f) Calculer S `a partir de (12)
(g) Calculer

P la matrice des vecteurs propres de la ma-
trice de covariance robuste S correspondant aux m plus
petites valeurs propres.
(h) Calculer a =

P
T

(i) Calculer it = it + 1
6. Fin tant que.
Dans les exemples de cet article, est choisie comme la
fonction Bisquare (r represente le carre des distances).
(r) = min{1, 1 (1 r)
3
} (14)
La valeur de la constante dans lequation (13) est
denie en maximisant le point de rupture (nombre de va-
leurs aberrantes tolerables par lalgorithme) [4] :
=
N n + 1
2N
(15)
A partir de ce nouveau mod`ele, la detection et lisolation
des valeurs aberrantes est eectuee en utilisant le principe
de reconstruction des variables.
III. D etermination robuste du nombre de
composantes principales
Lalgorithme pour determiner le mod`ele robuste
necessite la determination robuste du nombre de compo-
santes principales `a choisir. Pour cela, nous allons utiliser
le principe de minimisation de la variance de reconstruction
[7].
Le nombre de composantes principales `a retenir sobtient
en minimisant la variance de lerreur de reconstruction par
rapport `a , le crit`ere est alors :
J() =
m

j=1

T
j
(I
m

) S (I
m

)
j
_

T
j
(I
m

)
j
_
2
(16)
avec = 1, . . . , m 1, S la matrice de variance-
covariance robuste et
j
la direction de reconstruction
(
j
= [0 ... 1 ... 0]
T
la valeur 1 etant `a la j
i`eme
position)
Qin et Dunia (2000) ont montre que ce crit`ere peut
presenter un minimum dans lintervalle [1, m]. De plus,
ces auteurs proposent decarter de lensemble des variables
utilisees pour la determination du nombre de compo-
santes principales, celles pour lesquelles la variance der-
reur de reconstruction est superieure `a la variance derreur
de reconstruction obtenue en utilisant la valeur moyenne
comme meilleure reconstruction. En eet, les variables peu
correlees avec les autres ne peuvent pas etre reconstruites
avec une bonne precision.
IV. D etection et localisation de d efauts
An dassurer la detection de lensemble des defauts
dans lespace principal et dans lespace residuel, un indi-
cateur global est utilise. La localisation des defauts est en-
suite eectuee en utilisant le principe de reconstruction qui
consiste `a eliminer linuence des defauts.
A. Detection de defauts
Pour la detection de defauts, deux indicateurs sont
generalement utilises, le SPE pour detecter un defaut dans
lespace residuel et le T
2
pour detecter un defaut dans les-
pace principal. Le syst`eme, caracterise par le vecteur x, est
considere en fonctionnement normal si :
SPE(x) = ||(I

P

P
T
)x||
2

2
T
2
(x) = x
T

P

1

P
T
x
2
I
avec
2
et
2
I
sont des seuils de detection.
Cependant, suivant lamplitude et la nature des defauts, un
defaut peut avoir un impact sur seulement un de ces deux
indicateurs. Ainsi, pour assurer la detection de lensemble
des defauts, nous utilisons un indicateur combine [8]. Cette
indicateur est deni par la relation suivante :
=
T
2
(x)

2
I
+
SPE(x)

2
(17)
Compte tenu des expressions de T
2
et de SPE, on a aussi :
= x
T
x (18)
avec
=

1

P
T

2
I
+
I

P

P
T

2
(19)
Le syst`eme est considere en fonctionnement normal si :

2
(20)
o` u
2
est le seuil de detection deni en [8]
B. Principe de reconstruction
La reconstruction x
R
est obtenue en minimisant lin-
uence des defauts. Le vecteur de reconstruction x
R
est
deni par la relation suivante :
x
R
= x
R
f
R
(21)
avec f
R
lamplitude (inconnue) du defaut et la matrice
R
indique les directions de reconstruction. Cette matrice est
orthonormale de dimension (m r), avec r le nombre de
variables reconstruites. Elle est constituee de 0 et de 1,
o` u 1 indique les variables reconstruites `a partir des autres
variables (avec 0) et du mod`ele ACP. Par exemple, pour re-
construire le jeu de variables R = {2, 4} parmi 5 variables,
la matrice
R
est construite comme suit :

R
=
_
0 1 0 0 0
0 0 0 1 0
_
T
Lestimation de lamplitude du defaut f
R
est alors obte-
nue en resolvant le probl`eme doptimisation suivant :

f
R
= arg min
f
R
{
R
}
= arg min
f
R
_
x
T
R
x
R
_
(22)
Le vecteur de reconstruction x
R
du vecteur x est donne
par :
x
R
= G
R
x (23)
avec G
R
=
_
I
R
(
T
R

R
)
1

T
R

_
Condition de reconstruction :
Pour quun defaut soit reconstructible, il faut quil soit au
minimum projete dans lespace principal (r ) ou dans
lespace residuel (r m ). Cette condition implique
que le nombre de variables reconstruites r doit respecter
linegalite (24) :
r max(m, ) (24)
C. Generation de residus structures
Dans un objectif de diagnostic, des residus sont generes
pour la detection et la localisation de defauts. Lindice de
detection est :

R
= x
T
R
x
R
(25)
Un vecteur de mesure x est compose de sa valeur x

en
absence de defauts et dun defaut damplitude d et de di-
rection
F
, o` u F est le sous-ensemble contenant les indices
des directions des defauts :
x = x

+
F
d (26)
Considerons toutes les reconstructions possibles de x :
si la direction de reconstruction
R
est celle du defaut,
cest-` a-dire si R = F, alors
R
est inferieur au seuil de
detection
2
, en eet :

R
= x
T
x

x
T

R
(
T
R

R
)
1

T
R
x

(27)
o` u x
T
x


2
et x
T

R
(
T
R

R
)
1

T
R
x

> 0
donc
R
<
2
si la direction de reconstruction
R
est dierente de
celle du defaut, alors lerreur de reconstruction
R
est
superieure `a
2
si les projections des directions de re-
construction ne sont pas colineaires `a la projection du
defaut dans lespace principal et dans lespace residuel.
Pour les observations en defaut, les jeux de variables
defaillantes

R sont determines comme suit :

R = arg
R

R
<
2

(28)
avec lensemble des combinaisons des directions de re-
constructions possibles.
D. Localisation de defauts
Lensemble des directions de reconstruction
R
doit etre
explore pour la detection et lisolation des defauts. Les so-
lutions pour lesquelles les defauts ne sont pas detectables,
sont inutiles. Le nombre de reconstructions possibles peut
donc etre reduit, et les defauts detectables peuvent etre a
priori repertories.
Le nombre maximum de reconstructions peut etre calcule
`a laide de la formule suivante :
max(m,)

r=1
C
r
m
(29)
avec C
r
m
represente le nombre de combinaisons possibles de
choisir r variables parmi m.
Ce nombre peut-etre reduit en prenant en compte les direc-
tions de projections colineaires. Nous allons donc analyser
les angles entre les dierentes projections des directions de
reconstruction. Le plus grand angle principal entre deux
sous-espaces de meme dimension est lie `a la notion de dis-
tance entres ces deux sous-espaces [9]. Cette distance est
denie dans lespace principal d(R1, R2) et dans lespace
residuel

d(R1, R2) :
d(R1, R2) = ||

R
1
(

T
R
1

R
1
)
1

T
R
1

R
2
(

T
R
2

R
2
)
1

T
R
2
||
2
(30)

d(R1, R2) = ||

R
1
(

T
R
1

R
1
)
1

T
R
1

R
2
(

T
R
2

R
2
)
1

T
R
2
||
2
(31)
avec

R
1
=

1/2

P
T

R
1
,

R
1
=

P
T

R
1
et R
1
et R
2
cor-
respondent aux ensembles des variables de reconstruction.
En analysant les distances entre les projections des direc-
tions de reconstruction dans lespace principal (30) et dans
lespace residuel (31), on peut alors determiner les defauts
qui seront localisables. Un indicateur k est alors construit :
k(R
1
, R
2
) = max{(d(R
1
, R
2
),

d(R
1
, R
2
)} (32)
Donc si k(R
1
, R
2
) est proche de 0 cela signie que les
directions des ensembles des variables de reconstruction R
1
et R
2
sont colineaires dans lespace residuel et dans lespace
principal et un defaut dans les ensembles des variables de
reconstruction R
1
ou R
2
ne sera donc pas localisable. La
demarche pour determiner lensemble des reconstructions
utiles `a calculer peut etre resumee de la fa con suivante :
1. r = 1
2. Calculer pour lensemble des directions possibles (R
1

et R
2
) lindicateur k(R
1
, R
2
) (32). Plus cet indi-
cateur est petit, plus lamplitude du defaut doit etre im-
portante pour assurer la localisation du defaut. Et si cet
indicateur est nul, alors seul lensemble des variables po-
tentiellement en defaut peut etre determine, cest-` a-dire les
variables avec les indices R
1
, R
2
ou R
1
et R
2
. Il est donc
necessaire de considerer une seule direction, par exemple
R
1
.
3. r = r + 1
4. Tant que r max(, m) aller `a letape 2
Lanalyse de la structure du mod`ele permet de
determiner les defauts localisables et ainsi de diminuer le
nombre de reconstructions utiles.
V. R esultats num eriques. cas multi-d efauts
A. Generation des donnees
Pour mettre en evidence laptitude de la methode pro-
posee `a detecter des defauts, un exemple de synth`ese dont
les valeurs aberrantes sont parfaitement connues est utilise.
La matrice X est constituee de N = 128 observations dun
vecteur x `a 9 composantes generees de la fa con suivante :
x
i,1
= v
2
i
+ sin(0.1i), v
i
N(0, 1) (33)
x
i,2
= 2 sin(i/6) cos(i/4) exp(i/N)
x
i,3
= log(x
2
i,2
), x
i,4
= x
i,1
+ x
i,2
x
i,5
= x
i,1
x
i,2
, x
i,6
= 2x
i,1
+ x
i,2
x
i,7
= x
i,1
+ x
i,3
, x
i,8
N(0, 1)
x
i,9
N(0, 1)
Aux donnees ainsi generees ont ete superposees des
realisations de variables aleatoires `a distribution normale
centree et decart-type 0.02. De plus, des defauts sont
ajoutes aux instants 10 `a 24 (intervalle I
1
) pour les va-
riables x
1
et x
3
, aux instants 35 `a 49 (intervalle I
2
) pour
les variables x
1
et x
2
, aux instants 60 `a 74 (intervalle I
3
)
pour les variables x
4
et x
8
, aux instants 85 `a 99 (intervalle
I
4
) pour la variable x
8
. Ils sont representes par des biais
damplitude egale `a 1 sur les variables x
1
`a x
4
et dampli-
tude egale `a 15 et `a 30 sur la variable x
8
dans lintervalle
I
3
et I
4
. Les defauts sur la variable x
8
sont plus importants
que sur les autres, car cette variable est independante des
autres. En eet, elle ne poss`ede pas de projection dans les-
pace residuel, il est donc necessaire de detecter le defaut
`a partir de lespace principal. Or pour detecter un defaut
dans lespace principal, lamplitude du defaut doit etre plus
importante que dans lespace residuel [10].
B. Determination du nombre de composantes principales
La variance derreur de reconstruction est calculee pour
lensemble des observations. La variance derreur de recons-
truction est importante pour les deux derni`eres variables,
elles sont donc independantes des autres. Il faut donc les
retirer dans ce calcul. La gure 1 represente les valeurs de
cette variance en fonction du nombre de composantes prin-
cipales utilisees. Le minimum est obtenu pour = 5, ce qui
correspond donc au nombre de composantes principales `a
retenir.
1 2 3 4 5 6
0
1
2
3
4
5
Nombre de composantes principales
Variance non reconstruite
Fig. 1. Valeur de la variance derreur de reconstruction en fonction
du nombre de composantes principales
C. Choix du param`etre de reglage
Une analyse du param`etre de reglage est eectuee (-
gure 2) sur le residu
1
(25). Pour cela, une comparaison
des performances dun mod`ele construit `a partir de la ma-
trice de covariance robuste T ((T) dans la legende) et dun
mod`ele construit `a partir du MM-estimateur ((T+M) dans
k R
1
1 2 3 4 5 6 7 8 9
1 0 1 0.99 1.00 0.92 0.92 1.00 1.00 0.99
2 0 1.00 0.96 0.73 0.97 1.00 1.00 1.00
3 0 1.00 0.96 1.00 0.40 1.00 1.00
R
2
4 0 0.97 0.73 1.00 0.99 1.00
5 0 0.97 0.99 1.00 1.00
6 0 1.00 0.99 1.00
7 0 1.00 0.99
8 0 1.00
TABLE I
indicateur k pour r = 1
la legende) est eectuee `a partir de la reconstruction de
la premi`ere variable. On observe alors que pour une petite
valeur de , les defauts ne sont pas correctement detectes
sur lintervalle I
4
. En eet, la matrice de covariance ro-
buste est mal estimee et donc le MM-estimateur est mal
initialise. Pour les valeurs de superieures ou egales `a 2,
la detection avec le MM-estimateur reste identique alors
que la detection avec la matrice de covariance robuste T se
degrade en fonction de la valeur de . Le MM-estimateur
permet donc de reduire linuence du param`etre ; dans
la suite = 2 est choisi.
20 40 60 80 100 120
5
10

=
0
.
2
20 40 60 80 100 120
5
10

=
2
20 40 60 80 100 120
5
10
20 40 60 80 100 120
5
10
Time

=
1
0 (T+M)
1

(T)
1
(T+M)
1

(T)
1
(T+M)
1

(T)
1
(T+M)
1

(T)
1

=
5
Fig. 2.
1
en fonction du param`etre
D. Analyse des directions de reconstruction utile
Compte tenu de la dimension de lespace principal, on ne
peut pas reconstruire plus de 5 variables simultanement. Le
nombre maximum de reconstructions est donc de 381. La
table I montre les valeurs de lindicateur k (32) pour r = 1.
Plus la valeur de k est petite, plus lamplitude du defaut
necessaire pour assurer la localisation du defaut doit etre
importante. Il ny a pas de projection colineaire (k dierent
de 0), donc lensemble des defauts apparaissant sur une
seule variable sont localisables. On eectue ce meme calcul
pour r = 2, on trouve alors que les projections des di-
rections {1, 3} et {1, 7} sont colineaires. Les signatures de
ces deux directions de reconstruction sont donc identiques
(
1,3
=
1,7
), il est donc utile de considerer seulement une
de ces deux directions, par exemple
1,3
. De plus, on en
deduit que les signatures des directions de reconstruction
prenant en compte ce couple sont identiques (
1,2,3
=
1,2,7
,

1,4,3
=
1,4,7
, ...). La meme procedure est appliquee pour
r = 3 `a 5. Le nombre de reconstructions necessaires peut
alors etre reduit `a 150.
E. Detection de defauts
Sans eectuer de reconstruction, lindicateur combine
(25) a ete utilise pour calculer un residu qui rev`ele la
presence de defaut dans les quatre intervalles I
1
, I
2
, I
3
, I
4
,
sans pour autant pouvoir incriminer une variable parti-
culi`ere. Cette phase de detection est maintenant completee
par une phase de localisation des defauts.
0
10
20
0
10
20
0
10
20
0
10
20
0
10
20
0
10
20
0
10
20
0
10
20
0
10
20
0
10
20
0
10
20
0
10
20
0
10
20
0
10
20
0
10
20
0
10
20
0
10
20
10 25 35 50 60 75 85 100
0
10
20
Time

4,6

4,5

2,6

2,5

2,4

4,8

1,6

1,5

1,4

1,3

1,2

1
Fig. 3. Localisation des defauts
La gure 3 montre une partie de ces indicateurs. Le pre-
mier graphique de cette gure est relative `a la projection
des residus avec reconstruction sans utiliser la premi`ere va-
riable ... Analysons le sixi`eme graphique de la gure 3. Pour
les observations de lintervalle I
4
lindicateur
8
est proche
de la valeur 0 temoignant ainsi de labsence de valeurs aber-
rantes dans les variables utilisees pour la reconstruction et
la projection. On note aussi que les trois autres intervalles
dobservation (I
1
, I
2
, I
3
) sont aectees de defauts, sans sa-
voir exactement quelle (s) composante (s) du vecteur de
mesure en sont la cause. Finalement, compte tenu de la
presence de defauts dans les quatre intervalles, lexamen
du sixi`eme graphique de la gure 3 conclut `a :
- dans lintervalle I
4
, la variable x
8
est en defaut,
- dans chaque intervalle I
1
, I
2
, I
3
, une variable autre que
x
8
est en defaut ou plusieurs variables sont en defaut.
Les autres projections se construisent et sinterpr`etent
de fa con analogue. Le diagnostic est donc :
- dans lintervalle I
1
, x
1
et x
3
ou x
1
et x
7
ou x
1
et x
3
et
x
7
sont en defaut
- dans lintervalle I
2
, x
1
et x
2
sont en defaut,
- dans lintervalle I
3
, x
4
et x
8
sont en defaut,
- dans lintervalle I
4
, x
8
est en defaut.
VI. Conclusion
LACP classique, qui est basee sur lestimation de la
moyenne et de la matrice de covariance des donnees, est
tr`es sensible `a la presence de valeurs aberrantes. Dans cet
article, un algorithme `a deux niveaux est propose. Tout
dabord un MM-estimateur est utilise pour determiner
un mod`ele robuste. Cet estimateur calcule avec un algo-
rithme iteratif, est initialise avec un estimateur robuste de
la matrice de covariance. Cette approche consiste `a mini-
miser une mesure robuste des distances orthogonales des
observations au sous-espace de lACP (espace residuel).
Cependant, la dimension de lespace residuel est incon-
nue, une procedure robuste pour determiner le nombre de
composantes principales est alors proposee. Ensuite, des
residus structures sont utilises pour detecter et localiser
des defauts multiples. La generation de ces residus struc-
tures est basee sur lutilisation dun indicateur combine qui
permet de detecter des defauts sur lensemble des variables
et sur le principe de reconstruction. De plus, lanalyse des
defauts isolables permet deviter lexplosion combinatoire
des scenarios de defauts dans le cas de defauts multiples.
Cette procedure est appliquee avec succ`es sur un syst`eme
soumis `a des defauts multiples.
VII. Remerciements
Ce travail a ete realise avec le soutien du programme

Egide TASSILI n

07 MDU 714. Les auteurs remercient


sinc`erement le Minist`ere de la Culture, de lEnseignement
Superieur et de la Recherche du gouvernement luxembour-
geois pour leur participation au nancement de ces tra-
vaux.
R ef erences
[1] P.J. Rousseeuw. Robust regression and outliers detection. John
Wiley & Sons Inc., 1987.
[2] M. Hubert, P.J. Rousseeuw, et S. Verboven. A fast method for
robust principal components with applications to chemometrics.
Chemometrics and Intelligent Laboratory Systems, 60(1-2) :101
111, 2002.
[3] G. Li et Z. Chen. Projection-pursuit approach to robust disper-
sion matrices and principal components : Primary theory and
monte carlo. Journal of the American Statistical Association,
80(391) :759766, 1985.
[4] R. A. Maronna. Principal components and orthogonal regression
based on robust scales. Technometrics, 47(3), august 2005.
[5] Y. Tharrault, G. Mourot, J. Ragot, et D. Maquin. Fault system
detection and isolation with robust principal component ana-
lysis. Diagnostics of processes and systems, Slubice, Poland,
September 2007.
[6] M. Fekri et A. Ruiz-Gazen. Robust weighted orthogonal regres-
sion in the errors-in-variables model. Journal of Multivariate
Analysis, 88 :89108, 2003.
[7] S. Joe Qin et R. Dunia. Determining the number of principal
components for best reconstruction. Journal of Process Control,
10 :245250, 2000.
[8] H.H. Yue et S.J. Qin. Reconstruction-based fault identication
using a combined index. Industrial & Engineering Chemistry
Research, 40(20) :44034414, 2001.
[9] G. H. Golub et C. F. Van Loan. Matrix computations. The
Johns Hopkins University Press, 1996.
[10] S. Joe Qin. Statistical process monitoring : basics and beyond.
Journal of Chemometrics, 17(8-9) :480502, 2003.