+
=
0
)] 2 / : 2 / ( max[
) (
L n L n G
n T
nleo
) 1 2 / ...( , 1 , 0
),... 1 2 / ( , 2 /
=
=
L n pour
L L n pour
=
0
) (
) (
n G
n G
nleo
) ( ) (
) ( ) (
n T n G si
n T n G si
nleo
nleo
<
Le signal G(n) ainsi obtenu nous donne la position de la plupart des pics R du signal ECG
(Figure 33).
Chapitre 2: Dtection et correction d'artfacts
Classification automatique en stades du sommeil Page 30
Il arrive nanmoins que cette fonction indique des positions supplmentaires et inexactes de
pics, ou au contraire que certains emplacements n'y figurent pas (Figure 34). Ces erreurs seront
repres, en vue de leur correction, grce une estimation de la priode cardiaque P.
Pour cela, une onde "carre" changeant de valeur chaque fois que G(n) est diffrent de zro est
construite (Figure 33). Si l'on suppose que la frquence cardiaque reste constante sur une page
d'analyse, cette fonction est pratiquement priodique (de priode double de la priode
cardiaque). Sa transforme de Fourier contient donc un maximum local dans les basses
frquences (de 2*0.5 Hz 2*1.5 Hz). Il suffit alors de calculer la frquence correspondant ce
maximum local pour en dduire une approximation de la priode cardiaque P.
Ds lors, lorsqu'un pic se trouvant plus de 1.3*P du prcdent est dtect, on ajoute une
position supplmentaire carte de 1 priode par rapport au pic antrieur. Et si deux pics sont
espacs de moins de 0.6*P, on choisit celui qui est le plus proche du point distant d'une
priode vis--vis du pic prcdent (Figure 34).
P
P
d>1.3*P
d<0.6*P
Figure 34 Suppression des pics errons et ajout des positions manquantes
videmment, les positions ainsi obtenues ne correspondent pas exactement aux lieux des
interfrences cardiaques sur le signal entach y(n). Or, des carts de quelques chantillons
peuvent tre prjudiciables pour la suite de la procdure. C'est pourquoi nous devons calculer
ce dcalage entre chaque position dtermine k* et l'endroit exact de l'interfrence k.
Pour ce faire, nous faisons varier la valeur de de -
max
+
max
, et nous choisissons la valeur qui
maximise la cross relation entre le signal y de k-R k+R et le signal G(n) de k*-R- k*+R-
(c'est--dire le qui maximise l'intgrale du produit des deux cadres rouges sur la Figure 35).
t aux
k-R
k
k*
k+R
k*-R k*+R
Figure 35 Dtermination du dcalage entre la position dtermine k*et l'endroit
exact de l'interfrence k
Une fois les positions exactes des pics d'interfrence cardiaque connues (positions K), la
deuxime tape de correction de l'artefact consiste obtenir une estimation moyenne de cette
interfrence cardiaque de manire la soustraire du signal y. Pour cela, il suffit de considrer
tous les rectangles de largeur R autour des pics de l'poque courante et d'en effectuer la
moyenne comme l'illustre la Figure 36. Il ne reste plus qu' soustraire cette estimation de
l'interfrence cardiaque moyenne du signal y aux endroits K pour obtenir le signal corrig.
Chapitre 2: Dtection et correction d'artfacts
Classification automatique en stades du sommeil Page 31
Toutefois, afin de ne pas introduire de discontinuit, il est recommand de filtrer l'interfrence
moyenne par un filtre de Hanning avant d'effectuer cette soustraction.
moyenne
Hanning
Figure 36 Estimation de l'interfrence cardiaque moyenne soustraire du signal en tous les endroits K
Un exemple de rsultat obtenu aprs extraction de l'interfrence cardiaque est repris la Figure
37.
Figure 37 Exemple de correction de l'interfrence cardiaque par soustraction de l'interfrence moyenne
Correction par analyse en composantes indpendantes
La seconde mthode de correction de l'interfrence cardiaque que nous avons teste est la
sparation de sources par analyse en composantes indpendantes.
De manire gnrale, l'objectif de la sparation aveugle de sources est d'estimer N signaux
sources s
1
(t), s
2
(t), , s
N
(t) inconnus mais supposs statistiquement indpendants, partir de la
connaissance de M signaux observs x
1
(t), x
2
(t), , x
M
(t) rsultant d'un certain mlange des
signaux sources.
Appliqu notre problme, cela revient estimer les 2 signaux sources ECG et EEG inconnus
mais supposs indpendants, partir des deux signaux de mlange dont nous disposons: l'ECG
et l'EEG entach.
Dans le cas le plus simple, le mlange est suppos linaire et instantan. Les observations
l'instant t sont donc une combinaison linaire des sources ce mme instant:
) ( ) (
1
t s a t x
j
N
j
ij i
=
= i=1M
EOG1-A1
entach
EOG1-A1
corrig
Chapitre 2: Dtection et correction d'artfacts
Classification automatique en stades du sommeil Page 32
En posant s
t
= [ s
1
(t), s
2
(t), , s
N
(t)]
T
le vecteur des sources l'instant t, et x
t
= [ x
1
(t), x
2
(t), ,
x
M
(t)]
T
le vecteur des observations ce mme instant, cette quation peut s'crire sous la forme
matricielle suivante:
x
t
= A s
t
o A est la matrice de mlange inconnue constitue des lments a
ij
et de dimension MxN
(Figure 38).
A
s(t) x(t)
Figure 38 Matrice de mlange inconnue A
La recherche des sources estimes y
t
= [y
1
(t), y
2
(t), , y
N
(t)]
T
consiste donc identifier la matrice
W inverse de la matrice A (suppose inversible) telle que:
y
t
= s
t
= W x
t
.
Cette matrice est appele matrice de sparation. Elle est illustre la Figure 39.
A W
s(t) x(t) y(t)
Figure 39 Sparation d'un mlange linaire (instantan ou convolutif)
Comon [23] a montr que celle-ci pouvait tre dtermine par la seule hypothse
d'indpendance des sources
8
. Ainsi, l'analyse en composantes indpendantes (ACI ou ICA en
anglais) s'est impose naturellement. Celle-ci consiste trouver une transformation de l'espace
de reprsentation dans lequel les composantes sont aussi indpendantes que possible.
Diffrentes mthodes existent et sont dcrites dans la littrature. Parmi celles-ci, citons l'ACI
base sur la maximisation du carr du Kurtosis [24], celle base sur la minimisation de
l'information mutuelle [25] et l'ACI base sur la maximisation de l'entropie conjointe [26] [27].
Dans le cas de mlanges linaires et instantans, ces mthodes sont relativement rapides et
faciles mettre en uvre. Malheureusement, nous avons constat que le mlange des EEG et
ECG n'est en ralit pas instantan car les pics d'interfrence sont dcals de plusieurs
chantillons par rapport aux pics du signal cardiaque.
Ainsi, il convient d'utiliser un autre modle, le modle linaire convolutif, o les observations
sont des mlanges linaires de signaux issus de sources par filtrage (filtres RIF):
) ( ) ( ) (
1
t s t a t x
j
N
j
ij i
=
= i=1M
o a
ij
(t) est la rponse impulsionnelle de la j
me
source sur le i
me
capteur.
8
Plus prcisment, Comon a montr que, dans le cas de mlanges linaires et instantans, pourvu qu'au plus une
source soit gaussienne, la seule indpendance des sources permet de reconstituer les sources, un facteur d'chelle
et une permutation prs.
Chapitre 2: Dtection et correction d'artfacts
Classification automatique en stades du sommeil Page 33
Ce type de mlange est illustr la Figure 40 dans le cas de deux sources et de deux capteurs.
Figure 40 Mlange linaire convolutif avec deux sources et trois observations
Lobjectif de la sparation de source est alors de retrouver le systme de d-mlange similaire
celui illustr la Figure 41, o les valeurs de sortie sont gales aux estimes de sources:
1
( ) ( ) ( )
N
i ij j
j
y t w t x t
=
=
Figure 41 Mlange linaire convolutif de deux sources et systme de d-mlange
Il a t prouv qu'en utilisant la notation algbrique RIF linaire
9
, ce type de problme pouvait
tre exprim par les mmes quations matricielles que celles prsentes dans le cas des mlanges
linaires et instantans:
x
t
= A s
t
y
t
= s
t
= W x
t
.
o l'lment a
ij
(t) de matrice de mlange A correspond la rponse impulsionnelle du filtre RIF
joignant la j
me
source au i
me
capteur, et o llment w
ij
(t) de la matrice W est la rponse
impulsionnelle du filtre RIF joinant le j
me
capteur la i
me
estime de source.
Ainsi, certains procds dvelopps dans le cadre des mlanges linaires instantans ont pu tre
gnraliss aux mlanges linaires convolutifs. C'est le cas de la mthode d'analyse en
composantes indpendantes base sur la maximisation de l'entropie conjointe [26] [27].
Le principe de cette mthode est de maximiser par rapport W l'entropie conjointe ) (
t
g H du
vecteur g
t
=[g
1
(t), g
2
(t), , g
N
(t)]
T
, dont les composantes ( ) ( ) ) ( ) ( ) ( t y F t y g t g
i s i i
= = sont les
estimes de sources y
i
(t) transformes par une fonction sigmodale g gale la fonction de
rpartition
s
F des sources recherches.
9
La notation algbrique RIF linaire est une notation o les lments des matrices sont des filtres RIF plutt que
des scalaires et o le produit de deux lments de matrice est remplac par leur convolution.
Chapitre 2: Dtection et correction d'artfacts
Classification automatique en stades du sommeil Page 34
[10 0 0 0 0... ]
impulse
h =
[10 0 0 0 0... ]
impulse
h =
Dans le cas convolutif, cela implique de travailler avec une architecture de rseau telle
qu'illustre la Figure 42.
Figure 42: Architecture de rseau pour l'ACI base sur la maximisation de l'entropie conjointe
Pour plus de dtails concernant cette mthode, nous invitons le lecteur intress lire le
document [28] ralis dans le cadre du projet DREAMS la Facult Polytechnique de Mons.
Retenons simplement que ce type d'algorithme prsente quelquefois de grosses difficults
converger, surtout lorsque la frquence d'chantillonnage des signaux concerns est leve.
C'est pourquoi nous avons tent de simplifier le problme en ajoutant une hypothse
supplmentaire, afin de faciliter la convergence du procd.
De fait, nous avons suppos que l'interfrence cardiaque rsulte d'une matrice de mlange de la
forme:
0
impulse
qcq impulse
h
h h
| |
=
|
\
A
o
impulse
h
est la rponse impulsionnelle d'un filtre ne modifiant pas le signal d'entre
et
qcq
h
est un filtre de rponse impulsionnelle quelconque.
Cette hypothse est tout fait lgitime puisqu'elle revient supposer que le signal cardiaque
n'est pas modifi en lui-mme et que l'interfrence prsente sur les autres signaux PSG est en
ralit constitue d'une partie de cette ECG qui est filtre et qui vient s'ajouter au signal
concern.
Dans ce cas, la matrice de d-mlange recherche doit tre de la forme:
0
impulse
impulse
h
h h
| |
=
|
\
W
o
impulse
h
est de la forme
h est un filtre dont la rponse impulsionnelle est dterminer
Chapitre 2: Dtection et correction d'artfacts
Classification automatique en stades du sommeil Page 35
Ainsi, seules les composantes du filtre correspondant l'lment (2,1) de cette matrice de d-
mlange sont dterminer, ce qui simplifie largement le problme et acclre la convergence.
Un exemple de rsultats obtenus suite l'application de ce procd "simplifi" est repris la
Figure 43 .
Figure 43 Exemple de correction de l'interfrence cardiaque par analyse en composantes indpendantes
Correction par filtrage adaptatif
Finalement, le postulat que le signal entach soit simplement constitu du vrai signal
polysomnographique s(n) auquel s'est ajout un bruit b(n), nous a amens tester un troisime
procd de correction de l'interfrence cardiaque, savoir, le filtrage adaptatif (Figure 44).
Figure 44 Procd de correction de l'interfrence cardiaque par filtrage adaptatif
Dans cet algorithme, nous prsumons toujours que l'interfrence cardiaque correspond une
version filtre de l'lectrocardiogramme. Par ailleurs, deux nouvelles hypothses sont poses. La
premire est que le signal utile s(n) est non corrl au bruit b(n) (ou son estime y(n)), et la
seconde est que la moyenne du bruit E[b(n)] est gale la moyenne de son estime E[y(n)].
Chapitre 2: Dtection et correction d'artfacts
Classification automatique en stades du sommeil Page 36
Dans ce cas, la minimisation de lerreur quadratique E[e(n)
2
] conduit l'obtention du vrai signal
polysomnographique corrig de toute interfrence cardiaque, puisque:
E[e(n)
2
] = E[( s(n) +b(n)-y(n) )
2
] = E[s(n)
2
] + E[(b(n)-y(n) )
2
] +2 E[s(n) (b(n)-y(n))]
= E[s(n)
2
] + E[(b(n)-y(n) )
2
] +2 E[s(n) b(n)] 2 E[s(n) y(n)]
= E[s(n)
2
] + E[(b(n)-y(n) )
2
]
min ( E[e(n)
2
] )= min( E[(b(n)-y(n) )
2
] )
Cette minimisation entrane que b(n) = y(n), et donc que e(n) = s(n)
Ce minimum peut tre obtenu en calculant la solution de Wiener-Hopf. Les rsultats de
correction obtenus au moyen de cette mthode sont illustrs la Figure 45.
Figure 45 Exemple de correction de l'interfrence cardiaque par filtrage adaptatif
Comparaison de ces trois procds de correction
Lorsque l'on compare ces trois procds de correction de l'artefact cardiaque, on constate que la
mthode base sur la soustraction de l'interfrence moyenne est la moins performante parce
qu'elle laisse couramment subsister des pics d'interfrence (Figure 46).
Figure 46 De haut en bas: ECG, EEG entach de l'interfrence cardiaque, EEG corrig par
soustraction de l'interfrence moyenne, EEG corrig par ACI, EEG corrig par filtrage adaptatif
Chapitre 2: Dtection et correction d'artfacts
Classification automatique en stades du sommeil Page 37
Les mthodes bases sur l'analyse en composantes indpendantes et sur le filtrage adaptatif
donnent quant elles des rsultats tout fait comparables et satisfaisants, bien que leur critre
de sparation soit diffrent.
L'algorithme du filtrage adaptatif ncessite nanmoins une ou deux poques de 20 secondes
pour s'adapter. Pourtant, on prfrera ce procd celui bas sur l'analyse en composantes
indpendantes en raison de son extrme rapidit.
2.3 Rsultats des procds de dtection/correction d'artefacts
Au final, quatorze procds de dtection/correction d'artefacts ont t programms, portant le
nombre de paramtres rglables 23. La valeur optimale de chacun de ces paramtres a t
tablie exprimentalement de manire reprer un maximum d'artefacts sans exagrer le
nombre de fausses dtections.
L'valuation des rsultats a t faite visuellement. Ceux-ci semblent tout fait satisfaisants
comme nous le verrons sur les quelques captures d'cran prsentes ci-dessous. Toutefois, cette
interprtation reste subjective. Il serait bon de vrifier ces taux de bonnes et fausses dtections
de manire rigoureuse, au dpart d'une base de donnes cotes en artefacts par des experts.
Ceci fera l'objet d'un travail ultrieur.
Les captures d'cran prsentes ci-dessous reprennent des extraits de signaux PSG de patients
contenant divers artefacts, ainsi que les rsultats obtenus par les diffrents procds de
dtection.
La Figure 47 illustre la prsence d'un artefact quelconque sur le signal CZ-A1 l'instant
2:35:08. Nous constatons que le procd Atf_mvt dcle bien qu'il ne s'agissait pas d'un artefact
mouvement (puisque sa valeur est 0) car l'EMG ne prsente pas d'augmentation de tonus
musculaire. Par contre, les procds Atf_trans et Atf_Egd permettent de reprer cet artefact en
dtectant des transitions brusques ou des augmentations d'amplitude inhabituelles de l'EEG
(les valeurs des tranches correspondantes sont mises 1).
Figure 47 Rsultats de dtection de l'artefact prsent sur le signal CZ-A1 2:35:08
Chapitre 2: Dtection et correction d'artfacts
Classification automatique en stades du sommeil Page 38
Sur la Figure 48, nous constatons que parmi les mouvements en opposition de phase des EOG
(correspondant aux mouvements oculaires), se cache un mouvement en phase correspondant
un artefact (en 0:26:06). Ce dernier a parfaitement t dtect par le procd Atf_phase
puisque seule la tranche correspondante possde la valeur 1. D'autre part, nous voyons que les
procds Atf_mvt, Atf_trans et Atf_Egd ont permis de dceler la prsence d'un artefact
mouvement sur la drivation CZ-A1 l'instant 0:26:06.
Figure 48 Rsultats de dtection de l'artefact mouvement prsent sur le signal CZ-A1 0:26:06, et de
l'artefact en phase prsent sur les EOG au mme instant
Enfin, la Figure 49 expose le cas d'une interfrence ondulation lente prsente tout au long de
l'poque sur les lectrooculogrammes. Celle-ci a parfaitement t dtecte par le procd
Atf_ondeE. Toutefois sa correction n'est pas visible sur cette figure. En effet, le but tait de
mettre en vidence la prsence ou non de cet artefact. Finalement, nous pouvons constater que
l'artefact "mouvement en phase" observ 2:18:53 sur l'EOG a galement bien t dtect par le
procd Atf_phase.
Figure 49 Rsultats de dtection de l'artefact ondulation lente prsent sur toute l'poque de l'EOG et de
l'artefact transition brusque prsent sur l'EOG galement 2:18:53
Classification automatique en stades du sommeil Page 39
Chapitre 3
Extraction de caractristiques
Une fois le traitement des artefacts effectu, la seconde tape d'une classification automatique
en stades du sommeil consiste en l'extraction des caractristiques de chaque poque
d'enregistrements polysomnographiques (Figure 50). Ces caractristiques (galement appeles
attributs ou features) doivent tre les plus discriminantes possible tant donn qu'elles serviront
de base pour le systme de classification proprement dit.
Figure 50 tapes de la classification automatique en stades du sommeil
3.1 tat de l'art
Les techniques d'extraction rencontres dans la littrature s'appliquent soit dans le domaine
temporel, soit dans le domaine frquentiel, soit dans ces deux domaines simultanment.
Parmi les mthodes temporelles, citons les modles autorgressifs utiliss dans [12], [19], [29] et
[30]. Ceux-ci modlisent la valeur courante du signal PSG comme une combinaison linaire des
chantillons prcdents. Les coefficients de rgression correspondant peuvent alors directement
servir d'attributs. Ensuite, nous avons les procds stochastiques qui considrent le signal
chantillonn comme un processus alatoire ([19], [29], [31] et [32]). Les caractristiques qui en
sont dduites sont par exemple l'cart-type du signal PSG, sa valeur moyenne, son amplitude
moyenne, ses moments d'ordre 3 et 4, ou encore ses paramtres de Hjorth (activit, mobilit et
complexit). Enfin, citons la mthode des creux et valles qui remplace le signal par une
succession de segments joignant ses extrema et qui calcule les temps de monte, les temps de
descente, les courbures au sommet, etc. [29].
Parmi les mthodes frquentielles rencontres, la plus rpandue est la transforme de Fourier
court terme gnralement calcule au moyen de la transforme de Fourier rapide (FFT - Fast
Fourier Transform) ([33], [34]). Applique une poque de signal, celle-ci permet d'en extraire la
frquence moyenne, la puissance totale, les puissances relatives dans les diffrentes bandes de
Chapitre 3: Extraction de caractristiques
Classification automatique en stades du sommeil Page 40
frquences, etc. D'autres tudes se basent directement sur la densit spectrale de puissance pour
extraire ces mmes types de paramtres. Cette densit est alors calcule au moyen d'un
estimateur tel que le priodogramme ou le priodogramme moyenn [12].
Enfin, les techniques d'extraction de caractristiques les plus rcentes travaillent simultanment
dans les domaines temporels et frquentiels. Il s'agit notamment des analyses par ondelettes qui
consistent dcomposer le signal en une somme pondre de translations et dilatations d'une
mme fonction oscillante appele ondelette mre ([35], [36], [37]). C'est galement le cas des
mthodes SLEX (Smooth Localized complex EXponentials) prsentes dans [38].
3.2 Procds d'extraction de caractristiques
Le panel de caractristiques extraites est donc trs diversifi. Malheureusement, aucune tude
notre connaissance ne compare ces attributs en terme d'efficacit.
Nous avons donc choisi, dans le cadre de ce travail, d'extraire un maximum de caractristiques
et de comparer ensuite leur pouvoir discriminant afin de prsenter les meilleurs d'entre-elles au
classificateur.
Au total, 26 procds d'extraction ont t implments sous Matlab, permettant d'extraire 102
attributs diffrents.
Ces procdures ont t labores de manire traiter efficacement des enregistrements PSG
contenant au moins:
1 ECG;
2 EOG (droite et gauche);
1 signal EEG central;
1 signal EEG frontal;
1 signal EEG occipital;
1 ou plusieurs EMG.
Par ailleurs, leur implmentation a t conue de manire ce que les attributs puissent tre
extraits de segments de longueur fixe (comme c'est le cas dans ce travail o l'analyse a t
effectue par poques de 20 secondes comme le suggrent les rgles de Rechtschaffen et Kales);
ou de segments de longueur variable si une quelconque segmentation adaptative venait tre
excute au pralable.
Cela implique notamment que ces attributs soient tous normaliss. Par exemple, la puissance
dans une certaine bande de frquence est inexploitable si on ne la rapporte pas la puissance
totale du segment correspondant.
Une brve description de chacun de ces procds est reprise dans le Tableau 6 en annexe I.
Toutefois, de plus amples informations leur sujet peuvent tre trouves dans [39].
3.3 Slection des caractristiques les plus discriminantes
Afin de choisir les meilleures caractristiques parmi les 102 attributs extraits, nous avons
examin leur efficacit de 3 manires diffrentes.
Chapitre 3: Extraction de caractristiques
Classification automatique en stades du sommeil Page 41
Tout d'abord, nous avons regard leur volution en fonction des stades de sommeil rencontrs
au cours de la nuit. Ceci nous a par exemple permis de voir d'emble que le paramtre
"freq_dominante" fournissait des rsultats inopportuns tandis que la caractristique "freq-cent
gravit" semblait nous donner des valeurs plus cohrentes (cf. Figure 51).
a
b
Figure 51 Mesure de l'efficacit d'une caractristique en examinant son volution en fonction des
diffrents stades de sommeil. (a) Freq_dominante, (b) Freq_cent_gravit
Ensuite, nous avons tabli les histogrammes de chaque caractristique dans les diffrents stades
de sommeil (c'est--dire que nous avons repris les valeurs de cet attribut en abscisse et que nous
avons report en ordonne le nombre d'poques possdant cette valeur pour chaque stade
considr). Nous avons alors examin, pour chaque caractristique, le recouvrement de ces
diffrents histogrammes (Figure 52).
Figure 52 Mesure de l'efficacit d'une caractristique en examinant ses hypnogrammes dans les
diffrents stades (m=moyenne et =cart-type des valeurs prises dans les diffrents stades considrs)
Ce type de graphique nous a par exemple permis de mettre en vidence que la caractristique
"pce_activ_cent_EEG#1" tait plus propice sparer le stade REM (en rouge sur la Figure 53) du
stade 4 (en vert sur la Figure 53) que la caractristique "rap_ecart_type_EEG".
Chapitre 3: Extraction de caractristiques
Classification automatique en stades du sommeil Page 42
a
b
Figure 53 Comparaison du recouvrement des histogrammes de la caractristique
pce_activ_cent_EEG#1 (a) et de la caractristique rap_ecart_type_EEG (b)
Enfin, comme nous savons qu'un attribut convient d'autant mieux la sparation des stades
que ses dispersions intra stades (distance x
i
sur la Figure 52) sont faibles vis--vis de ses distances
inter stades (distance y
i
sur la Figure 52), il est possible d'estimer sa puissance moyenne de
discrimination comme suit (critre de Fisher):
=
=
=
C
i
ik i
C
i
k ik i
k
w p
w p
D
1
2
1
2
). (
) ).( (
o
D
k
est la puissance moyenne de discrimination de Fisher. Elle est d'autant plus leve
que la caractristique est discriminante;
C le nombre de stades;
P(w
i
) la probabilit a priori du stade w
i
. On l'estime par
N
w
w p
i
i
#
) ( = ;
ik
la moyenne de la caractristique k calcule sur les poques de stade i;
k
la mme moyenne mais calcule sur toutes les poques (de tous les stades);
ik
la variance de la k
me
primitive pour les poques de stade i.
Grce ces diffrentes mesures d'efficacit, nous avons pu slectionner neuf caractristiques
permettant a priori de distinguer facilement les diffrents stades de sommeil. Il s'agit des
attributs 10, 11, 20, 22, 25, 30, 31, 35 et 87 (voir Tableau 6 en annexe I).
Classification automatique en stades du sommeil Page 43
Chapitre 4
Classification en stades du
sommeil
La troisime et dernire tape du processus de dtection automatique des phases du sommeil
consiste attribuer un stade du sommeil chaque poque d'enregistrement PSG, sur base de la
valeur de ses attributs (Figure 54).
Figure 54 tapes de la classification automatique en stades du sommeil
4.1 tat de l'art
Plusieurs mthodes sont envisageables pour parvenir cette fin. La premire d'entre elles
consiste utiliser des rseaux de neurones artificiels dont les architectures sont trs varies. La
plupart des travaux utilisent un simple perceptron multicouches dont ils modifient le nombre
de couches caches et le nombre de neurones qu'elles contiennent ([34], [40], [41], [42]); mais
on retrouve galement les cartes de Kohonen ([31], [32]).
Les procds d'agglomration (clustering) sont galement couramment rencontrs dans la
littrature ([30], [35]). Ceux-ci prsentent notamment l'avantage de ne pas ncessiter de base de
donnes d'entranement.
Une troisime mthode consiste en l'utilisation d'arbres dcisionnels. Assez peu d'tudes y font
rfrence ([19], [29]) et pourtant cette procdure de classification est rapide et facilement
interprtable. Dans le cadre de l'analyse du sommeil, la construction de l'arbre peut tre
effectue sur base des rgles de Rechtschaffen et Kales. Toutefois, cela implique de dfinir les
questions adquates correspondant aux embranchements de l'arbre et cette tche n'est pas
vidente raliser a priori. Il est donc recommand d'utiliser des procdures automatiques
permettant d'riger un arbre de dcisions partir d'un ensemble d'objets dj classifis.
Enfin, les mthodes d'analyse discriminante linaire ([12, [34]) ou de logique floue [33] ont
galement t rencontres dans la littrature.
Chapitre 4: Procds de classification en stades du sommeil
Classification automatique en stades du sommeil Page 44
4.2 Description des procds de classification
La plupart des auteurs valident les rsultats de leur procd de classification en stades du
sommeil par rapport des cotations visuelles ralises par des experts. Malheureusement, aucun
d'entre eux n'utilise la mme base de donnes de signaux polysomnographiques (car il n'en
existe ma connaissance aucune disponible sur Internet). De plus, les attributs qu'ils emploient
sont assez diversifis. Il est donc pratiquement impossible de comparer ces mthodes de
classification.
C'est pourquoi, dans le cadre de ce travail, nous avons choisi d'implmenter plusieurs de ces
classificateurs afin d'en valuer les performances.
4.2.1 La mthode d'agrgation (ou clustering)
Le premier procd de classification que nous avons implment est la mthode d'agrgation,
plus connue sous le nom de clustering. Son principe est de rassembler les poques similaires
d'enregistrements PSG en plusieurs groupes appels clusters (Figure 55). Ensuite, l'utilisateur est
amen, sur base de quelques lments de chaque ensemble, attribuer un stade aux diffrents
agrgats.
X
2
X
3
X
1
Figure 55 Illustration de la mthode d'agrgation (clustering)
Ce procd semble a priori plus apte s'adapter aux variabilits inter sujets des signaux PSG et
il prsente l'avantage d'tre sensible aux prfrences de l'utilisateur. Par ailleurs, il ne ncessite
pas la constitution d'une base de donnes d'apprentissage. Nanmoins, l'efficacit d'une telle
mthode dpend fortement de sa procdure de regroupement.
Dans ce travail, nous en avons expriment de deux types:
Le clustering hirarchique ascendant qui dmarre en considrant que chaque objet
(chaque poque de signal) correspond un cluster et qui regroupe ensuite ces derniers
en fonction de leur similitude jusqu' ce qu'un critre d'arrt soit satisfait (Figure 56).
Le K-means clustering qui dmarre avec un nombre prdfini K de clusters et qui
rarrange ensuite ces derniers de manire rassembler les objets les plus similaires. Plus
prcisment, le K-means clustering positionne tout d'abord K centrodes dans l'espace
de caractristiques et regroupe les objets les plus proches de chacun d'eux (Figure 57-a).
Ensuite, les centrodes sont repositionns au centre des clusters obtenus (Figure 57-b).
Puis les nouveaux agrgats sont reforms (Figure 57-c). le procd se poursuit ainsi de
suite jusqu' ce que la position des centrodes ne se modifie plus.
Chapitre 4: Procds de classification en stades du sommeil
Classification automatique en stades du sommeil Page 45
Figure 56 Clustering hirarchique ascendant
Figure 57 K-means clustering
Plus d'informations au sujet de ces deux procdures peut tre trouv en [43]. Sachons
simplement qu'il ressort de nos analyses que le K-means clustering donne gnralement de
meilleurs rsultats que la mthode hirarchique. Nous ne prsenterons donc que cette mthode
lors de la comparaison des performances des diffrents classificateurs (paragraphe 4.4:
comparaison des rsultats obtenus).
4.2.2 Les rseaux de neurones artificiels
Le second procd de classification que nous avons test est le perceptron multicouches (PMC).
Il s'agit d'une architecture particulire de rseaux de neurones artificiels o les neurones sont
regroups en couches (Figure 58). Le nombre d'units en entre est impos puisqu'il doit
correspondre au nombre d'attributs slectionns. De mme, la quantit de neurones en sortie
doit tre identique au nombre de classes considres (6 dans notre cas: veil, S1, S2, S3, S4 et
REM). Par contre, le nombre de couches intermdiaires (appeles couches caches) ainsi que la
quantit optimale de neurones qu'elles contiennent sont dterminer empiriquement.
Figure 58 Illustration d'un perceptron multicouches
Chapitre 4: Procds de classification en stades du sommeil
Classification automatique en stades du sommeil Page 46
Dans le cadre de ce travail, nous avons obtenu les meilleurs rsultats de classification au moyen
d'une seule couche cache constitue de 100 neurones. Ceux-ci seront prsents au paragraphe
4.4.
Le principal avantage de cette mthode rside dans son temps de calcul ncessaire
l'identification. En effet, bien que celui-ci soit li la complexit du rseau de neurones, la
propagation de l'entre vers la sortie se fait de manire quasi instantane (de l'ordre de la
milliseconde). Par contre, ce procd ncessite un trs long apprentissage et une bonne
classification n'est obtenue que si la base de donnes d'entranement est importante.
4.2.3 Les arbres de dcisions
La troisime et dernire mthode de classification envisage est l'utilisation d'arbres
dcisionnels qui sont des reprsentations graphiques d'un certain nombre de rgles.
Une fois construit, un arbre se prsente sous la forme d'une arborescence inverse. En chaque
noeud interne, une dcision est prise en fonction de la valeur dun des attributs. Un objet est
alors class en suivant un chemin qui va de la racine (au sommet de l'arbre) jusqu' un unique
noeud feuille ( la base de l'arbre). Chaque feuille caractrise une seule classe, mais une classe
peut tre reprsente par plusieurs feuilles.
Figure 59 Illustration d'un arbre dcisionnel simple
Plusieurs mthodes automatiques permettent d'riger de tels arbres au dpart d'une base de
donnes d'entranement. Leurs diffrences tiennent surtout dans la faon dont ils choisissent
d'effectuer les branchements.
Dans le cadre de ce travail, nous avons utilis la mthode CART (Classification And Regression
Tree) directement implmente et fournie par Matlab. Cette mthode, cre par L. Breiman, ne
travaille qu'avec des arbres binaires (c'est--dire que les noeuds internes possdent deux et
uniquement deux sous-nuds) [44]. Lors de leur construction, l'ensemble des partitions
possibles au dpart d'un noeud est valu sur base de la thorie de l'information (et notamment
sur la notion d'entropie). Puis, la partition prsentant la valeur la plus leve de ce critre est
retenue. Cette procdure est ensuite ritre pour chacun des sous-ensembles obtenus, jusqu'
ce qu'un certain critre d'arrt soit atteint. Ce critre peut par exemple imposer que le
pourcentage de cas appartenant la classe majoritaire soit suprieur un seuil, ou que le
nombre d'objets dans une feuille soit infrieur un seuil, etc. Finalement, une fois que l'arbre
est construit, il est encore possible de procder son lagage : c'est--dire que les parties de
l'arbre qui ne semblent pas performantes pour prdire la classe des nouveaux objets sont
supprimes (Figure 60).
Chapitre 4: Procds de classification en stades du sommeil
Classification automatique en stades du sommeil Page 47
Figure 60 Illustration du procd d'lagage d'un arbre
L'arbre de dcisions ainsi obtenu possde une traduction immdiate en terme de rgles de
dcision et prsente l'avantage d'tre facilement interprtable. Malheureusement, sa phase de
construction est fort sensible une lgre modification des donnes d'entranement. Cette
instabilit se marque par des changements de la structure de l'arbre qui peuvent conduire des
bouleversements dans les attributions finales de classe.
Une solution ce problme est de gnrer un faisceau de plusieurs arbres et de combiner leurs
dcisions en vue d'obtenir une prdiction unique. Cette technique permet d'atteindre de
meilleures performances, mais rduit videmment la visibilit de la classification.
Les divers algorithmes appartenant cette catgorie se distinguent dune part par la faon dont
ils gnrent les arbres, et dautre part par leur procdure dagrgation (galement appele
procdure de vote) des prdictions individuelles. Deux d'entre eux ont t explors dans le
cadre de ce travail. Il s'agit des forts alatoires d'arbres et de la mthode d'agrgation par
boosting.
Les forts alatoires d'arbres (Random Forests) sont constitues de plusieurs arbres lmentaires
travaillant en parallles (Figure 61). Chacun de ces arbres est construit au dpart de N objets
dentranement tirs alatoirement et avec replacement dans la base de donnes
d'entranement. De plus, lors de la construction de l'arbre, un sous-ensemble dattributs est tir
alatoirement chaque embranchement pour dterminer l'ensemble des partitions possibles.
Finalement, la classification d'un nouvel objet se fait en examinant le vote de chaque arbre
(avec un poids gal), et en attribuant la classe propose par la majorit d'entre eux.
Figure 61 Illustration du procd des forts alatoires d'arbres
Chapitre 4: Procds de classification en stades du sommeil
Classification automatique en stades du sommeil Page 48
Dans la mthode d'agglomration par boosting, les diffrents arbres ne sont plus construits en
parallle, mais selon un mode squentiel (Figure 63). Leur phase itrative dapprentissage met
laccent sur les objets mal classs par les arbres prcdents pour forcer les classificateurs suivants
se concentrer sur les erreurs. Plus prcisment, la procdure dmarre en attribuant un poids
quivalent tous les objets de la base d'entranement (Figure 63). Puis, N de ces objets sont
slectionns par tirage au sort avec replacement. Le premier arbre peut alors tre rig de
manire tout fait classique (en considrant tous les attributs). Une fois construit, l'ensemble
des objets de la base d'entranement lui sont prsents en vue d'une classification. Ceux d'entre
eux qui y sont mal classs se voient attribuer un poids plus important pour l'itration suivante.
La procdure se rpte ainsi un certain nombre de fois et, finalement, lors de la classification
d'un nouvel objet, les votes des diffrents arbres crs seront pondrs en fonction de l'erreur
apparente de ceux-ci.
Figure 62 Illustration de la mthode d'agrgation par boosting
Figure 63 procdure d'agrgation par boosting
4.3 Bases de donnes
La base de donnes au dpart de laquelle nous avons entran et test les diffrents
classificateurs implments, nous a t fournie par l'quipe du Dr. M. Kerkhofs de l'hpital
Andr Vsale du CHU de Charleroi. Celle-ci est constitue de 25 enregistrements de nuits de
sujets en bonne sant et de 33 enregistrements de nuits de patients atteints de pathologies
diverses (dysomnie, syndrome des jambes sans repos, insomnie, apnes/hypopnes, etc.).
Chapitre 4: Procds de classification en stades du sommeil
Classification automatique en stades du sommeil Page 49
Pour chacun de ces fichiers, nous disposons:
Des signaux physiologiques (EOG, EEG, EMG, etc.) enregistrs et sauvs au format
standard EDF (European Data Format). Une description de ce format est prsente en
annexe II;
De l'hypnogramme (c'est--dire de la classification en stades du sommeil) tabli
visuellement par le personnel du laboratoire de sommeil du CHU de Charleroi;
De l'hypnogramme fourni par le logiciel automatique MEDATEC qui est un leader sur
le march belge en matire d'acquisition et de traitement des signaux du sommeil.
Comme nous savons que les enregistrements polysomnographiques des patients pathologiques
sont gnralement plus difficiles interprter que ceux des sujets sains, nous avons opr une
distinction entre ces deux types de signaux.
Ensuite, chacune de ces bases (patients >< sujets) s'est vue scinde en deux afin de ne pas tester
nos classificateurs sur les mme nuits qui ont servi leur entranement. Ainsi:
70 % des enregistrements ont t mis de cot pour l'entranement du rseau de
neurones et des arbres de dcisions. Il s'agit de la base de donnes d'entranement;
Les 30% de nuits restantes ont t ddies aux tests des diffrents classificateurs. Il s'agit
de la base de donnes de test.
Par ailleurs, nous avons procd une validation croise
10
pour ne pas que les classificateurs
modlisent trop fidlement les objets de la base d'entranement. C'est pourquoi:
80 % des enregistrements de la base d'entranement ont t maintenus pour raliser
l'apprentissage proprement dit du classificateur. Il s'agit de la base de donnes
d'apprentissage;
Les 20% des enregistrements restants ont t affects au processus de validation croise.
Il s'agit de la base de donnes de validation.
4.4 Comparaison des rsultats obtenus
Le partage des enregistrements polysomnographiques entre les trois bases de donnes
d'entranement, de validation et de test a t effectu au hasard, par tirage au sort. Comme
nous savons que cette rpartition alatoire peut influencer les rsultas de classification obtenus,
nous avons effectu plusieurs tests de classification (en recalculant chaque fois les diffrentes
bases de donnes) et nous en avons dduit le taux moyen de reconnaissance.
Les rsultats ainsi obtenus par les diffrents classificateurs sont repris au Tableau 3.
K-means
Clustering
Rseau de
neurones
(PMC)
Arbre
simple de
dcisions
Foret
alatoire
d'arbres
Agrgation
d'arbres par
boosting
Logiciel
Medatec
Patients 67.8 % 69.2 % 67.0 % 68.6 % 67.3 % 50.4 %
Sujets 70.3 % 76.9 % 74.1 % 75.7 % 73.7 % 57.3 %
Tableau 3 Taux de reconnaissance moyen des diffrents classificateurs
10
La validation croise consiste mesurer au cours de la phase d'apprentissage le taux de reconnaissance atteint sur
un ensemble d'objets ne participant ni l'entranement ni aux tests, afin d'arrter le processus au moment o le
taux de reconnaissance obtenu est maximum (pour viter le sur entranement).
Chapitre 4: Procds de classification en stades du sommeil
Classification automatique en stades du sommeil Page 50
Nous constatons tout d'abord que quel que soit le procd de classification utilis, les taux de
reconnaissance obtenus sur base des enregistrements PSG de sujets sains sont toujours
meilleurs que ceux calculs partir des signaux de patients pathologiques. Ceci est tout fait
comprhensible tant donn le caractre ambigu des tracs pathologiques. Mme les oprateurs
humains prsentent plus de difficults les classer. En effet, le taux de variabilit inter cotateurs
correspondant est nettement plus faible que celui obtenu sur base de tracs de sujets sains (75%
contre 95% selon [44]).
Nous remarquons ensuite que la fort alatoire d'arbres est la mthode la plus performante
parmi les procds utilisant des arbres de dcisions. Nous ne considrerons donc l'avenir que
cette mthode pour comparer les performances de ce type de procd avec d'autres
classificateurs.
Enfin, nous sommes heureux de constater que les procdures que nous avons implmentes
donnent de bien meilleurs rsultats de classification que le logiciel Mdatec actuellement
disponible sur le march. Leurs taux de reconnaissance sont d'ailleurs fort similaires ce qui nous
laisse penser que les amliorations futures devraient tre cherches au niveau du traitement
des signaux PSG et non pas au niveau de la classification. D'autant plus qu'en examinant les
matrices de confusions de ces diffrents procds, nous pouvons relever que la majeure partie
des erreurs sont effectues aux mmes endroits (Tableau 4).
(a)
Automatique / Visuel Eveil REM S1 S2 S3 S4
Eveil 3078 310 251 126 6 12
REM 367 971 217 329 19 14
S1 291 353 318 248 0 0
S2 497 482 657 5609 546 175
S3 15 2 3 55 157 100
S4 0 0 0 6 32 100
72.5% 45.85% 21.99% 88.01% 20.66% 24.94
(b)
Automatique / Visuel Eveil REM S1 S2 S3 S4
Eveil 3492 376 360 554 61 47
REM 297 1050 214 112 1 0
S1 55 164 183 116 0 0
S2 399 528 688 5551 621 291
S3 4 0 1 38 54 44
S4 1 0 0 2 23 19
82.20% 49.58% 12.66% 87.10% 7.1% 4.73%
(c)
Automatique / Visuel Eveil REM S1 S2 S3 S4
Eveil 3662 463 404 233 3 6
REM 187 1004 194 254 9 3
S1 101 244 240 128 0 0
S2 297 407 608 5735 658 326
S3 1 0 0 1 14 15
S4 0 0 0 22 76 51
86.21% 47.40% 16.60% 89.99% 1.85% 12.72
Tableau 4 Matrice de confusion des diffrents procds implments sur la base de donnes de patients
pathologiques: (a) clustering, (b) rseau de neurones, (c) forts d'arbres de dcisions
Chapitre 4: Procds de classification en stades du sommeil
Classification automatique en stades du sommeil Page 51
Les grandes confusions entre les stades Eveil et REM ainsi qu'entre les stades 3 et 4 sont
particulirement visibles lorsque nous comparons les hypnogrammes visuels (tablis par un
expert) et automatiques (Figure 64). En effet, nous constatons que le procd automatique
prsente un nombre important de transitions intempestives entre ces diffrents tats
(notamment aux alentours des chantillons 400, 500, 800 et 950).
Figure 64 Comparaison de l'hypnogramme tabli visuellement par un expert (en haut) et de
l'hypnogramme fourni par le procd automatique de clutering (en bas)
Pour rsoudre ce problme, nous avons appliqu un algorithme de chanes de Markov caches
d'ordre 1 la sortie des classificateurs (algorithme de Viterbi). Ce modle prend en compte la
probabilit de passer dun stade X un stade Y ainsi que les probabilits de chaque poque
dappartenir aux diffrents stades de sommeil pour trouver la squence dtats la plus probable
au travers de ce "treillis" de probabilits (Figure 65).
Figure 65 Principe de chanes de Markov caches
Les rsultats obtenus sont repris dans le Tableau 5 et la Figure 66.
K-means
Clustering
Rseau de
neurones
(PMC)
Foret
alatoire
d'arbres
Medatec
Patients 67.8 % 69.2 % 68.6 % 50.4 %
Seul
Sujets 70.3 % 76.9 % 75.7 % 57.3 %
Patients 68.8 % 71.7 % 72.8 % / Avec Viterbi
1 Sujets 72.6 % 81.5 % 81.5 % /
Tableau 5 Paramtres minima de la chane d'acquisition des signaux PSG
Chapitre 4: Procds de classification en stades du sommeil
Classification automatique en stades du sommeil Page 52
Figure 66 De haut en bas: hypnogramme tabli par un expert, hypnogramme fourni par le seul procd
de clutering, hypnogramme obtenu aprs application d'un algorithme de chanes de Markov caches
Nous constatons que lapplication dun algorithme de chanes de Markov caches permet
damliorer sensiblement les rsultats de classification mais qu'elle prsente aussi linconvnient
majeur de lisser totalement lhypnogramme. Ceci est bien entendu contre-indiqu puisque
certaines pathologies du sommeil se discernent justement par la prsence de nombreuses
transitions entre les stades d'veil et de sommeil notamment.
Ainsi, nous pensons qu'il serait plus sage de corriger ces transitions intempestives la source.
En effet, amliorer la qualit des donnes fournies en entre des classificateurs devrait
permettre d'augmenter leur capacit de classification. Par exemple, nous pourrions tenir compte
des caractristiques des poques prcdentes et suivantes lors de la classification en stades. En
effet, les critres de Rechtschaffen et Kales [8] contiennent eux-mmes quelques rgles de
voisinage permettant de classer les poques transitoires en fonctions des poques qui les
prcdent et qui les suivent immdiatement.
Il serait galement possible de combiner les classificateurs entre eux pour tirer parti des
avantages de chacun.
Enfin, tant donn que plusieurs tudes ont dj prsent des procds de distinction entre les
phases REM et NON-REM du sommeil ([31], [46]), nous pensons qu'une telle diffrenciation
pourrait tre effectue avant d'approfondir la classification en stades.
Classification automatique en stades du sommeil Page 53
Conclusion
Nous venons de prsenter un systme complet de classification automatique en stades du
sommeil incluant les tapes d'limination des artefacts, d'extraction de caractristiques et de
classification proprement dite en stades du sommeil (Figure 67).
Figure 67 Etapes de la classification automatique en stades du sommeil
Quatorze procds de dtection et de correction d'artefacts ont t implments et les valeurs
optimales de leurs 23 paramtres rglables ont t dtermines exprimentalement. L'valuation
de leurs rsultats a t effectue visuellement et ceux-ci semblent tout fait satisfaisants. Il serait
nanmoins souhaitable de calculer les taux de reconnaissance exacts de ces procdures sur base
de signaux PSG cots en artefacts par des experts. Ceci fera l'objet d'un travail ultrieur.
En ce qui concerne l'extraction de caractristiques, 26 procds d'analyse ont t implments,
permettant d'obtenir 102 attributs diffrents. L'objectif tait d'extraire un maximum de
caractristiques et de comparer ensuite leur pouvoir discriminant afin de slectionner les
meilleures. Au final, neuf d'entres-elles ont t choisies parce qu'elles permettaient, a priori, de
distinguer facilement les diffrents stades de sommeil. Il s'agit des attributs 10, 11, 20, 22, 25,
30, 31, 35 et 87 (voir Tableau 6 en annexe I).
Enfin, trois types de classificateurs ont t tests afin de comparer leurs performances sur une
mme base de donnes. Il s'agit du clustering, du perceptron multicouches et des forts
alatoires d'arbres dcisionnels. Ces trois mthodes de classification prsentent des taux de
reconnaissance tout fait similaires et qui se situent entre 67.8 et 69.2% pour la base de
donnes de tracs pathologiques et entre 70.3 et 76.9% pour la base de donnes
d'enregistrements de nuits de sujets sains.
Ces rsultats sont dj trs satisfaisants si on les compare aux taux de reconnaissance de 50.4%
et 57.3 %, obtenus par le logiciel Mdatec actuellement disponible sur le march. Nanmoins,
quelques amliorations peuvent encore tre apportes.
Conclusion
Classification automatique en stades du sommeil Page 54
Notamment, nous pourrions tenir compte des caractristiques des poques prcdentes et
suivantes lors de la phase de classification en stades du sommeil et nous pourrions combiner les
classificateurs entre eux pour tirer parti des avantages de chacun. Ces diverses propositions
seront investigues prochainement dans le travail de thse que j'envisage de raliser.
Sur un plan plus personnel, ce travail m'a ouvert de nouvelles perspectives en m'introduisant au
domaine du traitement des signaux biomdicaux. J'y ai dcouvert un monde o Ingnieurs et
Mdecins collaborent pour amliorer les procdures de diagnostic. J'ai galement pris plaisir
dcouvrir l'origine des biopotentiels mesurs en polysomnographie et j'espre mon tour
passionner d'autres personnes en leur exposant mes travaux. Enfin, je suis contente d'avoir pu
dmythifier quelques aspects du sommeil qui, pour moi, occupe bien plus d'un tiers de ma
vie .
Classification automatique en stades du sommeil Page 55
Rfrences
[1] MACNISH R., The philosophy of sleep, New York, D Appleton, 1834.
[2] HANS B., ber das Elektrenkephalogramm des Menschen, Arch f Psychiatr 87, 527-570, 1929.
[3] LOOMIS A.L., HARVEY E.N., HOBART G.A., Cerebral States During Sleep, as Studied by
Human Brain Potentials. J. Exp. Psychol., 21, 127144, 1937.
[4] ASERINSKY E., KLEITMAN N., Regularly Occuring Periods of Eye Motility, and Concomitant
Phenomena, During Sleep., Science, 118, 273274, 1953.
[5] DEMENT W.C., KLEITMAN N., Cyclic Variations in EEG During Sleep and their Relation to Eye
Movements. Body Motility and Dreaming., Electroencephalogr. Clin. Neurophysiol., 9, 673
390, 1957.
[6] JOUVET M., MICHEL F., COURJON J., Sur un stade d'activit lectrique crbrale rapide au cours
du sommeil physiologique, C. R. Soc. Biol. (Paris) ,153, 1024-1028, 1959.
[7] MONROE L., Inter-rater reliability and the role of experience in scoring EEG sleep.,
Psychophysiol, 5, 376384, 1967.
[8] RECHTSCHAFFEN A. , KALES A., A manual of standardized terminology, techniques and scoring
system for sleep stages in human subjects., US Government Printing Office,1968.
[9] NAUWELAERS I., SERMEUS G., Enqute plus de 40% de mauvais dormeur, Test sant, 63,
octobre-novembre, 2004.
[10] KERKHOFS M., Le sommeil de A Zzzz, ditions Labor, Bruxelles, Belgique, 2000.
[11] JASPER H.H., Report of the Committee on Methods of Clinical Examination in
Electroencephalography., Electroencephalogr Clin Neurophysiol, 10, 370-375, 1958.
[12] BENOIT O., GOLDENBERG F., Exploration du sommeil et de la vigilance chez l'adulte., Editions
Medicales Internationales, 1997.
[13] PENZEL T., CONRADT R., Computer based sleep recording and analysis., Sleep Medicine
Reviews, Vol. 4, No. 2, 131-148, 2000.
[14] KRYGER H., ROTH T., DEMENT H., Principles and practice of sleep medicine, Saunders,
Philadelphia, 1994.
Rfrences
Classification automatique en stades du sommeil Page 56
[15] SCHLGL A., ANDERER P., ROBERTS S.J., PREGENZER M. PFURTSCHELLER G., Artefact
detection in sleep EEG by the use of Kalman filtering, Proceedings EMBEC'99, Part II, 4-7,
1648-1649, 1999.
[16] MORETTI D.V., BABILONI F., CARDUCCI F., CINCOTTI F., REMONDINI E., ROSSINI P.M.,
SALINARI S., BABILONI C., Computerized processing of EEGEOGEMG artifacts for
multicentric studies in EEG oscillations and event-related potentials, International Journal of
Psychophysiology, Vol.47, Is.3, 199216, 2003.
[17] DURKA P.J., KLEKOWICZ H., BLINOWSKA K.J., SZELENBERGER W., NIEMCEWICZ SZ., A
simple system for detection of EEG artifacts in polysomnographic recordings, IEEE Transactions
on Biomedical engineering, Vol. 50, No. 4, 526-528, 2003.
[18] PARK H-J., JEONG D-U, PARK K-S., Automated detection and elimination of periodic ECG
artifacts in EEG using the energy interval histogram method, IEEE Transactions on Biomedical
engineering, Vol. 49, No.12, 1526-1533, 2002.
[19] AGARWAL R., GOTMAN J., FLANAGAN D., ROSENBLATT B., Automatic EEG analysis during
long-term monitoring in the ICU, Electroencephalography and Clinical Neurophysiology,
107, 44-58, 1998.
[20] CROFT R. J., BARRY R. J., Removal of ocular artifact from the EEG: a review, Neurophysiol.
Clin., 30, 5-19, 2000.
[21] CELKA P., BOASHASH B., COLDITZ P., Preprocessing and time-frequency analysis of newborn
EEG seizures, IEEE Engineering in Medicine and Biology, September/October, 2001.
[22] ALLEN P., POLIZZI G., KRAKOW K.., FISH D., LEMIEUX L., Identification of EEG envents in the
MR Scanner: the problem of pulse artifact and a method for its subtraction, Neuroimage, vol 8,
229-239, 1998.
[23] COMON P., Independent component analysis, a new concepts, Signal processing, Vol 36, 287-
314, April 1994.
[24] DURIEU C., KIEFFER M., Analyse en composantes indpendantes pour la sparation aveugle de
sources, [en ligne], http://mfca.ups-tlse.fr/cetsis/Docs/Articles/Durieu_Cecile.pdf,
dernirement en janvier 2007.
[25] LARUE E., Sparation de sources Markoviennes, Rapport de DEA, Universit Paris Sud
Supelec, Juin 2003.
[26] BELL A., SEJNOWSKI T.J., An information maximization approach to blind separation and blind
deconvolution, Neural computation, Vol 7, 1129-1159, 1995.
[27] BELL A., SEJNOWSKI T.J., Fast blind separation based on information theory, Proc. Intern.
Symp. on Nonlinear Theory and Applications, Las Vegas, Dec. 1995.
[28] DEVUYST S., La sparation de sources et l'analyse en composantes indpendantes, Document
interne ralis dans le cadre du projet DREAMS la Facult Polytechnique de Mons, mai
2006.
Rfrences
Classification automatique en stades du sommeil Page 57
[29] STANUS E., Contribution la conception de dispositifs de dtection et d'analyse des troubles du
sommeil chez l'homme, FPMs PhD thesis, 1985.
[30] AGARWAL R., GOTMAN J., Computer-Assisted Sleep Staging, IEEE Engineering in Medicine
and Biology Magazine, Vol. 48, No. 12, 1412-1423, 2001.
[31] ROBERT C., KARASINSKI P., NATOWICZ R., Adult rat vigilance state discrimination by artificial
neural network using a single EEG channel, Physiol and Behav, 59(6), 1051-1060, 1996.
[32] PFURTSCHELLER G., FLOTZINGER D., MATUSCHIK D., Sleep classification ininfants based on
artificial neural networks, Biomed Technik, 37, 122-130, 1992.
[33] HUUPPONEN E., HIMANEN S-L., VRRI A., HASAN J., SAASTAMOINEN A., LEHTOKANGAS
M., SAARINEN J., Fuzzy detection of EEG alpha without amplitude thresholding, Artificial
Intelligence in Medicine, , 24, 133-147, 2002.
[34] ENGLEHART K., HUDGINS B., PARKER P.A., STEVENSON M., Classification of the myoelectric
signal using time-frequency based representations, Medical Engineering and Physics, 21, 431-
438, 1999.
[35] GEVA A.B., KEREM D.H., Forecasting Generalized Epileptic Seizures from the EEG Signal by
Wavelet Analysis and Dynamic Unsupervised Fuzzy Clustering, IEEE Transactions on
Biomedical engineering, Vol. 45, No.10, 1205-1216, 1999.
[36] ZHANG Z., KAWABATA H., LIU Z-Q., Electroencephalogram analysis using fast wavelet transform,
Computers in Biology and Medicine, 31, 429-440, 2001.
[37] QUIAN QUIROGA R., GARCIA H., Single-trial event-related potentials with wavelet denoising,
Clinical Neurophysiology, 114, 376390, 2003.
[38] CRANSTOUN S.D., Time-frequency spectral estimation of multichannel EEG using the auto-SLEX
method, IEEE Transactions on Biomedical engineering, VOL.49, NO.9, 988-996, 2002.
[39] ANONYME., Rapport Scientifique et Technique du projet DREAMS (Convention 215142),
Priode du 01/07/04 au 31/12/04, Document interne la Facult Polytechnique de
Mons, 2004.
[40] PRINCIPE J.C., TOME A.M.P., Performance and training strategies in feedforward neural
networks: an application to sleep scoring., Proceeding of the IJCNN89, 1, 341-346, 1989.
[41] MAMELAK A.N., QUATTROCHI J.J., HOBSON J.A., Automated staging of sleep in the cats using
neural networks., Electroencephal Clin and Neurophysiol, 79, 52-61, 1991.
[42] SCHALTENBRAND N., LENGELLE R., MACHER J.P., Neural network model: application to
automatic analysis of human sleep, Comput and Biomed Res, 26, 157-171, 1993.
[43] DEWASME L., Etude de la classification du sommeil en stades par les mthodes de clustering,
Travail de fin d'tudes la Facult Polytechnique de Mons, juin 2005.
Rfrences
Classification automatique en stades du sommeil Page 58
[44] HOANG HAI ANH., Usage des arbres de dcisions, [en ligne],
http://www.ifi.edu.vn/rapports/tipe/promo09/tipe-hoang_hai_anh.pdf , travail d'intrt
personnel encadr, Institut de la francophonie pour l'informatique, juillet 2004.
[45] DANKER-HOPFE H., KUNZ D., GRUBER G., KLSCH G., LORENZO JL., HIMANEN SL., KEMP
B., PENZEL T., RSCHKE J., DORN H., SCHLGL A., TRENKER E., DORFFNER G.., Interrater
Reliability between scorers from eight European Sleep laboratories in subjects with different sleep
disorders, Sleep Res, 13, 63-69, 2004.
[46] GRZINGER M, RSCHKE J, KLPPEL B., Interrater Automatic recognition of rapid eye
movement (REM) sleep by artificial neural networks J Sleep Res, 4, 86-91, 1995.
ANNEXES
Classification automatique en stades du sommeil A- I
Annexe I
Description des procds
d'extraction de
caractristiques
N du
procd
Nom et descriptif du procd
Attributs extraits par ce
procd
N de
l'attribut
#1- bta 1.
#2- sigma 2.
#3- alpha 3.
#4- thta 4.
#5- delta 5.
1 STFT_cent_EEG: dtermine pour chaque segment de l'EEG central, le
pourcentage d'activit bta, sigma, alpha, tta, delta et slow, partir du
calcul de la transforme de Fourier court terme (STFT: Short Ttime
Fourier Transform).
#6- slow wave 6.
#1- bta 7.
#2- sigma 8.
#3- alpha 9.
#4- thta 10.
#5- delta 11.
2 STFT_cent_EEG2: dtermine galement, le pourcentage d'activit bta,
sigma, alpha, tta, delta et slow, pour chaque segment de l'EEG central.
Son fonctionnement est trs semblable au procd STFT_cent_EEG. La
seule diffrence est que la frquence de rfrence prise pour dterminer
le type d'activit d'une tranche ne correspond plus au maximum de la
transforme de Fourier mais son centre de gravit.
#6- slow wave 12.
#1- bta 13.
#2- sigma 14.
#3- alpha 15.
#4- thta 16.
#5- delta 17.
3 Pce_activ_cent_EEG: calcule pour chaque segment de l'EEG central, la
puissance relative dans les diffrentes bandes de frquences partir d'un
estimateur de sa densit spectrale de puissance.
#6- slow wave 18.
#1- beta 19.
#2- sigma 20.
#3- alpha 21.
#4- thta 22.
4 Niveau_bandes: calcule pour chaque segment, l'cart-type relatif des
signaux filtrs dans les diffrentes bandes de frquences.
#5- delta 23.
5 Freq_dominante: calcule la frquence correspondant au maximum de la
transforme de Fourier de chaque segment d'EEG central.
#1- freq 24.
6 Freq_centre_gravite: calcule la frquence correspondant au centre de
gravit de la transforme de Fourier de chaque segment d'EEG central.
#1- freq 25.
7 AR_freq_dominante: synthtise chaque segment d'EEG central l'aide
d'un modle autorgressif (AR) et calcule la frquence correspondant au
maximum de la transforme de Fourier de ce signal synthtis.
#1- freq 26.
8 AR_freq_centre_gravite: synthtise chaque segment d'EEG central
l'aide d'un modle autorgressif (AR) et calcule la frquence
correspondant au centre de gravit de la transforme de Fourier de ce
signal synthtis.
#1- freq 27.
9 Ecart_type_cent_EEG: calcule pour chaque segment, l'cart-type relatif
de l'EEG central
#1- ecart type 28.
10 Ecart_type_EMG: calcule pour chaque segment, l'cart-type relatif
moyen des EMG en tenant compte de la dtection d'artefact.
#1- ecart type 29.
Annexe I
Classification automatique en stades du sommeil A- II
N du
procd
Nom et descriptif du procd
Attributs extraits par ce
procd
N de
l'attribut
11 Rap_ecart_type_EEG: calcule pour chaque segment, le rapport relatif
des carts-types frontaux et centraux.
#1- rapport ecart ype 30.
#1- lent 31.
12 Mvt_EOG: calcule pour chaque segment le pourcentage (en occupation
de l'espace) des mouvements oculaires lents et des mouvements oculaires
rapides.
#2- rapide 32.
#1- pcent_fus_page 33.
#2- pres_fus_page 34.
#3- pcent-fus_3min 35.
13 Spindles: calcule pour chaque segment le pourcentage en occupation de
l'espace des fuseaux.
#4- pres_fus_3min 36.
#1- bta 37.
#2- sigma 38.
#3- alpha 39.
#4- thta 40.
#5- delta4 41.
#6- delta2 42.
#7- delta1 43.
#8- slow wave 44.
#9- ASI 45.
#10- TSI 46.
14 NWP_cent_EEG: dtermine pour chaque segment de l'EEG central, le
"Wavelet Power normalized" (NWP) de chaque coefficient d'ondelette
correspondant aux diffrents rythmes du sommeil. Trois autres
paramtres sont galement calculs pour chaque segment:
ASI = var(alpha)/var(delta4 + theta);
TSI = var(theta)/var(delta4 + alpha);
ratio = (var(delta1) + var(delta2))/var(theta).
.
#11- Ratio 47.
#1- beta-sigma 48.
#2- sigma-alpha 49.
#3- alpha-teta 50.
#4- teta-delta4 51.
#5- delta4-delta2 52.
#6- delta2-delta1 53.
15 Corr1_cent_EEG: dtermine pour chaque segment de l'EEG central, la
corrlation entre les coefficients d'ondelettes distants de 1.
#7- delta2-delta1 54.
#1- beta-alpha 55.
#2- sigma-teta 56.
#3- alpha-delta4 57.
#4- teta-delta2 58.
#5- delta4-delta1 59.
#6- delta2-slow wave 60.
#7- delta1-beta 61.
16 Corr2_cent_EEG: dtermine pour chaque segment de l'EEG central, la
corrlation entre les coefficients d'ondelettes distants de 2.
#8- slow-wave-sigma 62.
#1- beta-teta 63.
#2- sigma-delta4 64.
#3- alpha-delta2 65.
#4- thta-delta1 66.
#5- delta4-slow wave 67.
#6- delta2-beta 68.
#7- delta1-sigma 69.
17 Corr3-cent_EEG: dtermine pour chaque segment de l'EEG central, la
corrlation entre les coefficients d'ondelettes distants de 3.
#8- slow wave- alpha 70.
#1- bta 71.
#2- sigma 72.
#3- alpha 73.
#4- thta 74.
#5- delta4 75.
#6- delta2 76.
#7- delta1 77.
18 M3_cent_EEG: dtermine pour chaque segment de l'EEG central, la
valeur du moment relatif d'ordre 3 de chaque coefficient d'ondelette
correspondant un rythme du sommeil.
#8- slow wave 78.
#1- bta 79.
#2- sigma 80.
#3- alpha 81.
#4- thta 82.
#5- delta4 83.
#6- delta2 84.
#7- delta1 85.
19 M4_cent_EEG: dtermine pour chaque segment de l'EEG central, la
valeur du moment relatif d'ordre 4 de chaque coefficient d'ondelette
correspondant un rythme du sommeil.
#8- slow wave 86.
Annexe I
Classification automatique en stades du sommeil A- III
N du
procd
Nom et descriptif du procd
Attributs extraits par ce
procd
N de
l'attribut
20 Corr_EOG_EEG: calcule pour chaque segment la corrlation qui existe
entre les EOG et l'EEG central.
#1- correlation 87.
#1- lent 88.
#2- rapide 89.
21 Mvt_EOG2: second procd permettant de calculer pour chaque
segment le pourcentage (en occupation de l'espace) des mouvements
oculaires lents, des mouvements oculaires rapides, et de tout mouvement
confondu.
#3- somme mvt 90.
#1- pcent_art_EOG 91. 22 pourcent_art: calcule le pourcentage en occupation de l'espace des
artefacts de courte dure sur l'poque considr (tous les signaux PSG
confondus).
#2- pcent_art_EEG 92.
#1- air_ss_courbe 93. 23 onde_lente_EEG: examine pour chaque onde, l'aire qu'il y a entre la
courbe EEG et la courbe reliant les minima locaux. Ensuite, il
additionne soit toutes ces aires, soit uniquement les aires suprieures
un certain seuil.
#2- pcent_onde_lente 94.
24 ecartype_EMG2: calcule pour chaque segment, l'cart relatif moyen des
EMG sans tenir compte de la dtection d'artefact.
#1- ecart type ss detection
d'art
95.
25 freq-cent-graviteEOG: calcule la frquence correspondant au centre de
gravit de la transforme de Fourier de chaque segment d'EOG.
#1- freq EOG 96.
#1- bta dans EOG 97.
#2- sigma dans EOG 98.
#3- alpha dans EOG 99.
#4- thta dans EOG 100.
#5- delta dans EOG 101.
26 STFT_cent_EOG2: dtermine le pourcentage d'activit bta, sigma,
alpha, tta, delta et slow, pour chaque segment d'EOG.
#6- slow wave dans EOG 102.
Tableau 6 Description des procds d'extraction de caractristiques
Classification automatique en stades du sommeil A- IV
Annexe II
Le format EDF
Le format EDF (European Data Format) a t dvelopp en 1991. Il permet de stocker des
signaux physiques enregistrs simultanment, comme les EEG, EOG, etc. Ces signaux peuvent
prsenter des dimensions et des frquences d'chantillonnage distinctes. Les donnes sont
sauves bloc par bloc comme l'illustre la Figure 68.
Bloc 1 Bloc 2 Bloc 3
Signal 1
Signal 2
Signal 3
EDF :
Bloc 1 Bloc 2 Bloc 3
Figure 68 Le format EDF sauve les enregistrements bloc par bloc
Ainsi, un fichier EDF est constitu d'un en-tte sauv en ASCII et contenant:
- 8 ascii pour la version du format de donne (0)
- 80 ascii pour l'identification du patient
- 80 ascii pour l'identification de l'enregistrement local
- 8 ascii pour la date de dbut d'enregistrement (dd.mm.yy)
- 8 ascii pour l'heure de dbut d'enregistrement (hh.mm.ss)
- 8 ascii pour le nombre total de bytes dans l'en-tte
- 44 ascii rservs
- 8 ascii pour le nombre de blocs d'enregistrement (-1 si inconnu)
- 8 ascii pour la dure d'un bloc en secondes
- 4 ascii pour le nombre de signaux enregistrs (ns)
- ns * 16 ascii pour ns * titre (par ex: EEG, EMG, hypnogram)
- ns * 80 ascii pour ns * type de transducteur (par ex: lectrode AgAgCl)
- ns * 8 ascii pour ns * dimension physique (par ex: uV ou degr C)
- ns * 8 ascii pour ns * valeur physique minimum (par ex: -500 oo 34)
- ns * 8 ascii pour ns * valeur physique maximum (par ex: 500 oo 40)
- ns * 8 ascii pour ns * valeur digitale minimum (par ex: -2048)
- ns * 8 ascii pour ns * valeur digitale maximum (par ex: 2047)
Annexe II
Classification automatique en stades du sommeil A- V
- ns * 80 ascii pour ns * pr filtrage (par ex: HP:0.1Hz LP:75Hz)
- ns * 8 ascii pour ns * nombre nr
i
d'chantillons du signal i dans un bloc
- ns * 32 ascii pour ns * rservs
Cet en-tte est suivi des donnes d'enregistrements o les valeurs des chantillons sont
reprsentes par des mots (entiers sur 2 octets).
DATA DU BLOC 1
- nr
1
* int16 pour les nr
1
chantillons du signal 1 dans le bloc 1
- nr
2
* int16 pour les nr
2
chantillons du signal 2 dans le bloc 1
-
- nr
ns
* int16 pour les nr
ns
chantillons du signal ns dans le bloc 1
DATA DU BLOC 2
- nr
1
* int16 pour les nr
1
chantillons du signal 1 dans le bloc 2
- nr
2
* int16 pour les nr
2
chantillons du signal 2 dans le bloc 2
-
- nr
ns
* int16 pour les nr
ns
chantillons du signal ns dans le bloc 2