Mr.
Soltane
Professeur
UMMTO
Rapporteur :
Mme. AMEUR
Zohra
M.C.A
UMMTO
DIAF
Moussa
Professeur
UMMTO
Mr.
HADDAB
Salah
M.C.A
UMMTO
Mr.
LAHDIR
Mourad
M.C.A
UMMTO
Examinateurs : Mr.
AMEUR
Remerciements
Je tiens remercier sincrement Madame Ameur, qui, en tant que Directrice
de ce mmoire, s'est toujours montre l'coute et trs disponible tout au long
de la ralisation de ce mmoire de Magister, ainsi pour l'inspiration, l'aide et
le temps qu'elle a bien voulu me consacrer. Je tiens exprimer toute ma
reconnaissance Monsieur AMEUR Soltane, Professeur lUMMTO et
directeur du laboratoire de recherche LAMPA, pour lhonneur quil me fait
de prsider mon jury de thse, Aussi je remercie vivement Monsieur DIAF
Moussa Professeur lUMMTO, Monsieur LAHDIR Mourad Matre de
confrences lUMMTO et Monsieur HADDAB Salah Matre de confrences
lUMMTO, membres du jury, pour leur minente contribution lvaluation
de ce projet.
Enfin, j'adresse mes plus sincres remerciements tous mes proches et
amis, qui m'ont toujours soutenu et encourag au cours de la ralisation de ce
travail.
Merci toutes et tous.
Ddicaces
A mon pre, ma mre
A mon frre et surs
A ma femme et sa famille
A la mmoire de mes grands parents
A tout mes amis (es)
A tout mes matres et professeurs : du primaire au suprieur
A tous ceux qui ont contribu au dveloppement des sciences en
gnral et de llectronique en particulier
CHAPITRE I : LA BIOMETRIE
I.1. Prambule ....................................................................................................................... 3
I.2. La biomtrie .................................................................................................................... 3
I. 2.1. Dfinition ................................................................................................................. 3
I.3. Le march mondial de la biomtrie ..................................................................................... 4
I.4. Les parts de march par technologie ................................................................................. 5
I.5. Les techniques biomtriques ............................................................................................. 5
I.5.1. Lanalyse morphologique (physiologique)...................................................................... 5
I.5.2. Lanalyse comportementale ......................................................................................... 5
I.6. Architecture dun systme biomtrique .............................................................................. 6
I.6.1. Module dapprentissage ............................................................................................. 6
I.6.2. Module de reconnaissance ......................................................................................... 6
I.6.3 .Module dadaptation.................................................................................................... 7
I.7. Prsentation de quelques technologies biomtriques ......................................................... 8
I.7.1. Les empreintes digitales ........................................................................................... 8
I.7.2. La voix ..................................................................................................................... 9
I.7.3. Liris ........................................................................................................................ 9
I.7.4. La signature ........................................................................................................... 10
I.7.5. La gomtrie de la main ......................................................................................... 10
I.7.6. Le visage ............................................................................................................... 11
I.8 .Reconnaissance du visage .............................................................................................. 12
I.8.1. Approches globales ................................................................................................ 13
I.8.2. Mthodes locales .................................................................................................... 15
I.8.3. Mthodes hybrides ................................................................................................. 16
I.9. Principales difficults de la reconnaissance de visage ..................................................... 16
I.9.1. Changement dillumination ...................................................................................... 16
I.9.2. Variation de pose ................................................................................................... 17
.................................................................. 39
Introduction
Introduction
De nos jours on parle de plus en plus de l'inscurit dans divers secteurs ainsi
que des moyens informatiques mettre en uvre pour contrer cette tendance. La vrification
et lidentification des individus est lun des moyens permettant dassurer cette scurit. Ltre
humain se sert quotidiennement de son systme visuel pour identifier les personnes de faon
automatique, bien que le processus mis en jeu soit complexe.
lhomme a mis en place des moyens de vrification didentit qui sont lis, soit ce
que possde une personne telle quune carte didentit ou un passeport, soit ce que sait cette
personne, cest le cas du mot de passe ou un code PIN. Nanmoins, ces lments peuvent tre
oublis, vols ou falsifis. Pour contourner ces limitations, un autre moyen de scurit a t
dvelopp qui permet dutiliser, non pas linformation quun individu possde ou connat,
mais une information (propre) intrinsque cette personne. Cette nouvelle faon
didentification des individus est la biomtrie.
Les caractristiques biomtriques sont une solution alternative aux anciens moyens de
vrification didentit. Lavantage de ces caractristiques biomtriques est dtre universelles,
cest--dire prsentes chez toutes les personnes identifier. Dautre part, elles sont
mesurables et uniques : deux personnes ne peuvent pas possder exactement la mme
caractristique. Elles sont aussi permanentes ce qui signifie quelles ne varient pas ou peu au
cours du temps.
Pour que des caractristiques collectes puissent tre qualifies de modalits
biomtriques, elles doivent tre :
universelles (exister chez tous les individus),
uniques (permettre de diffrencier un individu par rapport un autre),
permanentes (autoriser lvolution dans le temps),
enregistrables (collecter les caractristiques dun individu avec son accord),
mesurables (autoriser une comparaison future).
Lintrt principal de la biomtrie est donc de reconnatre et didentifier
automatiquement les identits des individus en utilisant leurs caractristiques physiologiques
ou comportementales. Les caractristiques physiologiques peuvent inclure le visage, liris, les
empreintes, la gomtrie de la main. Les caractristiques comportementales incluent la voix,
la signature, la dmarche etc.
Dans ce mmoire, nous nous intressons la biomtrie du visage qui possde
beaucoup davantages tels que, la facilit dutilisation, lacceptation par lutilisateur (car elle
est non intrusive) et le faible cot. Ainsi, la reconnaissance du visage est dj intgre dans
des systmes de scurit biomtriques utilisant un certain nombre dalgorithmes classiques.
La difficult de la reconnaissance de visage par ordinateur varie normment suivant
que les conditions dacquisition. Dans un environnement contrl, des paramtres tels que
larrire-plan, la direction et lintensit des sources lumineuses, langle de la prise de vue, la
distance de la camra au sujet sont des paramtres matriss par le systme. Dans un
1
Introduction
environnement non contrl, une srie de prtraitements sont souvent ncessaires avant de
faire la reconnaissance proprement dite.
Les travaux de ce mmoire sinscrivent dans un contexte global de recherche et
dveloppement de dalgorithmes pour la reconnaissance de visages. Ainsi, au cours de ce
mmoire, nous aurons concevoir un systme de reconnaissance facial avec la mthode
Eigenface qui se base sur une analyse en composante principale. LACP est une mthode
mathmatique qui peut tre utilise pour simplifier un ensemble de donnes, en rduisant sa
dimension. Elle est utilise pour reprsenter efficacement les images de visages, qui peuvent
tre approximativement reconstruites partir dun petit ensemble de poids et dune image de
visage standard.
Nous avons choisi darticuler notre tude autour de quatre chapitres principaux.
Le premier chapitre est consacr la prsentation gnrale de la biomtrie. Il dcrit le
principe de fonctionnement des systmes biomtriques puis dfinit les outils utiliss pour
valuer leurs performances. Ensuite, la place de la reconnaissance faciale parmi les autres
techniques biomtriques est analyse. A travers ce chapitre, nous voulons positionner le
problme de la reconnaissance faciale et prsenter ses enjeux et intrts par rapport aux autres
techniques. Nous tudions galement les principales composantes dun systme de
reconnaissance faciale, notamment la dtection, lextraction de caractristiques et la
reconnaissance. Enfin, nous mettons en lumire les difficults rencontres par les systmes de
reconnaissance de visage.
Dans le second chapitre une analyse dtaille des diffrentes techniques dveloppes
au cours de ces dernires annes dans les domaines de la dtection de visage et de la
reconnaissance est prsente. Notre objectif est de classifier ces mthodes de manire efficace
afin de mettre en vidence les particularits ainsi que les avantages et les inconvnients de
chacune dentre elles. Ceci nous permettra, par la suite, de mettre en avant les critres de
performances qui vont guider le choix des solutions retenues dans le cadre de notre
problmatique. Nous voquerons aussi la normalisation gomtrique des images des visages
et les diffrentes normalisations photomtriques.
Dans le troisime chapitre nous prsenterons notre algorithme qui se base sur une
analyse en composante principale, qui est une mthode mathmatique qui peut tre utilise
pour simplifier un ensemble de donnes, en rduisant sa dimension. Elle est utilise pour
reprsenter efficacement les images de visages, qui peuvent tre approximativement
reconstruites partir dun petit ensemble de poids et dune image de visage standard. Nous
verrons plusieurs approches pour amliorer les performances de PCA, puis nous prsentons
les bases donnes utilises dans le cadre de ce mmoire, FEI, CVSRP, AT&T, IFW et
MUCT.
Dans le quatrime chapitre nous prsenterons notre interface graphique qui a t cr
laide du GUI (Graphical User Interface) sous Matlab, nous analyserons les rsultats des tests
effectus sur plusieurs bases de donnes sous diffrentes conditions.
En conclusion, nous rcapitulerons les principales contributions de ce mmoire avant
dexposer les perspectives envisages.
2
Chapitre I
La biomtrie
Chapitre I
La biomtrie
I.1 Prambule
Les systmes biomtriques sont de plus en plus utiliss depuis quelques annes.
Lapparition de lordinateur et sa capacit traiter et stocker les donnes ont permis la
cration des systmes biomtriques informatiss. Il existe plusieurs caractristiques
physiques uniques pour un individu, ce qui explique la diversit des systmes appliquant la
biomtrie, selon ce que lon prend en compte :
Lempreinte digitale
La gomtrie de la main
Liris
La rtine etc
Nous allons voir dans ce chapitre les principales technologies biomtriques, puis nous allons
nous focaliser sur les systmes de reconnaissances faciales, leurs avantages et les problmes
lis leurs applications.
I.2. La biomtrie
I.2.1. Dfinition
La biomtrie peut tre dfinie comme tant la reconnaissance automatique d'une
personne en utilisant des traits distinctifs. Une autre dfinition de la biomtrie est toutes
caractristiques physiques ou traits personnels automatiquement mesurables, robustes et
distinctives qui peuvent tre utilises pour identifier un individu ou pour vrifier l'identit
prtendue d'un individu [1].
La biomtrie consiste en lanalyse mathmatique des caractristiques biologiques dune
personne et a pour objectif de dterminer son identit de manire irrfutable. Contrairement
ce que lon sait ou ce que lon possde la biomtrie est base sur ce que lon est et permet
ainsi dviter la duplication, le vol, loubli ou la perte.
Un systme biomtrique peut avoir deux modes opratoires [4] :
Lidentification, elle permet dtablir lidentit dune personne partir dune base de
donnes, le systme biomtrique pose et essaye de rpondre la question, qui est la
personne X ? , il sagit dune comparaison du type un contre plusieurs (1:N).
La vrification ou lauthentification, le systme biomtrique demande lutilisateur
son identit et essaye de rpondre la question, est-ce la personne X? . Dans une
application de vrification l'utilisateur annonce son identit par l'intermdiaire d'un
mot de passe, dun numro didentification, dun nom d'utilisateur, ou toute
combinaison des trois. Le systme sollicite galement une information biomtrique
provenant de l'utilisateur, et compare la donne caractristique obtenue partir de
linformation entre, avec la donne enregistre correspondante lidentit prtendue,
cest une comparaison un un (1:1). Le systme trouvera ou ne trouvera pas
dappariement entre les deux. La vrification est communment employe dans des
applications de contrle d'accs et de paiement par authentification [2].
La biomtrie offre beaucoup plus davantages que les mthodes existantes d'authentification
personnelle telles que les clefs, les numros d'identification (ID), les mots de passe et les
cartes magntiques. En effet elle fournit encore plus de sret et de convenance ce qui
engendre dnormes avantages conomiques et elle comble les grandes failles de scurit des
mots de passe.
3
Chapitre I
La biomtrie
Chapitre I
La biomtrie
Chapitre I
La biomtrie
Chapitre I
La biomtrie
systme. Ces difficults sont analogues celles que connaissent par exemple les systmes
dindexation de documents multimdia.
Chapitre I
La biomtrie
Chapitre I
La biomtrie
corrlation sont affectes par la translation et rotation de limage de lempreinte. Cest pour
cela que les deux approches sont en gnral combines pour augmenter les performances du
systme.
I.7.2.La voix
De tous les traits humains utiliss dans la biomtrie, la voix est celle que les humains
apprennent reconnatre ds le plus jeune ge. Les systmes de reconnaissance de locuteur
peuvent tre diviss en deux catgories : les systmes dpendant du texte prononc et les
systmes indpendants du texte. Dans le premier cas, lutilisateur est tenu dutiliser un texte
(un mot ou une phrase) fixe prdtermin au cours des sances dapprentissage et de
reconnaissance. Alors que, pour un systme indpendant du texte le locuteur parle librement
sans texte prdfini.
Cette dernire catgorie est plus difficile, mais elle est utile dans le cas o lon a besoin de
reconnatre un locuteur sans sa coopration. La recherche sur la reconnaissance de locuteur
est en pleine croissance, car elle ne ncessite pas de matriel cher, puisque la plupart des
ordinateurs personnels de nos jours sont quips dun microphone. Toutefois, la mauvaise
qualit et le bruit ambiant peuvent influencer la vrification et par suite rduire son utilisation
dans les systmes biomtriques. Dans un systme de reconnaissance de locuteur le signal est
premirement mesur puis dcompos en plusieurs canaux de frquences passe-bande.
Ensuite, les caractristiques importantes du signal vocal sont extraites de chaque bande.
Parmi les caractristiques les plus communment utilises sont les coefficients Cepstraux. Ils
sont obtenus par le logarithme de la transforme de Fourier du signal vocal dans chaque
bande. Finalement, la mise en correspondance des coefficients Cepstraux permet de
reconnatre la voix. Dans cette tape, gnralement on fait appel des approches fondes sur
les modles de Markov cachs, la quantification vectorielle, ou la dformation temps
dynamique.
I.7.3.Liris
Lutilisation de liris comme caractristique biomtrique unique de lhomme a donn
lieu une technologie didentification fiable et extrmement prcise. Liris est la rgion, sous
forme danneau, situe entre la pupille et le blanc de lil, il est unique. Liris a une structure
extraordinaire et offre de nombreuses caractristiques de texture qui sont uniques pour chaque
individu. Les algorithmes utiliss dans la reconnaissance de liris sont si prcis que la plante
toute entire pourrait tre inscrite dans une base de donnes de liris avec peu derreurs
didentification.
Limage de liris est gnralement capture laide dune camra standard. Cependant, cette
tape de capture implique une coopration de lindividu. De plus, il existe plusieurs
contraintes lies lutilisation de cette technologie. Par exemple, il faut sassurer que liris de
9
Chapitre I
La biomtrie
lindividu est une distance fixe et proche du dispositif de capture, ce qui limite lutilisation
de cette technologie.
I.7.4.La signature
La vrification de la signature analyse la faon dont un utilisateur signe son nom. Les
caractristiques dynamiques de la signature comme la vitesse et la pression, sont aussi
importantes que la forme gomtrique de la signature. Il existe deux approches pour vrifier la
signature statique et dynamique. Dans la vrification de signature statique, seules les formes
gomtriques de la signature sont utilises pour authentifier une personne. Dans cette
approche, en rgle gnrale, la signature est normalise une taille connue ensuite
dcompose en lments simples.
La forme et les relations de ses lments sont utilises comme caractristiques
didentification. Quant la deuxime approche de la vrification de signature elle utilise, en
plus de la forme gomtrique, les caractristiques dynamiques telles que lacclration, la
vitesse et les profils de trajectoire de la signature. Il est noter que la signature est une
biomtrie comportementale, elle volue dans le temps et est influence par les conditions
physiques et motionnelles de la personne.
Figure 7 : Signature
Chapitre I
La biomtrie
capture de la gomtrie de la main sont relativement grands et lourds, ce qui limite leur
utilisation dans dautres applications comme lauthentification dans les systmes embarqus :
tlphones portables, voitures, ordinateurs portables, etc.
I.7.6.Le visage
Nos visages sont des objets complexes avec des traits qui peuvent varier dans le
temps. Cependant, les humains ont une capacit naturelle reconnatre les visages et
didentifier les personnes dans un coup dil. Bien sr, notre capacit de reconnaissance
naturelle stend au-del de la reconnaissance du visage, o nous sommes galement en
mesure de reprer rapidement des objets, des sons ou des odeurs. Malheureusement, cette
aptitude naturelle nexiste pas dans les ordinateurs. Cest ainsi quest n le besoin de simuler
artificiellement la reconnaissance afin de crer des systmes intelligents autonomes. Simuler
notre capacit naturelle de la reconnaissance des visages dans les machines est une tche
difficile mais pas impossible. Tout au long de notre vie, de nombreux visages sont vus et
conservs naturellement dans nos mmoires formant une sorte de base de donnes.
La reconnaissance des visages par ordinateur ncessite galement une base de donnes qui est
habituellement construite en utilisant des images du visage ou parfois des images diffrentes
dune mme personne pour tenir compte des variations dans les traits du visage. Les systmes
actuels de reconnaissance du visage sont composs dun module dacquisition dimages avec
une camra. Il procde dabord une dtection du visage dans limage acquise. Ensuite,
limage du visage dtecte est normalise pour tre transmise au module de reconnaissance
qui va la traiter en utilisant des algorithmes afin dextraire une signature du visage.
Finalement, cette signature est compare, laide dun classificateur, avec les signatures dj
existantes dans une base de donnes locale, afin didentifier lindividu en question. Les
diffrentes tapes de la reconnaissance des visages sont illustres dans la figure 9. Durant la
dernire dcennie de recherche, la performance des systmes de reconnaissance du visage
sest grandement amliore, mais les rsultats sont encore loin dtre parfaits. Ces systmes
sont trs sensibles aux variations dillumination et de pose.
11
Chapitre I
La biomtrie
Aprs cet aperu rapide de quelques systmes biomtriques les plus connus, nous allons
dtailler, dans la section suivante, le fonctionnement des systmes de reconnaissance de
visages avec les mthodes mathmatiques mises en uvre pour reconnatre un visage depuis
une image fixe.
I.8 .Reconnaissance du visage
La reconnaissance faciale est une tche que les humains effectuent naturellement et
sans effort dans leurs vies quotidiennes. La grande disponibilit dordinateurs puissants et peu
onreux ainsi que des systmes informatiques embarqus ont suscit un norme intrt dans le
traitement automatique des images et des vidos numriques au sein de nombreuses
applications, incluant lidentification biomtrique, la surveillance, linteraction hommemachine et la gestion de donnes multimdia.
La reconnaissance faciale, en tant quune des technologies biomtriques de base, a pris une
part de plus en plus importante dans le domaine de la recherche, ceci tant d aux avances
rapides dans des technologies telles que les appareils photo numriques, Internet et les
dispositifs mobiles, le tout associ des besoins en scurit sans cesse en augmentation.
La reconnaissance faciale possde plusieurs avantages sur les autres technologies
biomtriques : elle est naturelle, non intrusive et facile utiliser.
Idalement, un systme de reconnaissance faciale doit pouvoir identifier des visages prsents
dans une image ou une vido de manire automatique. Le systme peut oprer dans les deux
modes suivants : authentification ou identification ; on peut galement noter quil existe un
autre type de scnario de reconnaissance faciale mettant en jeu une vrification sur une liste
de surveillance (watch-list), o un individu est compar une liste restreinte de suspects.
Le principe de fonctionnement de base dun systme de reconnaissance faciale (Figure 9)
peut tre rsum en quatre tapes : les deux premires seffectuent en amont du systme
(dtection [7] et normalisation du visage [8]) et les deux dernires reprsentent la
reconnaissance (extraction et comparaison des caractristiques).
12
Chapitre I
La biomtrie
Les mthodes de reconnaissance de visages peuvent tre classes en trois grandes approches
(Figure10). Une approche globale dans laquelle on analyse le visage (limage pixellise du
visage) dans son entier, une approche locale base sur un modle, dans laquelle le systme
essaie de dtecter, regrouper et reconnatre les diffrents lments constitutifs du visage tel
que le nez, les yeux et la bouche. Enfin, il existe des mthodes hybrides qui combinent les
deux approches prcdentes.
I.8.1. Approches globales
La particularit des algorithmes bass sur lapparence cest lutilisation directe des
valeurs dintensit des pixels de limage entire du visage comme caractristiques sur
lesquelles la dcision de reconnaissance sera fonde. Linconvnient de cette approche cest la
taille importante des donnes traiter. En effet, dans ces mthodes, une image de taille n=pq
pixels, est reprsente par un vecteur de la mme taille, dans un espace de grande dimension.
Dans le but de rduire la dimension des donnes de dpart, plusieurs mthodes ont t
proposes en vue de transformer le vecteur des donnes originales dans un autre espace, de
faible dimension, sans pour autant liminer les informations discriminatoires qui seront
utilises durant ltape de classification. La transformation des vecteurs de donnes peut tre
ralise de manire linaire ou non-linaire.
Par ailleurs, les mthodes globales peuvent tre leur tour classifies en deux grandes
catgories savoir les mthodes linaires et les mthodes non linaires. Ces mthodes
appeles aussi mthodes de projections sont bases sur la dcomposition de limage sur un
sous espace rduit et sur la recherche dun vecteur de caractristiques optimal dcrivant
limage du visage reconnatre. Ainsi, les vecteurs images originaux de grande taille seront
projets dans un espace de plus faible dimension. Les nombreuses mthodes de projection
13
Chapitre I
La biomtrie
existantes privilgient la bonne reprsentation des donnes suivant un point de vue. Par
exemple, lanalyse en composantes principales ou le classical multidimensional scaling
(MDS) [12] permettent de maximiser la variance des donnes dans la reprsentation.
La reprsentation exprime alors la forme gnrale du jeu de donnes. Les mthodes
supervises comme lanalyse discriminante projettent les donnes de faon valoriser la
sparation des classes. Le Locally Linear Embedding (LLE) [40], le Laplacian Eigenmaps
[32] et le Hessian-based Locally Linear Embedding (HLLE) [40] supposent que les donnes
sont situes sur une surface localement linaire.
Ces mthodes permettent alors le dpliement de lespace laide de projections linaires
locales. Nous allons prsenter ces approches non supervises linaires et non-linaires bases
sur les noyaux ou sur lapprentissage de varits. Les mthodes supervises seront aussi
prsentes comme lanalyse discriminante linaire (LDA).
Les techniques linaires projettent linairement les donnes dun espace de grande dimension
(par exemple, lespace de limage originale) sur un sous-espace de dimension infrieure.
Malheureusement, ces techniques sont incapables de prserver les variations non convexes
des varits (gomtriques donc au sens mathmatique du terme) de visages afin de
diffrencier des individus. Dans un sous-espace linaire, les distances euclidiennes et plus
gnralement les distances de Mahalanobis, qui sont normalement utilises pour faire
comparer des vecteurs de donnes, ne permettent pas une bonne classification entre les classes
de formes "visage" et "non-visage" et entre les individus eux-mmes. Ce facteur crucial limite
le pouvoir des techniques linaires pour obtenir une dtection et une reconnaissance du visage
trs prcises.
La technique linaire la plus connue et sans aucun doute lanalyse en composantes principales
(PCA), galement appele transforme de Karhunen-Loeve. Le PCA fut dabord utilis afin
de reprsenter efficacement des images de visages humains [11]. En 1991, cette technique a
t reprise dans le cadre plus spcifique de la reconnaissance faciale sous le nom de mthode
des Eigenfaces [12].
Cependant, le PCA classique ncessite que les images de visage soient mises sous formes de
vecteurs, ce qui a pour effet de dtruire la structure gomtrique de limage.
Pour ne pas perdre les informations de voisinage lors du passage de limage en vecteur, une
mthode PCA bidimensionnelle (2-D PCA) [13] a t tudie. Cette mthode prend en entre
des images et non plus des vecteurs.
Il existe dautres techniques galement construites partir de dcompositions linaires comme
lanalyse discriminante linaire (LDA) [14] ou encore lanalyse en composantes
indpendantes (ICA) [15].
Tandis que le PCA construit un sous-espace pour reprsenter de manire "optimale"
(mathmatiquement parlant) seulement "lobjet" visage, le LDA construit un sous-espace
discriminant pour distinguer de faon "optimale" les visages de diffrentes personnes. Elle
permet donc deffectuer une vritable sparation de classes. Des tudes comparatives (par
exemple, [14]) montrent que les mthodes bases sur le LDA donne gnralement de
meilleurs rsultats que les mthodes bases sur le PCA.
Lalgorithme ICA, quant lui, est une gnralisation de lalgorithme PCA avec lequel il
concide dans le cas de donnes gaussiennes. Lalgorithme ICA est bas sur le concept intuitif
de contraste et permet dliminer la redondance statistique des donnes de dpart. Ce dernier a
t rendu clbre notamment avec lexprience de la cocktail party [16] qui met en avant la
rsolution dun problme de sparation (dcorrlation) de sources audio. Bartlett et al. ont
14
Chapitre I
La biomtrie
fourni deux architectures diffrentes pour lICA : une premire architecture (ICA I) qui
construit une base dimages statistiquement indpendantes et une deuxime architecture (ICA
II) qui fournit une reprsentation en code factoriel des donnes.
Bien que ces mthodes globales linaires bases sur lapparence vitent linstabilit des toutes
premires mthodes gomtriques qui ont t mises au point, elles ne sont pas assez prcises
pour dcrire les subtilits des varits (gomtriques) prsentes dans lespace de limage
originale. Ceci est d leurs limitations grer la non-linarit en reconnaissance faciale : les
dformations de varits non linaires peuvent tre lisses et les concavits peuvent tre
remplies, causant des consquences dfavorables.
Afin de pouvoir traiter ce problme de non-linarit en reconnaissance faciale, de telles
mthodes linaires ont t tendues des techniques non linaires bases sur la notion
mathmatique de noyau (kernel) comme le Kernel PCA [17] et le Kernel LDA [18]. Ici, une
projection non linaire (rduction de dimension) de lespace de limage sur lespace de
caractristiques (feature space) est effectue ; les varits prsentes dans lespace de
caractristiques rsultant deviennent simples, de mme que les subtilits des varits qui sont
prserves. Bien que les mthodes bases sur le noyau peuvent atteindre une bonne
performance sur les donnes dentranement, il ne peut pas en tre de mme pour de nouvelles
donnes en raison de leur plus grande flexibilit ; contrairement aux mthodes linaires.
I.8.2. Mthodes locales
Les mthodes locales, bases sur des modles, utilisent des connaissances a priori que
lon possde sur la morphologie du visage et sappuient en gnral sur des points
caractristiques de celui-ci. Kanade prsenta un des premiers algorithmes de ce type [10] en
dtectant certains points ou traits caractristiques dun visage puis en les comparants avec des
paramtres extraits dautres visages. Ces mthodes constituent une autre approche pour
prendre en compte la non-linarit en construisant un espace de caractristiques local et en
utilisant des filtres dimages appropris, de manire ce que les distributions des visages
soient moins affectes par divers changements.
Les approches Baysiennes (comme la mthode BIC [19]), les machines vecteurs de support
(SVM) [20], la mthode des modles actifs dapparence (AAM) ou encore la mthode local
binary pattern (LBP) [21] ont t utilises dans ce but.
Toutes ces mthodes ont lavantage de pouvoir modliser plus facilement les variations de
pose, dclairage et dexpression par rapport aux mthodes globales. Toutefois, elles sont plus
lourdes utiliser puisquil faut souvent placer manuellement un assez grand nombre de points
sur le visage alors que les mthodes globales ne ncessitent de connatre que la position des
yeux afin de normaliser les images, ce qui peut tre fait automatiquement et de manire assez
fiable par un algorithme de dtection [22].
15
Chapitre I
La biomtrie
I.8.3.Mthodes hybrides
Les mthodes hybrides permettent dassocier les avantages des mthodes globales et
locales en combinant la dtection de caractristiques gomtriques (ou structurales) avec
lextraction de caractristiques dapparence locales. Elles permettent daugmenter la stabilit
de la performance de reconnaissance lors de changements de pose, dclairement et
dexpressions faciales.
Lanalyse de caractristiques locales (LFA) [23] et les caractristiques extraites par ondelettes
de Gabor (comme lElastic Bunch Graph Matching, EBGM), sont des algorithmes hybrides
typiques.
Plus rcemment, lalgorithme Log Gabor PCA (LG-PCA) [24] effectue une convolution avec
des ondelettes de Gabor orientes autour de certains points caractristiques du visage afin de
crer des vecteurs contenant la localisation et la valeur damplitudes nergtiques locales ; ces
vecteurs sont ensuite envoys dans un algorithme PCA afin de rduire la dimension des
donnes.
I.9. Principales difficults de la reconnaissance de visage
Pour le cerveau humain, le processus de la reconnaissance de visages est une tche
visuelle de haut niveau. Bien que les tres humains puissent dtecter et identifier des visages
dans une scne sans beaucoup de peine, construire un systme automatique qui accomplit de
telles tches reprsente un srieux dfi. Ce dfi est dautant plus grand lorsque les conditions
dacquisition des images sont trs variables. Il existe deux types de variations associes aux
images de visages : inter et intra sujet. La variation inter-sujet est limite cause de la
ressemblance physique entre les individus. Par contre la variation intra-sujet est plus vaste.
Elle peut tre attribue plusieurs facteurs que nous analysons ci-dessous.
1.9.1. Changement dillumination
Lapparence dun visage dans une image varie normment en fonction de
lillumination de la scne lors de la prise de vue (voir figure 11). Les variations dclairage
rendent la tche de reconnaissance de visage trs difficile. En effet, le changement
dapparence dun visage du l'illumination, se rvle parfois plus critique que la diffrence
physique entre les individus, et peut entraner une mauvaise classification des images d'entre.
Ceci a t exprimentalement observ dans Adini et al [25] o les auteurs ont utilis une base
de donnes de 25 individus. L'identification de visage dans un environnement non contrl
reste donc un domaine de recherche ouvert. Les valuations FRVT [26] ont rvl que le
problme de variation d'illumination constitue un dfi majeur pour la reconnaissance faciale.
16
Chapitre I
La biomtrie
Chapitre I
La biomtrie
base causant ainsi une dfaillance du systme de reconnaissance. Par exemple, des lunettes
opaques ne permettent pas de bien distinguer la forme et la couleur des yeux, et une
moustache ou une barbe modifie la forme du visage.
I.9.5. Occultations partielles
Le visage peut tre partiellement masqu par des objets dans la scne, ou par le port
daccessoire tels que lunettes, charpe...etc. Dans le contexte de la biomtrie, les systmes
proposs doivent tre non intrusifs cest--dire quon ne doit pas compter sur une coopration
active du sujet. Par consquent, il est important de savoir reconnatre des visages
partiellement occults. Gross et al [27] ont tudi limpact du port de lunettes de soleil, et du
cache-nez occultant la partie infrieure du visage sur la reconnaissance faciale. Ils ont utilis
la base de donnes AR [28]. Leurs rsultats exprimentaux semblent indiquer que, dans ces
conditions, les performances des algorithmes de reconnaissance restent faibles.
I.10. Evaluation de performance
La performance dun systme didentification peut se mesurer principalement laide
de trois critres : sa prcision, son efficacit (vitesse dexcution) et le volume de donnes qui
doit tre stock pour chaque locuteur. Nous nous concentrerons dans cette section sur le
premier aspect. Comme nous lavons vu prcdemment, lidentification et la vrification sont
des modes opratoires diffrents. Elles ncessitent donc des mesures de prcision diffrentes
que nous tudierons dans les deux sous-sections suivantes.
I.10.1. Evaluation de lidentification
Le taux didentification est la mesure la plus couramment utilise mais il nest pas
toujours suffisant. En effet, en cas derreur, il peut tre utile de savoir si le bon choix se trouve
dans les N premiers. On trace alors le score cumul (cumulative match score) qui reprsente
la probabilit que le bon choix se trouve parmi les N premiers [29].
Dans le cas o il existe plusieurs modles pour chaque individu dans la base de donnes, les
mesures classiques des systmes de recherche dans une base de donnes (database retrieval
system) peuvent tre utilises. La prcision (prcision) est le rapport entre le nombre de
modles correctement retrouvs par le systme dans la base de donnes et le nombre total de
modles retrouvs. Le rappel (recall) est le rapport entre le nombre de modles correctement
retrouvs dans la base de donnes et le nombre total de modles qui auraient d tre
retrouves.
I.10.2. Evaluation de la vrification
Lorsquun systme fonctionne en mode vrification, celui-ci peut faire deux types
derreurs. Il peut rejeter un utilisateur lgitime et dans ce premier cas on parle de faux rejet
(false rejection). Il peut aussi accepter un imposteur et on parle dans ce second cas de fausse
acceptation (false acceptance). La performance dun systme se mesure donc son taux de
faux rejet (False Rejection Rate ou FRR) et son taux de fausse acceptation (False
Acceptance Rate ou FAR).
La vrification est un problme de dcision similaire la dtection dun signal dans le bruit en
thorie de linformation. Il peut tre formul de la manire suivante. Soient H0 lhypothse :
la capture C provient dun imposteur et H1 lhypothse : la capture C provient de
18
Chapitre I
La biomtrie
lutilisateur lgitime. Il faut donc choisir lhypothse la plus probable. On considre que la
capture C provient dun utilisateur lgitime si :
(I.1)
En appliquant la loi de Bayes on obtient :
(I.2)
et donc :
(I.3)
Le taux de vraisemblance
et
qui reprsentent respectivement la probabilit pour quun imposteur
valeurs
ou un utilisateur lgitime essayent daccder au systme sont des valeurs difficile estimer.
Nous avons reprsent sur la (figure.14), la distribution hypothtique des taux de
vraisemblance quobtiendraient les utilisateurs lgitimes et les imposteurs dun systme de
vrification donn. Les FAR et FRR sont reprsents en hachur. Idalement, le systme
devrait avoir des FAR et FRR gaux zro. Comme ce nest jamais le cas en pratique, il faut
choisir un compromis entre FAR et FRR. Plus le seuil de dcision est bas, plus le systme
acceptera dutilisateurs lgitimes mais plus il acceptera aussi dimposteurs. Inversement, plus
le seuil de dcision est lev, plus le systme rejettera dimposteurs mais plus il rejettera
aussi dutilisateurs lgitimes.
Il est donc impossible en faisant varier le seuil de dcision de faire diminuer les deux types
derreurs en mme temps.
19
Chapitre I
La biomtrie
20
Chapitre II
Techniques de dtection et de
reconnaissance de visage
Chapitre II
II.1. Prambule
Dans ce chapitre, nous prsenterons un tat de lart sur les techniques de dtection de
visage et les diffrentes mthodes les plus connues de reconnaissance faciale. Enfin, nous
terminerons le chapitre par une synthse des mthodes et techniques tudies.
II.2. Dtection de visages
La dtection de visages dans limage est un traitement indispensable et crucial avant la
phase de reconnaissance. En effet, le processus de reconnaissance de visages ne pourra jamais
devenir intgralement automatique sil na pas t prcd par une tape de dtection efficace.
Le traitement consiste rechercher dans une image la position des visages et de les extraire
sous la forme dun ensemble dimagettes dans le but de faciliter leur traitement ultrieur.
Selon la dfinition propose dans [30] un visage est considr correctement dtect si la
taille dimagette extraite ne dpasse pas 20% de la taille relle de la rgion faciale, et quelle
contient essentiellement les yeux, le nez et la bouche. Elle sera ensuite affine par un
prtraitement.
II.3. Approches de la dtection de visage
Il existe plusieurs mthodes pour la dtection de visages. Elles peuvent tre subdivises en
quatre diffrents types [30].
II.3.1. Approches bases sur lapparence
Ces approches appliquent gnralement des techniques d'apprentissage automatique.
Ainsi, les modles sont appris partir d'un ensemble d'images reprsentatives de la variabilit
de l'aspect facial. Ces modles sont alors employs pour la dtection. L'ide principale de ces
mthodes est de considrer que le problme de la dtection de visage est un problme de
classification (visage, non-visage). Une des approches les plus connues de dtection de visage
est lEigenface [12]. Elle consiste projeter limage dans un espace et calculer la distance
euclidienne entre limage et sa projection. En effet, en codant limage dans un espace, on
dgrade linformation contenue dans limage, puis on calcule la perte dinformation entre
limage et sa projection. Si cette perte dinformation est grande (value partir de la distance,
que lon compare un seuil fix a priori), limage nest pas correctement reprsente dans
lespace : elle ne contient pas de visage.
Cette mthode donne des rsultats assez encourageants, mais le temps de calcul est trs
important. Dans Rowley et al. [31], les auteurs proposent un systme de dtection de visage
bas sur la classification par des rseaux de neurones. Leur technique est divise en deux
tapes: la localisation des visages en utilisant un rseau de neurones et la vrification des
rsultats obtenus. Les auteurs ont construit un rseau de neurones qui, partir dune image
prtraite de 20x20 pixels, indique sil sagit dun visage ou non. Le prtraitement consiste
galiser lhistogramme. Limage est balaye avec des fentres de 20x20. Pour dtecter les
visages de diffrentes tailles, une analyse multi-rsolutions est effectue. Lextension a aussi
t propose afin de dterminer un rseau de neurones indiquant le degr de rotation dun
visage. Ainsi, le systme est capable de dtecter des visages ayant subi des rotations dans le
plan et de diffrentes chelles. Lun des avantages des rseaux de neurones est leur robustesse
au bruit. Malheureusement, les rseaux de neurones, sont souvent difficiles construire. Leur
structure (nombre de couches caches pour les perceptrons par exemple) influe beaucoup sur
les rsultats et il nexiste pas de mthode pour dterminer automatiquement cette structure.
21
Chapitre II
La phase dapprentissage est difficile mener puisque les exemples doivent tre
correctement choisis (en nombre et en configuration).
II.3.2. Approches bases sur les connaissances acquises
Ces mthodes sont bases sur la dfinition de rgles strictes partir des rapports entre les
caractristiques faciales. Elles sintressent aux parties caractristiques du visage comme le
nez, la bouche et les yeux. Ces mthodes sont conues principalement pour la localisation de
visage. Dans [32], Kotropoulous et Pitas utilisent une mthode base de rgles. Les
caractristiques du visage sont localises laide de la mthode de projection propose par
Kanade [33] pour dtecter les contours dun visage. Soit I(x,y) lintensit de la luminance du
pixel (x,y) de limage m*n, les projections horizontale et verticale de cette image sont dfinies
par lquation suivante :
et
(2.1)
Le profil horizontal de limage originale est calcul en premier. Les deux minimas locaux sont
dtermins, ils correspondent aux bords gauche et droit du visage. Ensuite, le profil vertical est
son tour calcul. Les minima locaux de ce profil vertical correspondent aux positions de la
bouche, du nez et des yeux. Linconvnient de cette mthode est quelle narrive pas dtecter
le visage lorsque ce dernier se trouve sur un arrire-plan complexe. Yang and Huang [34] quant
eux, ont tudi les volutions des caractristiques du visage en fonction de la rsolution.
Quand la rsolution de limage dun visage est rduite progressivement, par souschantillonnage ou par moyenne, les traits macroscopiques du visage disparaissent. Ainsi, pour
une rsolution faible, la rgion du visage devient uniforme. Yang et Huang se sont bass sur
cette observation pour proposer une mthode hirarchique de dtection de visages.
En commenant par les images faible rsolution, un ensemble de candidats de visage est
dtermin laide dun ensemble de rgles permettant de rechercher les rgions uniformes dans
une image. Les candidats de visage sont ensuite vrifis en cherchant lexistence de traits
faciaux prominents grce au calcul des minimas locaux des rsolutions suprieures. Une
caractristique intressante de cette technique descendante de recherche de zone dintrt
(informations globales vers des informations plus dtailles) est de rduire le temps de calcul
ncessaire par lutilisation dimages sous-chantillonnes. Malheureusement, cette technique
occasionne de nombreuses fausses dtections et un taux faible de dtection.
II.3.3 Approches bases sur le Template-matching
Les templates peuvent tre dfinis soit "manuellement", soit paramtrs l'aide de
fonctions. Lide est de calculer la corrlation entre l'image candidate et le template. Ces
mthodes rencontrent encore quelques problmes de robustesse lis aux variations de lumire,
d'chelle, etc. Sinha [35] utilise un ensemble dinvariants dcrivant le modle du visage. Afin
de dterminer les invariants aux changements de luminosit permettant de caractriser les
diffrentes parties du visage (telles que les yeux, les joues, et le front); cet algorithme calcule
ainsi les rapports de luminance entre les rgions du visage et retient les directions de ces
rapports (par exemple, la rgion 1 est-elle plus claire ou plus sombre que la rgion 2). La
figure 16 montre un modle prdfini correspondant 23 relations. Ces relations prdfinies
sont classifies en 11 relations essentielles (flches) et 12 relations confirmations (gris).
Chaque flche reprsente une relation entre deux rgions (figure 16). Une relation est vrifie
si le rapport entre les deux rgions qui lui correspond dpasse un seuil. Le visage est localis si
le nombre de relations essentielles et de confirmation dpasse lui aussi un seuil.
22
Chapitre II
23
Chapitre II
La position des sourcils et leur paisseur peuvent tre trouves par une analyse similaire.
La recherche est une fois encore limite la fentre dintrt, juste au-dessus des yeux, et les
sourcils sont trouvs en utilisant la carte du gradient vertical. Le dtecteur du sourcil cherche
les pairs de pics du gradient ayant des directions opposes.
II.3.4 Approches bases sur des caractristiques invariantes
Ces approches sont utilises principalement pour la localisation de visage. Les
algorithmes dvelopps visent trouver les caractristiques structurales existantes mme si la
pose, le point de vue ou la condition d'clairage changent. Puis ils emploient ces
caractristiques invariables pour localiser les visages. Nous pouvons citer deux familles de
mthodes appartenant cette approche : Les mthodes bases sur la couleur de la peau et les
mthodes bases sur les caractristiques de visage quon dtaillera ci-dessous.
II.3.4.1 Mthodes bases sur les caractristiques du visage
En gnral ces algorithmes utilisent tout dabord une hypothse sur la position du haut
du visage ensuite lalgorithme de recherche parcourt le visage de haut en bas afin de trouver
laxe des yeux caractris par une augmentation soudaine de la densit de contours (mesure
par le rapport noir/blanc le long des plans horizontaux). La longueur entre le haut du visage et
le plan de l'il est alors utilise comme une longueur de rfrence pour construire un
template facial flexible. Ce template couvrant des caractristiques telles que les yeux et la
bouche est initialis partir de limage dentre. La forme initiale du template est obtenue
en utilisant la longueur anthropomtrique en respectant la longueur de rfrence.
Le template flexible est alors ajust par rapport aux positions finales des caractristiques
en utilisant un algorithme de rglage fin qui emploie une fonction de cot base contour.
Bien que ces algorithmes russissent dtecter les caractristiques dethnies diffrentes
puisquils ne se basent pas sur les informations de niveaux de gris et de couleur, ils narrivent
pas cependant dtecter correctement ces caractristiques si l'image du visage contient des
lunettes ou bien si les cheveux couvrent le front.
II.3.4.2. Mthodes bases sur lanalyse de la couleur de la peau
Les mthodes de dtection bases sur lanalyse de la couleur de la peau sont des
mthodes efficaces et rapides. Elles rduisent l'espace de recherche de la rgion visage dans
limage. De plus, la couleur de la peau est une information robuste face aux rotations, aux
changements dchelle et aux occultations partielles. Plusieurs espaces couleur peuvent tre
utiliss pour dtecter, dans l'image, les pixels qui ont la couleur de la peau. L'efficacit de la
dtection dpend essentiellement de l'espace couleur choisi. Les espaces couleur les plus
utiliss sont :
Lespace RVB, mis au point en 1931 par la Commission Internationale de l'Eclairage
(CIE). Il consiste reprsenter l'espace des couleurs partir de trois rayonnements
monochromatiques de couleurs : Rouge-Vert-Bleu. Cet espace correspond la faon
dont les couleurs sont gnralement codes informatiquement, ou plus exactement la
manire dont les crans tubes cathodiques (ordinateurs, TV) reprsentent ces couleurs.
Lespace HSL (Hue, Saturation, Luminance), appel aussi TSL (Teinte, Saturation,
Luminance) en Franais, s'appuie sur les travaux du peintre Albert H. Munsell. Cest un
modle de reprsentation dit "naturel", car il est proche de la perception physiologique
de la couleur par lil humain. En effet, le modle RGB aussi adapt soit-il pour la
24
Chapitre II
Chapitre II
Le visage doit donc tre extrait partir de limage et une transformation gomtrique, pour
obtenir une taille fixe, est applique. Lapproche standard consiste dfinir lemplacement des
centres des yeux dans une position constante au sein de limage de sortie.
Ltape de normalisation photomtrique tente dliminer ou de rduire les effets de
lillumination de limage.
II.4.1 Normalisation Photomtrique :
Dans le domaine de la reconnaissance par le visage, un certain nombre de mthodes de
normalisation de l'illumination ont t prsentes. Ces mthodes peuvent tre classes en deux
grandes catgories : les mthodes bases sur la modification de la dynamique et des mthodes
bases sur l'estimation de la rflectance de l'image. Les quatre normalisations prsentes cidessous sont les plus utilises dans la reconnaissance du visage et font partie de ces deux
catgories.
Il s'agit de :
L'galisation d'histogramme : Le but de cette normalisation est de rpartir uniformment
les niveaux de gris de l'image afin d'amliorer son contraste.
La correction Gamma : cette normalisation permet de rduire l'cart entre les zones
sombres et claires du visage par une transformation non linaire des niveaux de gris.
Le MultiScale-Retinex [94] : L'objectif de cette mthode est d'estimer la partie luminance
de l'image pour en dduire la rflectance.
Le lissage anisotropique [26] : cette approche estime aussi la luminance de l'image mais en
se basant sur l'anisotropie de la rflectance.
Nous avons opt pour la mthode de lgalisation dhistogramme qui a amlior le taux
didentification de notre systme de reconnaissance.
galisation d'histogramme
Cette normalisation appartient la catgorie des mthodes bases sur l'amlioration de la
dynamique de l'image. Le but de l'galisation est d'harmoniser la rpartition des niveaux de gris
de l'image. Elle permet de tendre vers un mme nombre de pixels pour chacun des niveaux de
l'histogramme. Cette opration vise augmenter les nuances dans l'image et donc son contraste
(Figure18).
Plus concrtement, si ni est le nombre de pixels un niveau i de gris, la probabilit qu'un pixel x
de l'image ait un niveau i est :
(2.2)
avec n le nombre total des pixels de l'image et L le nombre des niveaux de gris. La probabilit P
reprsente dans ce cas l'histogramme de l'image normalise [0; 1]. Soit c la distribution
cumulative de l'histogramme normalis P, elle est donne par
(2.3)
L'ide est de trouver une transformation y = T(x) qui, pour chaque niveau x de l'image, produira
un niveau y de telle faon que la distribution cumulative des diffrents niveaux de l'image
transforme soit linaire. Cette fonction est dfinie par :
(2.4)
avec L le niveau maximal de gris.
26
Chapitre II
Histogramme galise
27
Chapitre II
28
Chapitre II
Elle est utilise pour reprsenter efficacement les images de visages, qui peuvent tre
approximativement reconstruites partir dun petit ensemble de poids et dune image de visage
standard.
Ces poids sont obtenus en projetant limage dans un espace de visage engendr par les
visages propres (Eigenfaces). Ainsi au lieu de stocker un vecteur image de taille Rsolution R,
on stocke un vecteur de taille N
nombre dimage dapprentissage M << R. Dans lapproche
ACP, la normalisation dclairage est toujours indispensable [38]. Les visages propres sont des
images de la mme taille que les images dapprentissage et qui montrent des visages ayant un
aspect fantomatique. Mathmatiquement, elles sont les composantes principales de la
distribution des visages, ou les vecteurs propres (Eigenvectors) de la matrice de covariance de
lensemble des images de visage. Chaque image de visage de lensemble dapprentissage peut
tre exactement reprsente en termes de combinaison linaire des Eigenfaces et du visage
moyen [39].
Le nombre possible dEigenfaces est gal au nombre dimages de visage dans lensemble
dapprentissage. Nanmoins les visages peuvent tre approxims, en utilisant seulement les
meilleurs Eigenfaces (ayant les plus larges valeurs propres qui reprsentent en fait, la plupart de
variance dans l'ensemble d'images de visage) qui dfinissent le Low Dimensional Space,
permettant ainsi de diminuer les calculs. Dans le cas o on ne prend que les N (N < M) grandes
valeurs propres (Eigenvalues) et les vecteurs propres qui leurs sont associs, on rduit encore
plus la mmoire de stockage et le temps de calcul, mais on rduit aussi les performances d la
ngligence dune partie de linformation. Cest pour cela quon a pris dans notre application
N= M, bnficiant la fois dune rduction de lespace (R M) acceptable, et aussi en ayant la
totalit de linformation, garantissant ainsi les performances optimales. Une variante de lACP,
plus utilise dans la communaut du traitement du signal est connue sous le nom de transforme
de Karhunen-Love [40]. LACP est une technique rapide, simple et populaire dans
l'identification de modle, cest lune des meilleures techniques. Les projections de lACP sont
optimales pour la reconstruction d'une base de dimension rduite. Cependant, lACP n'est pas
optimise pour la sparabilit (discrimination) de classe. Une alternative qui est l'analyse
discriminante linaire LDA tient compte de ceci.
II.5.2.2. Le processus de reconnaissance (Karhunen-Loeve)
Au dbut de la phase dapprentissage, on fait lacquisition, la lecture et la normalisation
des images d'apprentissage (de taille R). Puis on calcule le visage moyen de ces images. On
soustrait ensuite le visage moyen de chaque image dapprentissage normalise (ces nouvelles
images reprsentent les colonnes dune matrice S). On fait le calcul de la matrice de covariance
qui est dfinie par la formule L=S'*S. On calcule ensuite les vecteurs propres V et les valeurs
propres D de la matrice L. Puis on passe ltape de calcul des visages propres selon la formule
U = S * V * (abs (D)) ^ -0.5. Et finalement on calcule les poids des visages de la base (de taille
M) en les projetant dans le sous-espace engendr par les visages propres Face Space.
Pendant la phase de vrification, on fait lacquisition, la lecture et la normalisation de
limage de vrification (de taille R). Puis on soustrait le visage moyen (calcul auparavant lors
de la phase dapprentissage) de limage de vrification normalise. Ensuite on calcule le poids
de limage (de taille M) en utilisation les visages propres comme une base de projection. Et
finalement on utilise la distance euclidienne comme une mesure de similarit [41].
29
Chapitre II
Figure 20 : Illustration du principe de sparation optimale des classes par le LDA. Trois
distributions 3D sont projetes sur deux sous-espaces 2D dcris par les vecteurs W1 et W2. Puisque le
LDA essaye de trouver la plus grande sparation parmi les classes, on voit bien que W1 est ici le vecteur
optimal
Chaque visage, qui se compose d'un grand nombre de Pixel, est rduit un plus petit
ensemble de combinaisons linaires avant la classification
Chacune des nouvelles dimensions est une combinaison linaire des valeurs de pixel, qui
forment un template. Les combinaisons linaires obtenues en utilisant FLD s'appellent les
Fisherfaces, en analogie avec les Eigenfaces [42]. LDA est une technique qui cherche les
directions qui sont efficaces pour la discrimination entre les donnes.
30
Chapitre II
LDA est plutt connue pour sa maximisation de l'parpillement dinter-classe the between-class
scatter et sa rduction au minimum de l'parpillement dintra-classe the within-class scatter,
qui se manifeste par le groupement des vecteurs de poids de la mme classe (faible distance
entre ces vecteurs), et par la sparation des vecteurs de poids de classes diffrentes (grande
distance entre ces vecteurs) [43].
II.5.4. DF-LDA
La plupart des mthodes traditionnelles bases sur LDA, souffrent de l'inconvnient que
leurs critres d'optimalit ne sont pas directement lis aux capacits de classification de la
reprsentation obtenue des caractristiques.
D'ailleurs, leur exactitude de classification est affecte par le problme de la petite
dimension de l'chantillon ( SSS , small sample size) qui est souvent rencontr en
reconnaissance de visages. Lalgorithme de DF-LDA DIRECT FRACTIONAL-STEP LDA
traite ces deux imperfections d'une faon efficace et rentable, offrant des performances
suprieures celles des techniques de reconnaissance de visages classiques.
Lalgorithme de DF-LDA est reprsent comme suit [44]:
Lacquisition et la lecture des images d'apprentissage
(2.5)
31
Chapitre II
(2.6)
(2.9)
avec,
(2.10)
(2.11)
Chapitre II
33
Chapitre II
La reprsentation dICA est constitue des coefficients b de la combinaison linaire des images
de base U qui forment chaque image de visage. Le nombre de composantes indpendantes
extraites par lalgorithme dICA est gal la dimension de lentre [45] (le nombre dimages
dapprentissage), et si on veut contrler ce nombre, au lieu dexcuter ICA sur les n images
originales, on lexcute sur un ensemble de m combinaisons linaires de ces images, o m < n.
Communment, on choisit pour ces combinaisons linaires un sous ensemble form des
premires composantes principales de la matrice de donne, ainsi lexcution dICA sur
lensemble de ces m composantes principales produit m images sources Ui statistiquement
indpendantes.
Dans cette premire architecture dICA, les images de base Ui sont statistiquement
indpendantes, mais les coefficients bi ne le sont pas. Au lieu de sparer les images de visages
en ensembles dimages indpendantes, il existe une deuxime architecture dICA, dans laquelle
les coefficients sont statistiquement indpendants, en sparant les pixels en un ensemble de
variables indpendantes codant les images.
Figure 24 : Les deux architectures dICA : larchitecture 1 pour trouver des images de base
statistiquement indpendantes (la sparation des images de visages produit des images composantes
indpendantes), et larchitecture 2 pour trouver un code factoriel (la sparation des pixels produit un code
factoriel)
Dans larchitecture 2 dICA, chaque image de lensemble de donnes est considre comme
tant cre partir dun ensemble dimages de base en A, et dun vecteur de causes dimages
image causes fondamentales statistiquement indpendantes en S. Lalgorithme dICA essaye
dinverser les images de base en trouvant un ensemble de filtres Wi qui produisent des sorties
statistiquement indpendantes.
34
Chapitre II
35
Chapitre II
36
Chapitre II
37
Chapitre II
(2.14)
On sintresse aussi aux hyperplans parallles lhyperplan optimal qui sont tangents aux
vecteurs de support des classes, et qui sont dcrits par les quations : w.x-b = 1 et w.x-b = -1. On
veut que ces hyperplans maximisent la distance avec l'hyperplan de division et quil n'y ait
aucun point de donnes entre les deux. En employant la gomtrie, on trouve que la distance
entre les hyperplans est 2 / |w|, ainsi le but est de rduire au minimum |w|.
Pour exclure les points de donnes, on doit sassurer que pour chaque i on a w.xi b 1
ou w.xi b -1, ou sous une autre quation ci(w. xi b) 1 avec 1 i p. Le problme
maintenant est de minimiser |w| sous cette dernire contrainte, ceci est un problme
doptimisation de programme quadratique QP). Il existe plusieurs algorithmes spcialiss pour
rsoudre rapidement les problmes QP et la mthode la plus commune est l'algorithme SMO.
Aprs lapprentissage, la SVM peut classifier les nouvelles donnes (donnes de test) en
utilisant la rgle de dcision suivante :
(2.15)
On peut constater daprs la rgle de classification quelle est seulement en fonction des vecteurs
de supports (les donnes dapprentissage se trouvant sur la marge) [49].
38
Chapitre II
(2.16)
(2.17)
avec > 0,
(2.18)
(2.19)
la fonction sigmode:
(2.20)
39
Chapitre II
Pour une image de visage dune personne donne de l'ensemble dapprentissage, le but
de l'tape dapprentissage est doptimiser les paramtres pour mieux dcrire l'observation. La
reconnaissance est effectue en assortissant l'image de test contre chaque modle
dapprentissage (chaque HMM reprsente une personne diffrente). Et dans la fin de cette
procdure, l'image est convertie en une squence d'observation et la probabilit est calcule pour
chaque modle enregistr.
Le modle avec la probabilit la plus leve indique l'identit de la personne inconnue
[46] [39]. Lapproche HMM a des performances de reconnaissance satisfaisantes, cependant il
ncessite des calculs intenses ce qui augmente les temps dexcution.
II.5.9. Mthodes bases sur lapparence locale (Local appearance-based methods)
Ces techniques sont utilises de manire modulaire pour les diffrentes rgions
faciales. Un modle global est alors dfini partir de la combinaison des diffrents modles
locaux. Ainsi, les diffrentes rgions faciales ne seront plus affectes de la mme manire par
les diffrentes sources de variabilit. Par exemple, le port de lunettes de soleil change
considrablement laspect des yeux, tandis quun sourire affecte plus la rgion de la bouche.
Deux paramtres sont utiliss pour dfinir les rgions locales du visage : la forme
(rectangle, ellipse) et la taille. Les caractristiques des rgions locales sont dtermines partir
dune analyse des valeurs de niveau gris [54]. Des techniques comme les Ondelettes de Gabor
[55] ou de Harr [56] et lanalyse fractale sont aussi utilises pour lextraction de
caractristiques. En gnral, les caractristiques base de valeurs de gris prservent
l'information de texture, tandis que les caractristiques de Gabor sont plus robustes face aux
changements dillumination et aux transformations gomtriques [55].
II.5.9.1. ACP modulaire
Dans [12], Pentland et al. ont introduit lapproche des Modular Eigenspase .
Les rgions faciales utilises sont: la totalit du visage, les yeux et le nez. Une ACP est
applique sur chacune de ces rgions et les rsultats de classifications obtenus sont agrgs. La
bouche tant trop sensible des changements dexpression faciale, sa prise en compte engendre
une baisse du taux de reconnaissance. Cette approche peut tre qualifie dhybride, puisquelle
utilise la fois des caractristiques globales et locales.
Les auteurs ont montr quelle est plus efficace que les techniques globales ou
strictement locales appliques sparment.
II.5.10. Template matching
Le template matching est une technique globale de reconnaissance de visage. La
corrlation est gnralement exploite pour mesurer la similitude entre un template (masque)
stock et l'image reconnatre. Les templates devraient tre dlibrment conus pour couvrir la
varit de variations possibles d'image. Pendant la recherche dans l'image, lchelle et la rotation
devraient galement tre soigneusement considres pour acclrer le processus. Cette technique
a aussi t exploite pour localiser les caractristiques saillantes salient features comme les
yeux le nez et la bouche, dans une image de visage. Daffines transformations ont t introduites
dans le processus de reconnaissance, lors de changement de pose [50].
40
Chapitre II
41
Chapitre III
Reconnaissance par
Eigenface
Chapitre III
III.1. Prambule
La reconnaissance du visage a atteint un haut niveau de performances, mme avec
lutilisation dun seul exemple dapprentissage. Dans les conditions actuelles des travaux sur
la reconnaissance faciale, le systme visuel humain reste encore le plus robuste face aux
diverses variations pouvant altrer le processus didentification : changement des conditions
d'clairage, variations de lexpression faciale, modifications de lapparence du visage
travers la prsence ou labsence de lunettes, barbe, maquillage.
De nombreuses techniques ont t dveloppes ces dernires annes, nous avons
passes en revue les plus connues dans le chapitre deux. Parmi elles, Eigenface, qui est une
technique particulirement prise par les chercheurs de la communaut de la biomtrie.
Nous commencerons dabord par dtailler le principe de la mthode Eigenface, puis
nous prsenterons les bases de donnes sur lesquelles les tests ont t effectus et nous
suggrerons quelques tapes pour amliorer cette mthode, en fin nous terminerons par une
discussion.
III.2. Prsentation de la mthode Eigenface
Lalgorithme ACP, PCA en anglais (Principal Component Analysis) est n des travaux
de MA. Turk et AP. Pentland au MIT Media Lab, en 1991. Il est aussi connu sous le nom de
Eigenfaces car il utilise des vecteurs propres et des valeurs propres. Cet algorithme sappuie
sur des proprits statistiques bien connues et utilise lalgbre linaire. Il est relativement
rapide mettre en uvre mais il est sensibles aux problmes dclairement [12], de pose et
dexpression faciale. Il est la base de nombreux algorithmes globaux actuels.
Lide principale consiste exprimer les M images dapprentissage selon une base de
vecteurs orthogonaux particuliers, contenant des informations indpendantes dun vecteur
lautre. Ces nouvelles donnes sont donc exprimes dune manire plus approprie la
reconnaissance du visage.
Nous voulons extraire linformation caractristique dune image de visage, pour
lencoder aussi efficacement que possible afin de la comparer une base de donnes de
modles encods de manire similaire. En termes mathmatiques, cela revient trouver les
vecteurs propres de la matrice de covariance forme par les diffrentes images de notre base
dapprentissage [39].
Une image Ii (m, n) est traite comme un vecteur i (mn, 1) dans un espace vectoriel
de grande dimension (N = mn), par concatnation des colonnes.
Aprs avoir rassembl nos M images dans une unique matrice, nous obtenons une
matrice dimages , o chaque colonne reprsente une image i:
42
Chapitre III
Limage moyenne est alors soustraite de chaque image avec la formule suivante:
,
i = 1...M
(3.2)
On calcule ensuite la matrice de covariance du jeu de donnes. Cette matrice peut tre vue
comme une matrice de moments dordre 2 :
(3.3)
La prochaine tape consiste calculer les vecteurs propres et les valeurs propres de cette
matrice de covariance C de taille (N N), cest--dire de lordre de la rsolution dune image.
Le problme est que cela peut parfois tre trs difficile et trs long.
En effet, si N > M (si la rsolution est suprieure au nombre dimages), il y aura
seulement M 1 vecteurs propres qui contiendront de linformation [40] (les vecteurs propres
restants auront des valeurs propres associes nulles).
43
Chapitre III
Par exemple, pour 50 images de rsolution 180 200, nous pourrions rsoudre une
matrice L de 50 50 au lieu dune matrice de 36000 36000 pour ensuite prendre les
combinaisons linaires appropries des images i. Le gain de temps de calcul serait
considrable, nous passerions dune complexit de lordre du nombre de pixels dans une
image celle de lordre du nombre dimages.
Les tapes du processus qui nous permettent dacclrer les calculs sont dcrites ci-dessous :
Considrons les vecteurs propres ei de
On a:
(3.4)
Les vecteurs propres vi de
Soit:
(3.5)
En multipliant gauche par A des deux cts de lgalit, nous obtenons :
Puisque
De (3.4) et (3.5), nous voyons que Avi et i sont respectivement les vecteurs propres et
les valeurs propres de C :
(3.7)
Nous pouvons donc trouver les valeurs propres de cette norme matrice C en trouvant
les valeurs propres dune matrice L beaucoup plus petite. Pour trouver les vecteurs propres de
C, il suffit juste de multiplier les vecteurs propres de L par la matrice A.
Les vecteurs propres trouvs sont ensuite ordonns selon leurs valeurs propres
correspondantes, de manire dcroissante. Plus une valeur propre est grande, plus la variance
capture par le vecteur propre est importante. Cela implique que la majeure partie des
informations est contenue dans les premiers vecteurs propres.
III.2.1. Choix du nombre de vecteurs propres
Ltape suivante consiste ne slectionner que les k meilleurs vecteurs propres
(ceux avec les k plus grandes valeurs propres).
44
Chapitre III
Le nombre de vecteurs propres associs aux plus grandes valeurs propres retenir est
un grand dfaut de cette technique. Pour le choisir, les chercheurs ont adopt diffrentes
solutions:
Pour un ensemble de 115 images, Sirovitch et Kirby ont trouv que 40 eigenpictures
sont suffisantes pour reprsenter efficacement cet ensemble,
Turk et Pentland [12] l'ont choisi heuristiquement. Pour leurs tests, sur une base de 16
individus, 7 vecteurs propres ont t retenus,
Moghaddam [15] a prserv, pour comparer diffrentes approches de reconnaissance
de visages 20 vecteurs propres en justifiant son choix par une erreur de reconstruction
raisonnable (0.0012) et un taux de reconnaissance 80% obtenu par eigenfaces sur une
base de 1829 images,
Zhao et al ont retenu 300 vecteurs propres pour une base de 1038 images aprs avoir
observ que pour un nombre trs lev, les eigenfaces ne reprsentent pas des visages,
donc leur choix tait bas sur l'allure des eigenfaces au lieu des valeurs propres.
Pratiquement, le choix de k peut se faire soit en fixant un certain pourcentage D tel que:
(3.8)
avec n le nombre total des valeurs propres ou on se basant sur le fait que la ime valeur propre
est gale la variance le long de la ime composante principale et on cherche, donc k le
long du spectre des valeurs propres juste avant quil s'annule [12].
45
Chapitre III
Son choix dpend des contraintes d'application lies au temps de calcul et au nombre
des images de visages disponibles et aussi de la qualit des images de visages reconstruites.
A partir de l, on dfinit un espace vectoriel engendr par ces k vecteurs propres, que
lon appelle lespace des visages Ev (Face Space). Les images originales peuvent tre
reconstitues par combinaison linaire de ces vecteurs propres. Les reprsentations graphiques
de ces vecteurs rappellent un peu des images fantmes, chacune mettant en avant une partie
du visage, on les appelle Eigenfaces (figure 31).
k = 1, ..., M
(3.9)
Les vecteurs k sont appels poids et forment une matrice [5] T = [ 1, 2, ..., M0] qui dcrit
la contribution de chaque eigenface dans la reprsentation de limage dentre. La matrice T
est alors utilise pour trouver quelle est, parmi un nombre prdfini de classes, celle qui dcrit
le mieux une image dentre.
La mthode la plus simple pour dterminer quelle classe de visage fournit la meilleure
description dune image dentre est de trouver la classe de visage k qui minimise la distance
Euclidienne.
(3.10)
O
Un visage appartient une classe k quand le minimum k est en dessous dun certain
seuil . Dans le cas contraire, le visage est class comme tant inconnu et peut
ventuellement tre utilis pour crer une nouvelle classe de visage.
46
Chapitre III
Il y a alors, quatre possibilits (figure 32) pour une image dentre dtre reconnue ou non :
3
2
1
e2
3
1
e1
Chapitre III
(3.11)
Nous allons prsenter quelques mesures de distance dans lespace original des images puis
dans lespace de Mahalanobis.
III.3.1. Distances Euclidiennes
III.3.1.1 Distance City Block (L1)
Pour p = 1, on obtient la distance City-Block (ou distance de Manhattan) :
(3.12)
III.3.1.2 Distance Euclidienne (L2)
Pour p = 2, on obtient la distance euclidienne :
(3.13)
48
Chapitre III
Les objets peuvent alors apparatre de faons trs diffrentes selon la mesure de distance
choisie (Figure 33).
En sortie de lalgorithme PCA, nous obtenons des vecteurs propres associs des valeurs
propres (reprsentant la variance selon chaque dimension). Ces vecteurs propres dfinissent
une rotation vers un espace dont la covariance entre les diffrentes dimensions est nulle.
Lespace de Mahalanobis est un espace o la variance selon chaque dimension est gale 1.
On lobtient partir de lespace des images I m en divisant chaque vecteur propre par son
cart-type correspondant.
Soit u et v deux vecteurs propres de Im, issus de lalgorithme PCA, et m et n deux vecteurs de
. Soit
dfinit i =
suivantes :
i
i.
lcart-type, alors on
et
(3.14)
49
Chapitre III
(3.15)
III.3.2.3. Mahalanobis L2 (MahL2)
Cette distance est identique la distance euclidienne part quelle est calcule dans lespace
de Mahalanobis. Ainsi, pour des vecteurs propres u et v de projections respectives m et n sur
lespace de Mahalanobis, la distance Mahalanobis L2 est dnie par :
(3.16)
Par dfaut, lorsquon parle de distance de Mahalanobis, cest cette distance que lon doit se
rfrer.
III.3.2.4. Cosinus de Mahalanobis (MahCosine)
Il sagit tout simplement du cosinus de langle entre les vecteurs u et v, une fois quils ont t
projets sur
(3.18)
50
Chapitre III
(3.19)
51
Chapitre III
Debut
Slection de la base dapprentissage
- dfinir le chemin : TrainFiles = dir()
im(i) = imread(i)
Boucle
(i) de 1
M
M nbr images
Im(i)= Rgb2gray(i)
Im(i)=Imresize(i)
-
Im(i)=histeq(i)
Fin
Figure 35 : prtraitements
52
Chapitre III
image de visage
lieu de
calculs
de
de
= [ 1,
k = 1, ..., M
2,
...,
M]
Fin de lapprentissage
au
Chapitre III
Dbut
Acquisition de la nouvelle image identifier X
Prtraitements
-
NON
OUI
Min
Seuil
Personne identifie
Individu inconnu
Affichage du rsultat
FIN
Figure 37 : phase didentification
54
Chapitre III
55
Chapitre III
III.5.3. MUCT
La base de donnes de MUCT se compose de 3755 en couleur [58]. Elles ont t rassembles
en photographiant 345 sujets de divers angles. La base de donnes a t cre pour fournir
plus de diversit d'clairage, d'ge, et d'appartenance ethnique, aussi pour dvelopper, tester et
valuer des algorithmes de reconnaissance de visages. Les images couleurs ont une rsolution
: 512 x 768, en format JPG. Quelques exemples sont montrs dans la figure 39.
56
Chapitre III
III.6. Discussion
Ce chapitre a t consacr en premier lieu la prsentation de la mthode de reconnaissance
faciale choisie qui est Eigenface , de la structure des bases de donnes de visage et ensuite,
nous avons dcrit les diffrentes tapes de limplmentation du systme.
Dans le chapitre suivant, nous testerons le systme dans son environnement afin dvaluer ses
performances pour en dduire les paramtres optimaux qui garantissent une meilleure
efficacit du systme. Enfin, nous proposerons quelques procdures pour amliorer les
performances de notre systme.
57
Chapitre IV
Tests et rsultats
Chapitre IV
Tests et rsultats
IV.1. Preambule
Ce chapitre reprsente les resultats des tests effectus avec la mthode des Eigenface sur
les bases de donnes dcritent dans le chapitre prcdent. Rappelons que notre travail consiste
concevoir un systme didentification biomtrique de personnes par reconnaissance faciale se
basant sur une analyse en composante principale qui peut tre utilise pour simplifier un
ensemble de donnes, en rduisant sa dimention. Plusieurs tapes sont ncessaires, ltape
dextraction des caractristiques est la plus importante car les performances du systme en
dpendent (rsultats et robustesse, un temps de latence acceptable pour des applications
temps rel ). Nous valuerons dans ce chapitre les resultats obtenus sur plusieurs bases de
donnes sous diffrentes conditions et attributs de la mthodes.
IV.2 Environnement du travail
Dans cette section, nous prsenterons les environnements matriel et logiciel de notre travail.
IV.2.1 Environnement matriel
Afin de mener bien ce projet, il a t mis notre disposition un ensemble de matriels dont les
caractristiques sont les suivantes :
Un ordinateur FUJITSU avec les caractristiques suivantes :
2.17Ghz
58
Chapitre IV
Tests et rsultats
limage, visage propre). Ces oprations sont effectues sur les bases de donnes dcritent dans
le chapitre prcdent.
2
3
1
4
5
8
Chapitre IV
Tests et rsultats
5- Static text : nous informe sur le nombre dimages de visage se trouvant dans la base de
donnes ;
6- Axe 1 : affiche divers images de visages dont :
Limage de visage identifier ;
Limage de visage reconstruite ;
Limage moyenne de la base de donnes.
7- Axe 2 : affichage du rsultat de la reconnaissance ;
8- Axe 3 : zone o saffichent les diffrentes distances euclidiennes entre la projection du
visage identifier et les visages de la base de donnes.
60
Chapitre IV
Tests et rsultats
Un chiffre apparait dans le static text (voir figure 47) qui nous informe du nombre dimages
existantes dans la base de donnes.
2. pour slectionner limage de visage de la personne identifier, il faut cliquer sur le bouton
select image (voir figure 45), il permet douvrir une fentre pour parcourir le disque et choisir
limage du visage identifier.
3. lancer lalgorithme Eigenface en appuyant sur le bouton Recognition du panel Eigenface
(voir figure 43), il apparaitra un visage dans lAxe 2 qui sera le plus ressemblant (qui aura la
plus petite distance euclidienne). Les distances euclidiennes entre la projection du visage
identifier dans un sous espace vectoriel et celles de la base de donnes seront affiches dans
lAxe 3 (voir figure 4.8).
61
Chapitre IV
Tests et rsultats
62
Chapitre IV
Tests et rsultats
6. pour lancer lalgorithme Fisherface aprs avoir choisi limage du visage identifier comme
dcrit dans ltape 1, cliquez sur le bouton recognition du panel Fisherface et une fentre
apparaitra (voir figure 4.10) qui nous permettra de choisir le nombre de classe par personne
existante dans la base de donnes, puis cliquer OK pour que lalgorithme poursuive son
excution jusqu ce quune image saffiche sur lAxe 2 qui sera la plus proche (qui aura la plus
petite distance euclidienne).
Chapitre IV
Tests et rsultats
4- Calcul de la matrice
5- Calcul des vecteurs propres de C et les tris dans un ordre descendant selon les valeurs
propres associes.
6- Calcul des vecteurs propres de la matrice de covariance C et obtention des visages
propres en multipliant les vecteurs propres de C par la matrice A.
7- Choix des K meilleurs valeurs propres et les vecteurs propres associs.
8- Dtermination du poids des images dentre en projetant chaque image dans lespace
visage.
9- Chaque visage est maintenant reprsent par un vecteur qui est utilis pour reconstruire
les images. Et enfin sauvegarde des calculs du visage moyen, des eigenfaces et du
poids des images.
IV.5.2. Phase didentification :
Prtraitement de limage dentre et soustraction du visage moyen.
Dtermination du poids de limage dentre par la projection de celleci dans lespace
visage en multipliant le vecteur rsultant de ltape (1) par les eigenfaces de la base de
donnes.
Rcupration du vecteur le plus proche au sens de la distance utilise (euclidienne,
Manhattan).
Affichage du rsultat (identit trouve).
Phase didentification :
Calcul des distances entre le vecteur identifier
et les modles des individus
64
Chapitre IV
Tests et rsultats
Chapitre IV
Tests et rsultats
Figure 53:Graphe des taux du bon seuillage des inconnus et des taux de la bonne classification
des sujets connus en fonction de la valeur du seuil
Pour les tests on a utilis deux bases de donnes base, FEI et MUCT. On a pris 100 images
dapprentissage (20 personnes, avec 5 photos par personne), 60 images de test (20 personnes,
avec 3 photos par personne), et 60 images dinconnus (20 personnes, avec 3 photos par
personne) de la base FEI et on a pris la mme rpartition pour la base MUCT.
Les figures ci-dessous reprsentent les diffrents ensembles dimages utiliss et les
graphes les rsultats des tests effectus sur la base MUCT
Chapitre IV
Tests et rsultats
Figure 55 : Lensemble des images de test de la base MUCT utilises pour la dtermination
dun seuil pour llimination des personnes inconnues
Figure 56 : Lensemble des images des inconnus de la base MUCT utilises pour la
dtermination dun seuil pour llimination des personnes inconnues
67
Chapitre IV
Tests et rsultats
68
Chapitre IV
Tests et rsultats
Figure 59 : Lensemble des images de test de la base FEI utilises pour la dtermination dun
seuil pour llimination des personnes inconnues
Figure 60 : Lensemble des images des inconnus de la base FEI utilises pour la
dtermination dun seuil pour llimination des personnes inconnues
69
Chapitre IV
Tests et rsultats
70
Chapitre IV
Tests et rsultats
Et voici les graphes relatifs aux deux bases de donnes AT&T et CVRP
71
Chapitre IV
Tests et rsultats
Identification simple
83,7%
80,4%
Chapitre IV
Tests et rsultats
Sans prtraitements
83,2%
85,7%
Avec prtraitements
92,4%
90,1%
Chapitre IV
Tests et rsultats
Le tableau 4.3 montre les rsultats du taux didentification obtenus pour les diffrentes valeurs
de rsolution ainsi que les temps de calcul. Nous remarquons quune diminution de la
rsolution, dans certain cas, nengendre pas une baisse significative du taux didentification.
Nous constatons aussi que le taux didentification le plus lev correspond une rsolution de
300x400. Nous avons donc choisi de prendre une rsolution de 200x250 pour avoir un meilleur
compromis entre temps de calcul et prcision.
25x50
50x100
100x150
200x250
300x400
Taux
didentification
52%
72%
85%
90%
92%
Temps
dexcution
57s
93s
230
510s
1200s
Tableau 3 : Les rsultats des EER, lintervalle de confiance 90% associ et le temps excution
Sans prtraitements
Taux identifi
Temps execut
82,3%
406s
80,7%
390s
Avec prtraitements
Taux identifi
Temps execut
89,1%
492s
90,6%
480s
Chapitre IV
Tests et rsultats
75
Chapitre IV
Tests et rsultats
Les conditions dclairage devraient tre tout fait semblables sinon identiques, la fois dans la
phase dapprentissage et la phase de reconnaissance.
Dans beaucoup de cas, des tubes fluorescents placs gauche et droite de l'appareil photo,
fournissent une illumination approprie.
IV.10. Avantages et inconvnients du systme :
Dans ce chapitre, nous avons dcrit les tapes de la conception du systme de reconnaissance,
et linterface dveloppe pour lui. En vue de ce qui a t fait dans la conception et la ralisation,
on peut dgager plusieurs avantages :
Systme trs interactif :
Cest un systme trs interactif. En effet, en plus du fait quil permette lidentification
dindividus avec de bons taux, il permet aussi de voir la reconstruction du visage aprs sa
projection dans un sous espace vectoriel, le visage moyen, que la distance entre le vecteur
projet ainsi quil nous informe sur le nombre dimages de la base de donne
Systme performant :
Le systme est performant car les taux de reconnaissance sont bons.
Interface simple et rapide :
Cest une interface que toute personne ayant peu de connaissances sur la biomtrie peut utiliser.
Nanmoins, ce systme prsente quelques faiblesses, entre autres :
Processus de normalisation long :
Cet inconvnient est d aux prtraitements qui sont appliqus sur toutes les images de la base de
donnes pour rduire limpact nfaste du milieu extrieur sur le systme en appliquant un
redimensionnement et une galisation de lhistogramme sur les images.
Absence dun systme dacquisition des images :
Faute de la disponibilit dun systme dacquisition, les seules donnes utilises par le systme
proviennent des bases. Cela rend les oprations didentification une simple simulation.
Liaison du systme lenvironnement :
Lemplacement des donnes biomtriques utilises par le systme le rend dpendant de
lenvironnement dans lequel le systme sexcute.
76
Chapitre IV
Tests et rsultats
IV.11. Discussion
Dans ce chapitre nous avons test notre systme de reconnaissance sur plusieurs bases de
donnes savoir : CVRP, AT&T, FEI et MUCT. Le seuil de rejet des individus inconnus a t
trouv en minimisant le taux de lEER. De plus, nous avons tudi linfluence des changements
de poses et dclairages sur le taux de reconnaissance. Lensemble des tests effectus a permis
de conclure, quavec lutilisation de PCA sous un clairage uniforme tout en ayant plusieurs
poses par personne permet dobtenir des performances optimales.
En validant notre approche sur un corpus de donnes de grande taille et assez vari le rendant
ainsi plus raliste, nous avons apport une amlioration considrable au taux didentification
grce aux prtraitements effectus en avale sur les images dapprentissages et aux tests, toute
fois le temps de calcul sest vu lgrement augment.
Plusieurs enseignements peuvent tre tirs pour minimiser ce temps de calcul comme le choix de
la distance Euclidienne L2 qui est beaucoup plus rapide que la distance de Mahalanobis L1 et de
la rsolution des images de la base de donnes adquate.
77
Conclusion
Conclusion :
La biomtrie est un domaine la fois passionnant et complexe. Elle tente, par des
outils mathmatiques souvent trs volus, de faire la distinction entre des individus, nous
obligeant travailler dans un contexte de trs grande diversit. Cette diversit se retrouve
galement dans le nombre considrable dalgorithmes qui ont t proposs en reconnaissance
faciale.
Dans ce mmoire, nous nous sommes intresss au problme de la reconnaissance
faciale. Notre travail consiste la mise au point dun algorithme robuste destin reconnatre
un individu par son visage en utilisant la mthode Eigenface qui se base sur une analyse
en composante principale(ACP). LACP est une mthode mathmatique qui peut tre utilise
pour simplifier un ensemble de donnes, en rduisant sa dimension. Elle est utilise pour
reprsenter efficacement les images de visages, qui peuvent tre approximativement
reconstruites partir dun petit ensemble de poids et dune image de visage standard.
Une analyse des diffrentes techniques de reconnaissance dveloppes au cours de
ces dernires annes a t prsente, et cela pour mettre en vidence les particularits ainsi
que les avantages et les inconvnients de chacune dentre elles.
Nous avons soulign durant ce travail linfluence nfaste du changement de pose et
dclairage sur le taux de reconnaissance du systme et pour cela nous avons propos
quelques solutions qui ont t values durant la phase de test. Ces solutions ont donn
dassez bon rsultats. Malgr tous les progrs qui ont t raliss, les problmes de pose et
dclairage et de lidentification dans des environnements extrieurs restent des challenges qui
susciteront les efforts des chercheurs. LACP reste une mthode efficace et simple pour grer
ce type de problme. Cest pour toutes ces raisons que nous avons opt pour cette approche
de reconnaissance du visage.
Nous estimons avoir ralis un systme rpondant lobjectif que nous nous sommes
fixs au dpart, savoir la mise en uvre dun systme permettant la reconnaissance
dindividus et le contrle daccs
En guise de perspectives, une extension de ce travail peut tre ralise en intgrant un
systme dacquisition des images pour viter que ces oprations didentification et de
vrification soient de simples simulations. Par ailleurs, il serait aussi intressant dappliquer,
la mthode dveloppe dans ce mmoire, dans un systme de scurit biomtrique utilisant
lacquisition vido. Dans ce cas, cet algorithme doit rpondre aux exigences du temps rel.
Mais, cela ne peut se faire sans le dveloppement dalgorithmes efficaces de dtection et de
poursuite des visages dans les squences vido.
78
Bibliographie
Bibliographie
[1]
John D. Woodward, Jr., Christopher Horn, Julius Gatune, and Aryn Thomas,
Biometrics A Look at Facial Recognition, documented briefing by RAND Public
Safety and Justice for the Virginia State Crime Commission, 2003.
[2]
[3]
http://www.biometricgroup.com.
[4]
[5]
[6]
[7]
[8]
D. Bolme, J. Beveridge, M. Teixeira, and B. Draper. The CSU Face Identi cation
Evaluation System : Its Purpose, Features, and Structure. In : Proceedings of the 3rd
International Conference on Computer Vision Systems (ICVS),
[9]
W. Bledsoe. The model method in facial recognition. Tech. Rep. PRI :15, Stanford
University, Palo Alto, CA, USA, 1964.
Bibliographie
80
Bibliographie
[23] P. Penev and J. Atick. Local features analysis : A general statistical theory for object
representation. Neural Systems, Vol. 7, No. 3, pp. 477500, 1996.
[24] V. Perlibakas. Face recognition using Principal Component Analysis and Log-Gabor
Filters. March 2005.
[25] Y. Adini, Y. Moses, S. Ullman, Face recognition: The problem of
compensating for changes in illumination direction. IEEE Trans. Patt. Anal. Mach.
Intell. 19, 721732, 1997.
[26] D. Blackburn, M. Bone, P. J Phillips. Face recognition vendor test 2000. Tech. rep.
http://www.frvt.org, 2001.
[27] R. Gross, J. Shi, J. Cohn. Quo Vadis Face Recognition?. Third Workshop on
Empirical Evaluation Methods in Computer Vision, December, 2001.
[28] A.M Martnez, R. Banavente. The AR face database. Tech. Report 24 CVC Barcelone,
Espagne, June 1998.
[29] D. Blackburn, M. Bone, P. J Phillips. Face recognition vendor test 2000. Tech. rep.
http://www.frvt.org, 2001.
[30] Ming-Hsuan Yang, David J. Kriegman et Narendra Ahuja. Detecting faces in images
: A survey. Dans IEEE Transactions on Pattern Analysis and Machine
Intelligence, volume 24(1), pages 3458, 2002.
[31] H. A. Rowley, S. Baluja, et T. Kanade, "Neural Network based Face
Detection", IEEE Trans, Pattern Anal. Mach, Intell, 23-38, January 1998
[32] C. Kotropoulos and I. Pitas. Rule-Based Face Detection in Frontal Views. Proc.
Intl Conf. Acoustics, Speech and Signal Processing, vol. 4, pp. 2537-2540, 1997.
[33] T. Kanade. Picture Processing by Computer Complex and Recognition of Human
Faces, PhD thesis, Kyoto Univ., 1973.
[34] J.Yang, D. Zhang, A.F. Frangi, J.Yang, Two-dimensional PCA: a new approach
to appearance-based face representation and recognition, IEEE Trans. Pattern
Anal. Mach. Intell. 131137,2004.
[35] P. Sinha, Processing and Recognizing 3D Forms, PhD thesis,
Massachusetts Inst. of Technology, 1995.
81
Bibliographie
[36] A. Yuille, P. Hallinan, and D. Cohen, Feature Extraction from Faces Using
Deformable Templates, Intl J. Computer Vision, vol. 8, no. 2, pp. 99-111, 1992.
[37] R. Brunelli, T. Poggio. Face recognition: features versus templates. IEEE Trans.
Pattern Anal. Mach. Intell, pp-10421062, 1993.
[38] Principal components analysis.
Document available at : http://en.wikipedia.org/wiki/Principal_components_analysis.
[39] A. S. Tolba, A.H. El-Baz, and A.A. El-Harby, Face Recognition: A Literature
Review, INTERNATIONAL JOURNAL OF SIGNAL PROCESSING VOLUME 2
NUMBER 2 2005 ISSN 1304-4494.
[40] Cherng Jye Liou, A Real Time Face Recognition System, DSP/IC Design Lab,
Department of Electrical Engineering, National Taiwan University, June 1997.
[41] Alex Chirokov, Karhunen-Loeve, for face recognition. Matlab code available at :
http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=6995&o
bjectType=file.
[42] Linear discriminant analysis.
Document available at : http://en.wikipedia.org/wiki/Linear_discriminant_analysis.
[43] Dr. Andrzej Drygajlo, ELE 233, BIOMETRICS.
Document available at : http://scgwww.epfl.ch/courses.
[44] Juwei Lu, Kostantinos N. Plataniotis, and Anastasios N. Venetsanopoulos, Face
Recognition Using LDA-Based Algorithms, IEEE TRANSACTIONS ON NEURAL
NETWORKS, VOL. 14, NO. 1, JANUARY 2003.
[45] M. Bartlett and H. Lades and T. Sejnowski, Independent component representations
for face recognition, in T. Rogowitz, B. & Pappas, editor, Proceedings of the SPIE
Symposium on Electonic Imaging: Science and Technology; Human Vision and
Electronic Imaging III, volume 3299, San Jose, CA, January 1998. SPIE Press. 1998.
[46] Wen Gao, Shiguang Shan, Face Verification for Access Control, Biometrics
Solutions for Authentication in an E-World, Edited by David Zhang, Kluwer
Academic Publishers, Chapter 13, pp339-376, 2002.
[47] Modules complmentaires MATLAB.
Document disponible sur : http://www.ryounes.net/cours/modules.pdf.
82
Bibliographie