Banca Examinadora:
Presidente e Orientador:
Prof. Dr. Humberto Remigio Gamba
UTFPR
Examinadores:
Prof. Dr. Og Marques Filho
Prof. Dr. Maurizio Tazza
FAU - EUA
UTFPR
Curitiba
2006
iv
iii
AGRADECIMENTOS
Agradeo a minha famlia pelo incentivo e apoio para a concluso desse curso.
Agradeo a todos os meus amigos que contriburam com idias e
disponibilizaram seu tempo para a captura de imagens.
Agradeo ao Instituto de Automao da Academia Chinesa de Cincias pelo
fornecimento da base de imagens CASIA.
Agradeo aos revisores do trabalho Andressa Zanin Rovani, Karine Greice
Vieira, Tomas Fernandes, e Rafael Locks Lange pelas correes e pela pacincia.
Agradeo especialmente ao professor e orientador Dr. Humberto Remigio
Gamba por apoiar este projeto desde o incio.
E por fim, agradeo a todos que de alguma forma contriburam para a
realizao deste trabalho.
SUMRIO
LISTA DE FIGURAS ...........................................................................................................ix
LISTA DE TABELAS......................................................................................................... xii
RESUMO........................................................................................................................... xiii
ABSTRACT........................................................................................................................xiv
1 INTRODUO...................................................................................................................1
1.1. MOTIVAO .....................................................................................................1
1.2. OBJETIVO DO TRABALHO..............................................................................2
1.3. ESTRUTURA DA DISSERTAO ....................................................................2
2 FUNDAMENTAO TERICA .......................................................................................3
2.1. INTRODUO ...................................................................................................3
2.2. ESTRUTURA DO OLHO HUMANO..................................................................3
2.3. PARMETROS DE UMA LENTE......................................................................3
2.4. FILTRAGEM ESPACIAL ...................................................................................5
2.5. TRANSFORMADA DE HOUGH........................................................................5
2.6. HISTOGRAMA...................................................................................................7
2.7. TEOREMA DE BAYES ......................................................................................7
2.8. MQUINAS DE ESTADO FINITO ....................................................................8
2.9. ALGORITMO DE BRESENHAM PARA CRCULOS........................................9
3 REVISO DA LITERATURA..........................................................................................13
3.1. INTRODUO .................................................................................................13
3.2. MTODOS DE LOCALIZAO DE RIS .......................................................13
3.3. MTODOS DE ESTIMATIVA DE FOCO ........................................................17
4 MATERIAIS E MTODOS ..............................................................................................19
4.1. SISTEMA DE AQUISIO DE IMAGENS .....................................................19
4.2. BASES DE DADOS UTILIZADAS ..................................................................22
4.3. ESTRUTURA DO ALGORITMO DE LOCALIZAO ...................................23
4.3.1. FILTRO GAUSSIANO........................................................................24
4.3.2. CLCULO DO GRADIENTE SOBEL ...............................................25
4.3.3. HISTOGRAMA DA IMAGEM ...........................................................25
4.3.4. ESTIMAO DO RAIO DA PUPILA................................................27
4.3.5. CLCULO DO CENTRIDE DA IMAGEM .....................................30
4.3.6. DETERMINAO DOS PARMETROS DA PUPILA.....................32
4.3.7. LIMIARIZAO DO GRADIENTE ..................................................37
4.3.8. DETERMINAO DOS PARMETROS DA RIS ...........................39
4.3.9. ESTIMATIVA DE FOCO ...................................................................42
4.4. INTERFACE DE CONTROLE DA CAPTURA DE IMAGENS ........................43
5 RESULTADOS .................................................................................................................49
5.1. VALIDAO DA LOCALIZAO DA RIS ..................................................49
5.1.1. GERAO DO VDEO COM IMAGENS ARTIFICIAIS DE RIS ....49
5.1.2. PROCESSAMENTO DO VDEO........................................................50
5.2. VALIDAO DO MTODO DE CAPTURA DE IMAGENS ..........................51
5.3. AVALIAO DO ALGORITMO DE DETECO DE FOCO ........................53
6 CONCLUSO ..................................................................................................................57
6.1. DISCUSSES ...................................................................................................57
6.2. CONCLUSO ...................................................................................................58
6.3. TRABALHOS FUTUROS .................................................................................58
REFERNCIAS BIBLIOGRFICAS ..................................................................................61
vii
viii
LISTA DE FIGURAS
Figura 1 Estrutura do olho humano. ....................................................................................3
Figura 2 Definio da profundidade de campo de uma lente ...............................................4
Figura 3 Transformada de Hough. (PRATT, 2001) .............................................................6
Figura 4 Exemplo de mquina de estado finito para reconhecer seqncias
mpares de nmeros 1........................................................................................9
Figura 5 Esboo traado pela equao da circunferncia. ..................................................10
Figura 6 Algoritmo de Bresenham para crculos................................................................11
Figura 7 Crculo escuro sobre um fundo claro e seus vetores de gradiente.........................14
Figura 8 Imagem de ris transformada de coordenadas retangulares para
coordenadas polares. .......................................................................................16
Figura 9 Posio dos pontos pr-calculados de cada crculo com raio entre 10 e
107 pixels........................................................................................................17
Figura 10 - Princpio de funcionamento do clculo do foco proposto por Park &
Kim (2005)......................................................................................................18
Figura 11 Componentes do sistema de aquisio de imagens. ...........................................19
Figura 12 Cmera de vdeo utilizada no trabalho. Possui CCD com 1/3 de
polegada e 600 linhas de resoluo horizontal. ................................................19
Figura 13 Objetiva com distncia focal de 100 mm utilizada para obter as
imagens de ris. ...............................................................................................20
Figura 14 Monitor de vdeo de 2,5 usado para a realimentao do
posicionamento para o usurio.........................................................................20
Figura 15 Filtro infravermelho Hoya RM90 utilizado para impedir a entrada de
luz com comprimento de onda inferior a 900 nm. ............................................21
Figura 16 Curva de transmisso de radiao de dois modelos de filtro Hoya.
esquerda a curva do RM90, e direta a curva do modelo RM100. ...................21
Figura 17 Programa auxiliar desenvolvido para determinar manualmente os
parmetros das imagens da base de dados CASIA. ..........................................23
Figura 18 Diagrama de blocos do algoritmo de deteco...................................................24
Figura 19 Mscara do filtro gaussiano utilizado na filtragem.............................................24
Figura 20 Mscaras do operador de Sobel.........................................................................25
Figura 21 Imagem de boa qualidade e seu respectivo histograma. Dimenses:
320240 pixels, 256 tons de cinza. Fonte: BDIRIS..........................................26
Figura 22 Imagem de baixa qualidade e seu respectivo histograma. Dimenses:
320240 pixels, 256 tons de cinza. Fonte: BDIRIS..........................................26
Figura 23 Resultado da binarizao da Figura 21. (a) limiar mnimo 43, (b)
limiar mximo 75. Abaixo de cada pupila apresentado o
histograma da imagem original e o ponto onde foi aplicado o limiar
de binarizao. ................................................................................................27
Figura 24 Resultado da binarizao da Figura 22. (a) limiar mnimo 35, (b)
limiar mximo 46. Abaixo de cada pupila apresentado o
histograma da imagem original e o ponto onde foi aplicado o limiar
de binarizao. ................................................................................................28
Figura 25 Mquina de estados para deteco de mximos e mnimos locais. Na
figura, h o vetor de entrada, h[n] o valor atual do vetor, h[n+1]
o valor do prximo elemento do vetor, n o ndice do elemento atual
do vetor, incrementado a cada transio de estado, e listamax e
listamin so listas que armazenam os mximos e os mnimos,
respectivamente...............................................................................................29
ix
xi
LISTA DE TABELAS
Tabela 1 Formato do CCD e suas dimenses correspondentes.............................................4
Tabela 2 Parcela inicial dos dados obtidos aps a classificao manual das 4018
imagens da base de imagens BDIRIS...............................................................36
Tabela 3 Desempenho da deteco da ris para limiarizaes do gradiente entre
20 e 60% na base de dados CASIA..................................................................38
xii
RESUMO
Nesta dissertao prope-se um algoritmo para capturar imagens do olho e
localizar de forma automtica a pupila e a ris. O algoritmo proposto tem aplicaes em
sistemas que utilizam as informaes geomtricas do olho (raio e coordenadas do centro da
pupila e da ris), como por exemplo, sistemas de reconhecimento de ris. Para o
desenvolvimento do algoritmo, montou-se um prottipo para aquisio das imagens composto
por uma cmera de vdeo, filtro infravermelho, sistema de iluminao, monitor, objetiva de
100 mm, e uma placa de captura ligada ao computador. O mtodo proposto baseia-se na
reduo do espao de busca para que o processamento de uma imagem possa ser avaliado em
tempo real (30 quadros por segundo). Por isso, realizou-se um estudo em 756 imagens da base
de dados CASIA para utilizar o centride da imagem como uma estimativa para o centro da
pupila e um estudo baseado no histograma da imagem para estimar do raio da pupila. Essas
estimativas permitem que a imagem seja processada de forma rpida, e capturada se
determinados critrios de qualidade forem satisfatrios. Um desses critrios um parmetro
estatstico chamado de diferena das mdias, que foi determinado atravs do estudo de 4018
imagens da base de dados BDIRIS. O outro critrio a estimativa de foco, que uma medida
da nitidez da borda da pupila. Esses critrios permitem aceitar ou rejeitar uma imagem, o que
essencial em um sistema de aquisio automtica de imagens. O algoritmo desenvolvido foi
implementado e testes revelam que o sistema captura imagens de ris em tempo real, bastando
que para isso a pessoa posicione-se corretamente diante da cmera de vdeo.
xiii
ABSTRACT
In this dissertation a new algorithm is considered to capture images of the eye
and to locate automatically the pupil and the iris. The considered algorithm has applications in
systems that use the geometric data of the eye (radius and coordinates of the center of the
pupil and the iris), as for example iris based recognition systems. For the development of the
algorithm, a prototype for acquisition of the images was built, consisting of a video camera,
infrared filter, lighting system, monitor, 100 mm objective, and a frame grabber linked to the
computer. The considered method is based on the reduction of the search space so that the
processing of an image can be evaluated in real time (30 pictures for second). Therefore, a
study in 756 images of the database CASIA was done to use the centroid of the image as an
estimate for the center of the pupil and a study based on the histogram of the image to
estimate the radius of the pupil. These estimates allow the images be fast processed, and
captured if some quality criteria become satisfactory. One of these criteria is a statistical
parameter called `difference of the averages', that was determined through the study of 4018
images of the database BDIRIS. The other criterion is the focus assessment, which is a
measure of the clearness of the edge of the pupil. These criteria allow to accept or to reject an
image, which is essential in a automatic image acquisition system. The developed algorithm
was implemented and tests disclose that the system captures images of iris in real time, being
enough that for this the person remains correctly positioned ahead of the video camera.
xiv
CAPTULO 1
1 INTRODUO
1.1. MOTIVAO
A difuso de uma tecnologia biomtrica depende de vrias caractersticas:
segurana, preo, facilidade de manuseio, tempo de processamento. Dessas, a facilidade de
manuseio a que mais influencia a tecnologia de reconhecimento de ris. Para que seja
possvel capturar imagens do olho de uma pessoa, preciso que ela colabore, posicionando-se
em frente a uma cmera de vdeo e aguardando durante alguns segundos o resultado do seu
cadastro ou identificao. No instante em que a pessoa est olhando para a cmera, o sistema
deve selecionar uma ou mais imagens do seu olho para posterior anlise e comparao.
Assim, o assunto desta dissertao trata da forma com que a captura automtica dessas
imagens de ris deve ser realizada.
A comparao de imagens de ris realizada a uma taxa de 100 mil confrontos
por segundo em um computador com processador de 300 MHz, podendo chegar a um milho
de pessoas por segundo nos processadores modernos de 3GHz. Alm disso, a taxa de falsos
positivos (probabilidade da comparao de duas imagens de olhos distintos resultar em uma
coincidncia) de 10 6 , o que faz a tecnologia de comparao de ris mais confivel do que a
2
1.2. OBJETIVO DO TRABALHO
O objetivo desse trabalho desenvolver um sistema para captura automtica de
imagens de ris. A captura das imagens (sob iluminao infravermelha) deve ser realizada
automaticamente e em tempo real quando uma pessoa posicionar-se corretamente em frente
cmera de vdeo. Entende-se por um posicionamento correto aquele que gera uma imagem
centralizada e em foco. O processamento em tempo real permite que todas as imagens do
fluxo de vdeo sejam avaliadas
Como objetivos secundrios tm-se o desenvolvimento de um programa
auxiliar para a determinao manual de parmetros de imagens de ris, a construo de um
prottipo para aquisio de imagens, e a gerao de um vdeo simulador de imagens de ris.
1.3. ESTRUTURA DA DISSERTAO
Esta dissertao est organizada em seis captulos. O Captulo 1 apresenta a
introduo ao trabalho destacando-se as motivaes para o desenvolvimento e os objetivos. O
Captulo 2 apresenta a fundamentao terica necessria para compreender itens especficos
do trabalho. O Captulo 3 apresenta os mtodos de localizao de ris e de estimativa de foco
existentes. O Captulo 4 descreve como foi construdo o prottipo para aquisio de imagens,
e como foi desenvolvido o algoritmo de localizao automtica de ris e de estimativa de foco.
O Captulo 5 descreve os resultados obtidos e o Captulo 6 finaliza com a concluso do
trabalho, discusso, e trabalhos futuros.
CAPTULO 2
2 FUNDAMENTAO TERICA
2.1. INTRODUO
Este item aborda alguns conceitos preliminares que so considerados
importantes para a leitura dessa dissertao.
2.2. ESTRUTURA DO OLHO HUMANO
A Figura 1 apresenta as trs partes do olho humano relevantes para esse
trabalho. A esclera a parte branca que envolve o olho e d forma ao globo ocular. A ris a
parte colorida do olho, que regula a quantidade de luz que atinge a retina. A pupila uma
abertura no centro da ris que permite a passagem da luz.
4
Tabela 1 Formato do CCD e suas dimenses correspondentes.
Diagonal (polegadas)
Altura (mm)
Largura
(mm)
1/4
1/3
1/2
2/3
1
2,4
3,6
4,8
6,6
9,6
3,2
4,8
6,4
8,8
12,8
A equao dfa =
do ccda
permite determinar a distncia focal da altura dfa ,
oa + ccda
do ccdl
permite determinar a distncia focal da largura
ol + ccdl
dfl , onde ol a largura do objeto e ccdl a largura do CCD. Assim, a distncia focal da
lente ser o menor valor entre os dois valores calculados (THE IMAGING SOUCE EUROPE
GMBH, 2003).
A profundidade de campo de uma lente a regio do eixo ptico em que a
imagem aparece com nitidez (Figura 2). Quando o objeto se encontra dentro da faixa de
profundidade de campo, diz-se que ele se encontra em foco, caso contrrio o objeto encontrase fora de foco. Quanto maior a distncia focal de uma lente, menor ser a sua profundidade
de campo.
5
2.4. FILTRAGEM ESPACIAL
Os filtros utilizados no processamento de imagens tm a funo de eliminar
rudos, suavizar ou enfatizar detalhes.
A filtragem espacial assim denominada porque a operao de filtragem
realizada no domnio do espao (opondo-se filtragem no domnio da freqncia, realizada
aps uma transformada de Fourier). Para que se possa filtrar uma imagem no domnio do
espao necessria uma mscara, ou seja, uma matriz de coeficientes que sero utilizados
para efetuar uma multiplicao ponderada com os pixels da imagem (essa multiplicao
ponderada conhecida como convoluo).
Geralmente as mscaras so de tamanho 33, 55, ou 77. Valores maiores
tambm so possveis, mas exigem grande esforo computacional, alm de reduzirem as
dimenses da imagem para valores eventualmente inadmissveis (reduo causada pelo efeito
de borda).
A filtragem consiste em posicionar a mscara sobre o primeiro pixel da
imagem e efetuar a soma das multiplicaes dos coeficientes da mscara pelos pixels
correspondentes da imagem. Assim, o pixel em que est posicionada a mscara receber o
resultado da soma, e a mscara ser deslocada para o pixel seguinte, at que todos os pixels da
imagem filtrada sejam calculados. (GONZALEZ & WOODS, 2000)
2.5. TRANSFORMADA DE HOUGH
A transformada de Hough um mtodo invariante rotao e translao,
utilizado para encontrar formas geomtricas em uma imagem. A idia desse mtodo
transformar a imagem de entrada (aps uma deteco de bordas) em um espao de
parmetros, tambm chamado de espao de Hough. Assim, fica estabelecida uma dualidade
entre o espao original (cartesiano) e o espao de parmetros, que explorado para encontrar
construes geomtricas como linhas ou crculos. A dimenso do espao de parmetros
proporcional ao nmero de parmetros da forma geomtrica que se deseja encontrar. Por
exemplo, um segmento de reta pode ser representado por dois parmetros: o ngulo de sua
normal em relao abscissa e a sua distncia da origem, o que faz com que o espao de
Hough para uma reta tenha duas dimenses. Da mesma forma um crculo pode ser
representado por trs parmetros: suas coordenadas do centro e o seu raio, o que faz com que
6
o seu espao de Hough tenha trs dimenses. A Figura 3 explica o princpio de
funcionamento da transformada de Hough. (PRATT, 2001)
7
resulta no conjunto de trs curvas paramtricas no espao polar da Figura 3f. Essas trs curvas
se cruzam em um nico ponto correspondente linha tracejada que passa atravs dos trs
pontos colineares.
Cada reta mapeada para o espao de parmetros considerada como um voto.
Ao mapear todos os pontos da imagem de entrada para o espao de parmetros, so obtidos
pontos com maior nmero de votos, que so exatamente aqueles que representam as retas na
imagem de entrada. A mesma idia aplicada para a deteco de crculos. No entanto, o
espao de parmetros dos crculos possui formato de um cone tridimensional, onde cada
ponto do cone corresponde a um crculo na imagem original.
2.6. HISTOGRAMA
O histograma de uma imagem um grfico que mostra a probabilidade de
ocorrncia de uma cor. No caso de uma imagem colorida com trs canais de cores, definem-se
trs histogramas, um para cada cor. Uma imagem monocromtica possuir apenas um
histograma. O nmero de bits utilizados para representar um pixel influencia no nmero de
cores que a imagem pode possuir, e consequentemente no comprimento do histograma. Uma
imagem de 4 bits possui o histograma com 16 nveis, e uma imagem com 8 bits possui
histograma com 256 nveis. Todas as imagens estudadas neste trabalho possuem 256 nveis de
cinza. O histograma de uma imagem pode ser calculado atravs da equao pr (rk ) =
nk
, onde
n
8
matemtica usada para calcular a probabilidade a posteriori dado que se conhece a
probabilidade a priori. Organizando a igualdade tem-se o Teorema de Bayes em sua forma
mais conhecida P ( x | y) = P( y | x) P ( x) .
P( y )
q0 o estado inicial;
(q1,0) = q1 , (q1, 1) = q0
O estado inicial q0
q0
1
q1
10
trigonometria e o clculo de uma raiz quadrada, que indesejvel por envolver instrues de
ponto flutuante. Alm disso, quando esse clculo realizado em funo de uma coordenada,
por exemplo, x, deixa espaos ou pixels no preenchidos ao longo do traado da
circunferncia em y, como apresentado na Figura 5.
Bresenham apresenta uma forma elegante e eficiente para o clculo dos pontos
que formam o traado de uma circunferncia, aproveitando-se da simetria da circunferncia
em relao aos eixos de zero, quarenta e cinco, e noventa graus. Assim, para obter todos os
pontos da circunferncia, basta calcular os pontos de um octante e rebat-los para os outros
sete. Uma das caractersticas desse algoritmo que ele determina o prximo ponto baseado na
posio do ponto anterior. Supondo que o primeiro ponto seja conhecido e localizado no
incio do segundo octante (em noventa graus), o segundo ponto que melhor representa a
circunferncia determinado entre trs alternativas: direita, abaixo, ou diagonal inferior
direita. Para determinar a alternativa correta, calcula-se o erro de cada uma ao longo do raio.
Se o erro for positivo a alternativa indica um ponto fora da circunferncia e implica um
movimento horizontal direita. Se o erro for negativo, o ponto est dentro da circunferncia e
implica um avano vertical para baixo. Se o erro for igual a zero o ponto est localizado sobre
a circunferncia e implica um avano na diagonal inferior direita. Como o clculo deve ser
realizado apenas para o primeiro octante, estes passos devem ser executados apenas enquanto
o ponto estiver localizado acima da diagonal de 45, ou seja, enquanto y x . A Figura 6
apresenta o pseudocdigo do algoritmo de Bresenham para crculos.
11
CAPTULO 3
3 REVISO DA LITERATURA
3.1. INTRODUO
Este item apresenta os principais estudos publicados sobre a captura de
imagens de ris, nos quais este trabalho foi baseado.
3.2. MTODOS DE LOCALIZAO DE RIS
Um dos mtodos mais populares para localizao da ris foi proposto por
Daugman (2001), no qual se utiliza um operador integral-diferencial em uma imagem
suavizada por um filtro gaussiano. A equao max ( r , x , y ) = G (r ) r
0
r , x0 , y 0
I ( x, y )
ds descreve
2 r
a notao de derivada
14
bordas realizada sem o favorecimento da direo vertical, e restrita regio composta pela
parte interna da ris.
Um algoritmo computacionalmente mais simples e que exige menos memria
que a transformada de Hough foi proposto por Rad et al. (2003), chamado de Deteco
Rpida de Crculos (DRC). Este algoritmo utilizado para detectar crculos escuros em
fundos homogneos mais claros, e composto por quatro etapas. A primeira etapa consiste
em calcular o gradiente da imagem. Quando existirem crculos escuros na imagem, os seus
vetores de gradiente apontaro para fora do crculo, como na Figura 7.
15
so rotulados. Na segunda etapa aplica-se a transformada de Hough para encontrar o centro da
pupila, e na terceira etapa os raios obtidos so agrupados e o valor mdio do grupo com a
maior freqncia de ocorrncia considerado o raio da pupila. De forma anloga so
determinados os parmetros da ris.
O mtodo utilizado por Pan & Xie (2005) para detectar a pupila baseia-se na
anlise do histograma da imagem, em que o limiar de segmentao da pupila o valor do
mnimo local entre o primeiro e o segundo mximo local. Aps a segmentao, aplicada
uma morfologia matemtica de eroso e dilatao para fechar os espaos provenientes do
reflexo da iluminao. Para encontrar o centro aproximado da pupila, a imagem dividida em
pequenas regies e aquela que possuir a menor soma de intensidade de pixels considerada a
regio que contm a pupila. Detectando horizontalmente as bordas da regio na imagem
binria obtm-se o centro da pupila. Para determinar os raios da ris e da pupila, algumas
linhas prximas do centro so amostradas e o vetor obtido diferenciado (ou derivado) para
que possam ser obtidos os picos que representam as bordas da ris e da pupila. Atravs desses
picos os respectivos raios so determinados.
Zhang & Li (2005) utilizaram pares de vetores de gradientes resultantes de
uma deteco de bordas de Canny (1986) para a deteco da pupila, posteriormente refinada
atravs do operador integral-diferencial de Daugman (2001). Para detectar a ris, o algoritmo
de Canny (1986) foi aplicado novamente favorecendo as bordas verticalmente direcionadas,
resultando em um conjunto de pixels que formam o vetor de entrada para o algoritmo de
Deteco Aleatria de Crculos, descrito por Chen & Chung (2001).
Mira Jnior & Mayer (2003) apresentaram um mtodo essencialmente
morfolgico para a deteco e extrao de caractersticas da ris. Utilizando iluminao
visvel (ou seja, no infravermelha) determinam as bordas da pupila aplicando a seguinte
seqncia de operadores morfolgicos: limiarizao, abertura e fechamento. Para determinar
as bordas da ris, a seqncia de operadores : limiarizao, fechamento e abertura.
Cui et al. (2004) descrevem um mtodo baseado em uma Mquina de Vetor de
Suporte (THEODORIDIS & KOUTROUMBAS, 2003) para determinar os parmetros da ris.
Para isso, detectam a pupila extraindo duas caractersticas da imagem: a rea, dada pelo
nmero de pixels pretos da imagem binarizada, e a excentricidade, dada pela equao
Ic =
s
, onde s a rea da pupila e r a maior distncia entre o centride da pupila e um
r2
ponto qualquer pertencente mesma. Dada a existncia da pupila, realizada a busca pela
16
ris, que consiste em transformar a imagem do espao de coordenadas retangulares para o
espao polar, tendo o centro da pupila posicionado na origem (Figura 8).
regio.
Um algoritmo para reconhecimento de ris em tempo real foi apresentado por
Cho et al. (2005) e implementado em um telefone celular com processador ARM de 300MHz.
Para detectar a pupila, utiliza-se uma limiarizao global da imagem. Para minimizar o erro
de localizao, o contraste e o brilho da imagem foram ajustados no conversor analgicodigital da cmera para que houvesse a maior nitidez dos pixels escuros. Assim, os mximos
locais do histograma da imagem referentes pupila e a esclera apresentam-se mais separados,
o que facilita a limiarizao. Da mesma forma o conversor analgico-digital ajustado para a
deteco das bordas da ris. Neste caso, a nitidez deve ser maior nos pixels com tons de cinza
elevados. Assim, a deteco da ris realizada aplicando-se uma verso modificada do
operador integral-diferencial de Daugman (2001). A modificao consiste em pr-calcular a
disposio de alguns pontos de todos os possveis crculos em que a ris pode estar contida.
Assim, a velocidade do processamento aumenta, pois esse clculo no precisa ser efetuado em
tempo de execuo. Tendo os pontos calculados, as diferenas entre os pixels (que
possivelmente esto em torno da borda da ris) so obtidas e o raio que apresentar a maior
soma das diferenas considerado como sendo o raio da ris (Figura 9).
17
Figura 9 Posio dos pontos pr-calculados de cada crculo com raio entre 10 e 107 pixels.
18
faixa PC. Da mesma forma a imagem est fora de foco se a pessoa se encontrar na faixa III, e
a reflexo especular tambm se apresenta como um disco branco. Porm, nesse caso ela
possui um pequeno ponto preto central, que permite identificar, mesmo com a imagem fora de
foco, se a pessoa est muito prxima ou muito distante da faixa de profundidade de campo.
Este o princpio de funcionamento do sistema de foco automtico proposto por Park & Kim
(2005), em que utilizada uma lente varifocal motorizada, que movimentada segundo a
distncia da pessoa em relao lente.
Figura 10 - Princpio de funcionamento do clculo do foco proposto por Park & Kim (2005).
CAPTULO 4
4 MATERIAIS E MTODOS
4.1. SISTEMA DE AQUISIO DE IMAGENS
O sistema de aquisio de imagens utilizado nesse trabalho composto por
uma cmera de vdeo, uma objetiva, um monitor, um filtro infravermelho, e pela placa de
iluminao. A Figura 11 apresenta um diagrama de blocos com os componentes utilizados.
Cmera AYC-577F
CDD 1/3
Objetiva
100 mm
Filtro
Infravermelho
RM90
Iluminao
Computador
Placa de
Captura
Monitor 2.5
Figura 12 Cmera de vdeo utilizada no trabalho. Possui CCD com 1/3 de polegada e 600
linhas de resoluo horizontal.
20
distancia de 30 cm. A profundidade de campo do sistema ptico nessa configurao fica com
aproximadamente um centmetro.
Figura 13 Objetiva com distncia focal de 100 mm utilizada para obter as imagens de ris.
21
Figura 15 Filtro infravermelho Hoya RM90 utilizado para impedir a entrada de luz com
comprimento de onda inferior a 900 nm.
22
4.2. BASES DE DADOS UTILIZADAS
No decorrer desse trabalho foram utilizadas duas bases de dados de ris: uma
de domnio pblico e outra privada.
A base de dados privada, BDIRIS, constituda por 4018 imagens
provenientes de 22 pessoas. Esto armazenadas no formato bitmap com 256 tons de cinza e
com tamanho de 320240 pixels. Esta base possui imagens originadas de vrios modelos de
cmeras, nveis de iluminao, assim como a distncia do indivduo lente.
A base de dados de domnio pblico conhecida como CASIA
(http://www.sinobiometrics.org/casia iris.htm) e constituda por 756 imagens provenientes
de 108 pessoas, com cada pessoa contribuindo com sete imagens de ambos os olhos (trs
imagens de um olho e quatro de outro). As imagens tambm esto em formato bitmap com
256 tons de cinza e tamanho de 320280 pixels. A grande maioria dessas imagens de
orientais, explicando assim a obstruo causada por clios em algumas delas.
A principal dificuldade com o processamento de imagens definir os valores
timos de limiarizao, tamanho de mscaras de filtro, larguras de janelas, entre outras.
Nesses casos interessante possuir um mecanismo para auxlio na determinao desses
valores. Neste trabalho, esse mecanismo uma base de imagens de ris com todos os
parmetros importantes da ris pr-determinados. Por isso, foi desenvolvido um programa que
permite determinar manualmente e armazenar em um banco de dados os parmetros das 756
imagens da base de dados CASIA. Os parmetros armazenados so os raios e os centros da
pupila e da ris. Assim, em alguns casos, os valores para uma constante do software de
deteco so determinados estatisticamente utilizando-se esses parmetros como referncia. A
Figura 17 apresenta a tela principal desse programa auxiliar.
23
24
25
O tamanho dessa mscara assim como a varincia da funo gaussiana foi
selecionado empiricamente, de forma a no comprometer o tempo de processamento e o
tamanho resultante da imagem.
4.3.2. CLCULO DO GRADIENTE SOBEL
O operador de Sobel (GONZALEZ & WOODS, 2000) composto pelas
mscaras de convoluo apresentadas na Figura 20. Esse operador utilizado para detectar os
gradientes horizontais e verticais da imagem de ris. Na implementao desse operador foi
feita uma simplificao em que ao invs de calcular a distncia euclidiana para obter o valor
do mdulo em um determinado ponto da imagem, considerou-se o mdulo como sendo
apenas a soma dos valores do gradiente na horizontal e vertical. Uma alternativa para detectar
as bordas da pupila seria a utilizao do operador de Canny (CANNY, 1986). Apesar dos
resultados apresentados por esse mtodo serem superiores (pois ele detecta os componentes
conectados das bordas) aos do operador de Sobel, a escolha pelo ltimo foi mantida, pois de
rpido processamento.
26
dessa imagem continua apresentando os dois mximos locais referidos anteriormente, porm
eles no tm a evidncia que os mximos da Figura 21 apresentam, ou seja, seus valores
mximos so baixos em relao aos outros picos da imagem e no apresentam uma fronteira
ntida de separao. Alm disso, no existe o mnimo local citado anteriormente.
Ainda, observa-se que o nvel de cinza do primeiro mximo local ,
aproximadamente, a mdia do conjunto de pixels que constituem a pupila. Sendo assim,
quando a imagem binarizada e utilizando-se como limiar o menor valor entre os dois picos,
o resultado uma imagem que contm apenas a pupila.
27
4.3.4. ESTIMAO DO RAIO DA PUPILA
Utilizando o valor de limiar sugerido no item 4.3.3 possvel obter uma
estimativa da rea da pupila, distorcida apenas pela regio de reflexo e por alguns clios um
pouco mais escuros. Essa estimativa permite reduzir o espao de busca por crculos
candidatos a pupila, pois a busca deixa de ser feita por todo o intervalo possvel em que se
pode encontrar o raio da pupila, para ser feita no raio estimado com uma pequena tolerncia
pr-definida.
Para demonstrar a importncia do contraste da imagem e da separao entre os
mximos locais, a Figura 23 e a Figura 24 fazem uma comparao entre os valores mximos e
mnimos permitidos para o limiar de binarizao.
Figura 23 Resultado da binarizao da Figura 21. (a) limiar mnimo 43, (b) limiar mximo
75. Abaixo de cada pupila apresentado o histograma da imagem original e o ponto onde foi
aplicado o limiar de binarizao.
28
Figura 24 Resultado da binarizao da Figura 22. (a) limiar mnimo 35, (b) limiar mximo
46. Abaixo de cada pupila apresentado o histograma da imagem original e o ponto onde foi
aplicado o limiar de binarizao.
29
Subindo: Ocorre quando o valor do prximo elemento do vetor de entrada maior que o
valor atual.
Descendo: Ocorre quando o valor do prximo elemento do vetor de entrada menor que o
valor atual.
Plano Subindo: Ocorre quando o valor do prximo elemento do vetor de entrada igual
ao valor atual e o estado anterior era Subindo.
Plano Descendo: Ocorre quando o valor do prximo elemento do vetor de entrada igual
ao valor atual e o estado anterior era Descendo.
h[n+1]=h[n]
Plano
incio
h[n+1]=h[n]
h[n+1]<h[n]
Plano
subindo
h[n+1]>h[n]
h[n+1]<h[n]
Mximo Local Detectado
listamax.adicionar( (n+ip)/2 )
h[n+1]<h[n]
Descendo
h[n+1]>h[n]
h[n+1]=h[n]
Incio de Plano
ip = n
h[n+1]>h[n]
h[n+1]>h[n]
Mnimo Local Detectado
listamin.adicionar(n)
h[n+1]<h[n]
Mximo Local Detectado
listamax.adicionar(n)
h[n+1]=h[n]
Incio de Plano
ip = n
Subindo
h[n+1]>h[n]
Mnimo Local Detectado
listamin.adicionar( (n+ip)/2 )
h[n+1]<h[n]
Plano
descendo
h[n+1]=h[n]
30
No histograma de uma imagem de ris, o primeiro mximo local encontrado
aquele associado pupila. Ou seja, os pixels que formam a pupila possuem nveis de cinza
prximos ao nvel de cinza em que este mximo se encontra. Neste trabalho, este nvel de
cinza chamado de mdia estimada da pupila, e ela tende a se aproximar da mdia real
quando diminuem os reflexos na regio da pupila.
Ao primeiro mnimo local encontrado aps o mximo associado pupila
atribudo o limiar de binarizao da pupila. O nmero de pixels que possuem nveis de cinza
abaixo desse limiar considerado a rea estimada da pupila (em pixels). Dividindo-se esse
valor por e extraindo-se a raiz quadrada obtm-se o raio estimado da pupila.
4.3.5. CLCULO DO CENTRIDE DA IMAGEM
Tendo determinado o limiar de binarizao, o prximo passo o clculo do
centride da imagem. Em geometria, o centride de um objeto R, pertencente a um espao ndimensional, a interseco de todos os hiperplanos que dividem R em quantidades iguais de
movimento com relao ao hiperplano. Quando o objeto possui densidade uniforme, o centro
de massa coincide com o centride do objeto. No caso da imagem limiarizada da pupila,
pode-se fazer uma analogia do nvel de cinza preto de cada pixel com a densidade de massa
uniforme. Dessa forma, dada a sua geometria circular, o centride da imagem tende a se
aproximar do centro da circunferncia que circunscreve a pupila.
As equaes (1) e (2) fornecem as coordenadas (c x , c y ) do centride da
imagem limiarizada da ris nas direes horizontal e vertical, respectivamente.
J
cx =
j I ( j, k )
j =1 k =1
J
I ( j, k )
(1)
j =1 k =1
k I ( j, k )
cy =
j =1 k =1
J
I ( j, k )
(2)
j =1 k =1
31
Dessa forma, fez-se um estudo para avaliar qual a variao mdia entre as
coordenadas do centride e do centro da pupila. Os centrides foram obtidos
matematicamente atravs da imagem binarizada, mas o centro da imagem precisa ser
informado a priori para que o estudo seja realizado. Por isso foram utilizadas as 756 imagens
da base de dados CASIA, que foram limiarizadas e as coordenadas do centro da imagem
determinadas manualmente, conforme explicado no item 4.2.
A Figura 26 apresenta o grfico da distncia do centride ao centro da pupila
versus o nmero de imagens.
32
A Figura 27 apresenta uma imagem de ris em que seus parmetros foram
determinados (bordas da ris e da pupila). O quadrado branco com 41 pixels de lado revela na
imagem a regio de busca pela pupila. Percebe-se assim que o espao de busca diminui
consideravelmente em relao busca na imagem toda.
33
Seja uma tripla t = ( x, y , r ) pertencente ao espao de busca da pupila, em que x
e y so as coordenadas do centro e r o raio da pupila. Atravs do algoritmo de Bresenham
(1965) so obtidos os pontos da circunferncia definida por essa tripla. A seguir procura-se
por pares de vetores de gradiente. Conforme ilustra a Figura 28, para que dois vetores sejam
considerados um par necessrio que eles estejam na mesma direo e possuam sentidos
opostos. Experimentalmente detectou-se que comum a existncia de pupilas que no
formam um crculo perfeito (como por exemplo, a pupila da Figura 29). Por isso, optou-se por
estabelecer uma tolerncia para que a direo dos vetores seja considerada a mesma, ou seja,
definiu-se um ngulo mximo de desvio () que os vetores podem ter em relao direo
radial para que sejam considerados um par. Assim, se p1 for um ponto no primeiro octante, e
p 2 um ponto no quinto octante (ou qualquer combinao de octantes simtricos), pode-se
afirmar que eles formam um par de vetores se d 180 o ou d , onde d resto da
diviso entre a diferena do ngulo de p1 e o ngulo de p 2 por 180 (resto de
p1 p 2
).
180
Cada uma das 15.129 triplas existentes no espao (cada combinao possvel
para x, y, r ) avaliada e associada a um escore, com valor proporcional ao nmero de pares
de vetores encontrados. Ento as triplas so ordenadas por ordem de maior escore e apenas as
primeiras 20 triplas so armazenadas. O valor 20 foi determinado empiricamente de forma a
no comprometer a eficincia da localizao, pois considerando-se um valor muito baixo
pode-se descartar a tripla procurada e, ao contrrio, considerando-se um valor muito alto
pode-se avaliar todas as 15.129 triplas no pior caso, o que impediria o sistema de executar em
tempo real a 30 quadros por segundo.
34
uma pupila. Apenas o escore da tripla no suficiente para rejeitar uma imagem, por isso
definiu-se um novo parmetro chamado de DM mdulo da diferena entre as mdias. A DM
consiste no valor absoluto da subtrao do valor mdio dos pixels que formam a pupila do
valor mdio estimado da pupila, obtido atravs do primeiro mximo local do histograma da
imagem (item 4.3.4). Assim, se esse parmetro possuir um valor baixo, significa que a mdia
estimada, observada no histograma da imagem (Figura 29), est muito prxima da mdia dos
nveis de cinza da pupila, efetivamente contados na imagem.
Figura 29 Esquerda: Imagem de uma ris onde as linhas contornam a pupila e a ris. Direita:
Histograma da imagem da esquerda, onde o nvel de cinza do primeiro pico indica a mdia
estimada da pupila.
35
36
Tabela 2 Parcela inicial dos dados obtidos aps a classificao manual das 4018 imagens da
base de imagens BDIRIS.
DM
Probabilidade de acerto
dada uma DM p( A | DM )
Probabilidade de erro
dada uma DM p(E | DM )
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
0,995
0,999
1,000
0,995
1,000
1,000
0,967
0,987
0,983
0,900
0,968
0,762
0,846
0,563
0,600
0,375
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,005
0,001
0,000
0,005
0,000
0,000
0,033
0,013
0,017
0,100
0,032
0,238
0,154
0,438
0,400
0,625
1,000
1,000
1,000
1,000
1,000
1,000
1,000
37
com a menor probabilidade de erro (em que a amostra da populao foi baseada na BDIRIS)
qual delas representa mais corretamente a pupila, ou se nenhuma delas a representa.
Pelo Teorema de Bayes (2.7) tem-se que p( A | DM ) =
p(DM | A) p ( A)
onde
p(DM )
p( DM | E ) p (E )
, exceto pela substituio das probabilidades
p(DM )
38
Rejeio (%)
20
25
30
35
40
45
50
55
60
3
4
4
4
3
3
3
3
3
Acertos (%)
Centro
Raio
90
90
91
91
91
90
91
91
90
81
81
81
81
82
81
81
81
80
39
4.3.8. DETERMINAO DOS PARMETROS DA RIS
A deteco da ris consiste em encontrar o raio e as coordenadas do centro da
ris. A determinao desses parmetros s possvel se a localizao da pupila for bem
sucedida, pois parte-se do princpio de que a ris e a pupila so dois crculos concntricos ou
quase concntricos. Assim, conhecendo-se o centro da pupila, qualquer tipo de busca pelos
parmetros da ris resume-se ao espao delimitado pelas redondezas do centro da pupila.
O primeiro passo para a deteco da ris a seleo de uma fatia horizontal
de vinte e uma linhas da imagem na altura do centro da pupila, como apresentada na Figura
32. Nota-se que as bordas entre a ris e a esclera so bastante suaves, o que dificulta a
definio de um valor de limiar, principalmente na presena de reflexos de iluminao nessa
regio.
Figura 32 Fatia da imagem usada para fazer a deteco. As bordas da pupila so facilmente
perceptveis, no entanto as fronteiras da ris no apresentam bordas ntidas.
O prximo passo transformar essa fatia em um vetor (Figura 33). Para isso,
calcula-se a mdia de cada coluna dessa fatia, que ser o valor do vetor naquela posio.
Nessa etapa existe um compromisso entre o nmero de linhas que compem a fatia e a
nitidez da borda da ris, pois quanto maior a altura da fatia, mais imune a rudos ser o
resultado, porm, como a borda da ris circular, ela ser suavizada e se tornar menos ntida.
Para uma ris com dimetro aproximado de 200 pixels, experimentalmente detectou-se que
uma fatia com altura de 21 pixels no compromete a nitidez da borda e pouco sensvel a
rudos.
40
Figura 33 Vetor gerado a partir da fatia da imagem. O pico estreito entre 180 e 210
causado pelo reflexo do sistema de iluminao. No entanto ele no interfere na localizao,
pois a busca pela ris inicia com um raio maior que o da pupila.
41
opostos, em direo das extremidades do vetor. Com isso, um novo vetor gerado, onde o
valor de cada ponto igual mdia dos valores das duas janelas.
A aplicao do filtro de mdia no vetor apresentado na Figura 34 gera o vetor
representado pelo grfico da Figura 35. Nota-se que esse grfico simtrico, e que apresenta
picos candidatos a representarem as borda da ris. Quando existem apenas dois candidatos,
no existe dvida quanto a posio das bordas, pois um deles representa a borda direita e o
outro a esquerda. No entanto, quando existirem quatro, seis ou mais picos, calcula-se os pares
de vetores de gradiente para os candidatos (como explicado no item 4.3.6) e atribui-se a borda
da ris para o par de picos que possuir o maior escore.
42
4.3.9. ESTIMATIVA DE FOCO
Conforme mencionado no item 4.1, a profundidade de campo (regio em que a
imagem aparece com nitidez) do sistema ptico para captura de ris de aproximadamente 1
cm, para imagens capturadas a 30 cm da lente. difcil para uma pessoa se posicionar sem
suporte exatamente a essa distncia e permanecer em foco e centralizada por alguns segundos
para que a sua ris seja registrada. Por isso, optou-se por desenvolver uma rotina para detectar
se uma imagem do vdeo que est sendo capturado est em foco.
Entre os mtodos de estimativa de foco existentes, pode-se citar aquele
desenvolvido por Park & Kim (2005), em que utilizaram o reflexo da iluminao na retina
para determinar se a imagem encontra-se em foco. Quando em foco, o reflexo apresenta-se
como um ponto branco na imagem, e quando fora de foco esse reflexo apresenta-se com um
pequeno disco. Pode-se citar tambm o mtodo utilizado por Daugman (2001), em que se
determina o foco de uma imagem atravs da potncia espectral obtida pela transformada de
Fourier da imagem.
O mtodo desenvolvido nesse trabalho baseia-se em caractersticas locais da
imagem para determinar o foco. O foco calculado aps a localizao da ris, e seu valor
obtido avaliando-se a nitidez das bordas verticais da pupila. O objetivo desse mtodo
atribuir um valor de foco para cada imagem, de forma que uma entre as diversas imagens
fornecidas pela cmera possa ser selecionada.
43
Toma-se a mdia de cinco (valor obtido empiricamente) pixels esquerda da
borda, comparando-se com a mdia de cinco pixels direita. O valor absoluto da diferena
dessas mdias constitui o foco dessa borda. Da mesma forma calcula-se o foco da borda
oposta. O menor deles considerado o foco da imagem, pois nos casos em que a pupila for
localizada incorretamente e uma das bordas ficarem posicionada sobre uma regio homognea
da imagem, o resultado ser um baixo valor para o foco.
4.4. INTERFACE DE CONTROLE DA CAPTURA DE IMAGENS
O algoritmo de deteco foi implementado com linguagem de programao
C++, e encapsulado na forma de um Filtro de Transformao DirectX. DirectX uma
tecnologia do sistema operacional Windows que permite a manipulao de vdeos e sons na
forma de um grafo. De fato, o dispositivo de captura, os filtros de transformao, e o monitor
do microcomputador so nodos desse grafo. Uma das grandes vantagens dessa tecnologia a
possibilidade de criao de grafos em que os seus nodos so independentes entre si.
Assim, fica a cargo de um software aplicativo (escrito em qualquer linguagem
de programao que suporte DirectX) montar o grafo de captura, inserir os filtros desejados e
implementar a interface com o usurio.
A interface de controle da captura de imagens desenvolvido nesse trabalho foi
escrita em linguagem de programao C#.NET, na forma de um controle Windows. A
interface utiliza o grafo DirectX apresentado na Figura 37 e recebe mensagens do filtro de
deteco a cada instante em que uma imagem localizada. A mensagem enviada pelo filtro
contm os valores dos parmetros da ris e da pupila, assim como o valor estimado do foco.
Ao receber uma mensagem, o controle desenha a imagem em sua rea cliente, desenha os
crculos correspondentes s bordas da pupila e da ris, e lana um evento para sinalizar a
disponibilidade de uma imagem.
44
deteco da ris, o terceiro transforma imagens de 8 para 32 bits, e o ltimo representa o
monitor de vdeo.
Assim, cabe ao aplicativo que contm o controle capturar esse evento decidir o
que fazer com os dados fornecidos. Tendo assim um controle Windows, foi desenvolvido um
aplicativo de exemplo para demonstrar o funcionamento do sistema e realizar testes de
captura. A tela principal da interface exibida na Figura 38.
45
Figura 39 A Caixa de Dilogo de Cadastro permite que seja tirada uma foto da pessoa, e que
sejam capturadas as imagens de ris.
46
Figura 40 Caixa de dilogo de captura de ris. Em sua rea cliente est o controle Windows
que gera eventos contendo informaes sobre os parmetros da ris e da pupila, assim como o
valor estimado do foco, distncia do centro da pupila ao centro da imagem, quadros por
segundo, centride, e regio de busca pelo centro da pupila.
47
Tambm possvel pesquisar uma pessoa na base de dados. Para isso, clica-se
no boto capturar da tela principal, e depois de obtida uma imagem efetua-se a busca
selecionando-se a opo Procurar. Os registros encontrados so ento apresentados no
quadro Resultado da Busca.
CAPTULO 5
5 RESULTADOS
5.1. VALIDAO DA LOCALIZAO DA RIS
A validao do algoritmo de localizao est dividida em duas partes: gerao
do vdeo com imagens artificiais de ris e o processamento do vdeo utilizando o algoritmo de
localizao.
5.1.1. GERAO DO VDEO COM IMAGENS ARTIFICIAIS DE RIS
Para gerar o vdeo com imagens artificiais criou-se um componente DirectX,
escrito em linguagem C++, que fornece imagens simulando aquelas de uma cmera. As
imagens geradas so semelhantes ao modelo apresentado na Figura 41.
Figura 41 Imagem artificial de ris que compe o vdeo usado para a validao do algoritmo
de deteco.
50
5.1.2. PROCESSAMENTO DO VDEO
O GraphEdit um programa distribudo junto com o DirectX e tem a
finalidade de simular fluxos de udio e vdeo. Com o GraphEdit criou-se um grafo
(semelhante ao apresentado na Figura 37) em que o vdeo gerado encontra-se na entrada do
componente que implementa o algoritmo de localizao. Ao executar o grafo, o componente
de localizao processa cada quadro do vdeo e armazena as informaes de localizao em
um arquivo. Como os parmetros da pupila e da ris do vdeo artificial so conhecidos, fez-se
uma comparao entre os valores reais e os obtidos atravs do algoritmo de localizao. O
resultado da comparao est apresentado na Figura 42.
Este grfico apresenta os erros obtidos para os raios da pupila e da ris, assim
como os erros das coordenadas de seus centros. Observa-se que existe um grande nmero de
acertos nos raios da pupila e da ris, e uma freqncia elevada de erros por trs pixels da
coordenada x da ris. Observando-se as imagens constatou-se que esse um erro de tendncia
em que o centro da ris localizado pouco esquerda (trs pixels) de sua posio exata.
Entre as 500 imagens, em uma delas no foi possvel localizar a pupila, e em
outra no foi detectada a ris. Em duas imagens houve um erro de quatro pixels no clculo da
coordenada x, assim como em duas imagens houve o mesmo erro no raio da ris.
51
5.2. VALIDAO DO MTODO DE CAPTURA DE IMAGENS
Foram realizados testes de captura de imagens em ambiente fechado, em que
participaram 6 pessoas, sendo que trs delas possuam ris de cor clara e o restante de cor
escura. O teste constituiu em posicionar a pessoa em frente cmera (sem culos e sem lentes
de contato), tirar uma foto, capturar o olho direito e depois o olho esquerdo.
Depois de posicionadas em frente cmera, as pessoas levaram em torno de 20
segundos para ter cada uma de suas ris capturadas. O processamento de cada quadro de
320240 pixels levou em torno de 11 ms em um Notebook Sony Vaio SZ160P, com
processador Intel Centrino Duo Core 1,86 GHz. Isso faz com que a captura ocorra em tempo
real a uma taxa de 29 quadros por segundo.
A principal dificuldade para a captura de imagens fazer com que a pessoa
centralize o seu olho na imagem e ento entre em foco, projetando-se para frente ou para trs
at que uma imagem de boa qualidade possa ser gerada. Alm disso, o monitor de vdeo em
que a pessoa recebe a realimentao de sua posio (Figura 43) gera imagens espelhadas,
ou seja, quando a pessoa desloca-se para a esquerda, a sua imagem desloca-se para a direita, e
vice-versa. Isso gera grande desconforto e uma sensao de que a correo no posicionamento
no surte efeito na imagem. Portanto, pessoas habituadas a realizar este procedimento tm
suas ris capturadas com mais facilidade, reduzindo o tempo de captura. Durante o teste, uma
pessoa no pde ser cadastrada no sistema, pois no conseguiu posicionar-se corretamente
diante da cmera. Isto plausvel, pois a captura realizada com o usurio sem culos ou
lentes de contato, o que causa grande dificuldade (principalmente quando a pessoa portadora
de astigmatismo) para fazer a sua ris entrar na regio de foco da lente. Aparentemente um
sistema de aquisio de imagens com teleobjetivas de zoom automtico poderia corrigir essa
deficincia de captura, contudo isso no foi avaliado nesse trabalho.
52
53
que a rea da pupila torna-se pequena e assim o pico do histograma, formado pelos pixels
que constituem a pupila, torna-se tambm pequeno, sendo confundido com o rudo e
eliminado pela suavizao do histograma (Figura 44).
Figura 44 Histograma de uma imagem com pupila pequena. Nesse histograma o primeiro
mximo local que representa a pupila to pequeno que eventualmente eliminado com o
rudo.
54
foco e finalizando quando a imagem ficar completamente fora de foco. O grfico gerado a
partir dos dados obtidos nesse experimento est apresentado na Figura 45.
55
Neste grfico, o valor do foco (em nveis de cinza) dado pela ordenada e o
nmero da imagem na abscissa. Quando o olho est muito prximo da lente o foco tem um
valor baixo, que aumenta progressivamente at atingir o ponto de mximo, para ento
decrescer novamente. Essas curvas mostram que quando a imagem da ris passa por um valor
mximo de nveis de cinza o qual corresponde ao foco, o mtodo de clculo retorna um valor
mximo.
Segundo as recomendaes do item anexo A.4 do padro INCITS M1/030590, a imagem deve ter no mnimo 90 nveis de cinza de separao entre a esclera e a ris, e
no mnimo 50 nveis entre a ris e a pupila. Com o sistema de aquisio utilizado no trabalho,
o maior valor de foco obtido foi de 45 nveis (como pode ser visto no grfico da
Figura 45), portanto no foi possvel obter imagens como aquelas
recomendadas pelo INCITS. Para obter imagens conforme as recomendaes do INCITS
necessrio que a lente e a cmera sejam adequadas para operar na faixa de infravermelho, e
que a iluminao seja uniforme e com potncia suficiente para causar tal contraste na imagem.
Uma alternativa, que no foi abordada nesse trabalho, realizar a captura das imagens na
faixa de iluminao visvel.
Testes de captura em ambiente fechado foram realizados (sem a interferncia
da iluminao solar) com dez pessoas. Quando o teste realizado em ambiente fechado,
significa dizer que a ris ser iluminada apenas pelo sistema de iluminao infravermelha
construdo. Empiricamente, o valor mnimo de foco exigido para a captura foi ajustado para
35 nveis de cinza. Nesses termos, todas as imagens capturadas apresentaram-se em foco, o
que comprova a eficincia desse mtodo, condicionada a esta restrio.
CAPTULO 6
6 CONCLUSO
6.1. DISCUSSES
Neste trabalho foi desenvolvido um sistema para a captura automtica de
imagens de ris para fins biomtricos. O tempo para determinar a existncia de uma ris em
uma imagem e calcular os seus parmetros assim como o seu foco ficou em torno de 11 ms
em um computador Intel Centrino Duo Core 1,86 GHz. Assim, suficiente que uma pessoa
permanea poucos instantes com o seu olho centralizado e no ponto focal diante da cmera
para ter a sua ris capturada. Para a deteco dos crculos referentes pupila e ris foi
utilizado o mtodo de Pares de Vetores de Gradiente (RAD et. al, 1998) auxiliado pelo
algoritmo de Bresenham (1965) para crculos, como uma alternativa Transformada de
Hough Circular (BALLARD, 1981).
Determinar a qualidade das imagens a etapa mais difcil de ser realizada em
um sistema biomtrico. Por isso foram determinadas algumas caractersticas que afetam
diretamente a qualidade assim como formas de mensur-las, tais como a estimativa de foco e
a forma do histograma. Mesmo assim, essas caractersticas so vlidas apenas para imagens
em que o olho preenche grande parte da rea da imagem.
A estimativa de foco realizada somente nos casos em que a pupila for
localizada corretamente, pois depende diretamente desses parmetros. Por isso, esse mtodo
no adequado para tentar avaliar o foco antes da deteco dos parmetros. No entanto, este
mtodo ajuda a rejeitar algumas imagens localizadas incorretamente, naqueles casos em que o
raio da pupila erroneamente estimado. Assim, considerando que o raio da pupila real
maior que o da pupila estimada, pelo menos um dos estimadores de foco apresenta resultado
muito baixo, o que permite que a imagem seja rejeitada.
Tambm foi observado nos testes que eventualmente so capturadas imagens
no instante em que a pessoa est olhando para o lado. Isso ocorre quando o raio da pupila
torna-se muito pequeno, e uma conseqncia do algoritmo de deteco de crculos atravs
de pares de vetores de gradiente. De fato, quanto menor o crculo, menos pares de gradiente
ele possui para ser avaliado. Como poucos pares de vetores so suficientes para produzir uma
58
tripla com escore alto, isso gera um falso candidato. Uma soluo para esse problema
capturar imagens de tamanho maior, como por exemplo, 640480 pixels. Assim, o raio
mnimo admitido para a pupila seria de 30, e no 15 pixels, o que se espera que elimine o
problema, alm de melhorar a qualidade das imagens.
O padro INCITS M1/03-0590 para imagens de ris sugere que imagens de alta
qualidade devem ter 200 pixels ou mais como dimetro da ris, o que indica uma resoluo de
aproximadamente 20 pixels por milmetro. Observa-se que essa resoluo a mesma utilizada
para capturar imagens em grandes sistemas de reconhecimento de impresses digitais.
No algoritmo de deteco percebe-se um erro de tendncia. A causa desse erro
o empate do escore das triplas em todos os critrios utilizados. Assim, fica claro que seria
interessante utilizar mais um critrio, dessa vez com capacidade de discriminar as triplas pela
sua posio. Atualmente, se nove triplas vizinhas possurem o mesmo escore, a primeira delas
seria a escolhida. Um aperfeioamento poderia selecionar aquela que possusse a menor
distncia em relao s outras. Uma forma mais simples poderia apenas deslocar os centros
uma unidade para baixo e para a direita, considerando que este no um erro aleatrio e sim
de tendncia.
6.2. CONCLUSO
O software para a captura automtica de imagens de ris foi desenvolvido e
testado no prottipo construdo e permite a captura de imagens sem a interveno do
operador. O algoritmo de localizao foi validado no simulador de ris proposto e determinou
os parmetros de 99% das imagens avaliadas.
6.3. TRABALHOS FUTUROS
Realizar a deteco em imagens de tamanho 640480 (tamanho VGA) permite
que o usurio tenha uma mobilidade maior, ou seja, ele no precisaria centralizar exatamente
o seu olho para realizar a captura. Alm disso, a captura de imagens maiores aumenta a
qualidade da imagem e do sistema como um todo, pois tende a reduzir as taxas de falsa
aceitao e de falsa rejeio do software. Sugere-se que para processar uma imagem VGA, a
mesma seja reduzida para 320240 e, depois de determinados, os parmetros passem por um
refinamento na imagem de tamanho original. Infelizmente no comum atualmente encontrar
59
placas de vdeo que capturem imagens VGA de boa qualidade a uma taxa de 30 quadros por
segundo e ainda assim disponibilizando tempo hbil para o processamento dos quadros.
Detectar plpebras rapidamente importante para alertar o usurio (atravs de
um sinal sonoro ou luminoso) para abrir ao mximo o seu olho no instante da captura. Assim
evita-se tambm que os clios interfiram na deteco dos parmetros.
Estimar o foco com diferentes nveis de iluminao e com diferentes cores de
ris interessante por apresentar a variao do resultado em funo de fatores encontrados no
dia a dia. O primeiro por influncia da luz solar, e o segundo porque de fato as ris de olhos
azuis so mais escuras (do ponto de vista infravermelho) do que as de cor marrom.
Outra sugesto de trabalho futuro aperfeioar o simulador de ris para que as
imagens geradas sejam mais prximas da realidade. Por exemplo, pode-se aplicar efeitos de
iluminao no uniforme, distoro por rudo, suavizao de bordas, e variao de foco.
CAPTULO 6
REFERNCIAS BIBLIOGRFICAS
CHO, Dal Ho, PARK, Kang Ryoung, RHEE, Dae Woong (2005), Real-Time Iris Localization
for Iris Recognition in Cellular Phone, Sixth International Conference on Software
62
DUDA, Richar O., HART, Peter E. (1975), Use of the Hough Transform to Detect Lines and
Curves in Pictures, Communications of the ACM 15, p. 11-15.
DUDA, Richar O., HART, Peter E., STORK, David G. (2001), Pattern Classification, John
Wiley & Sons Inc., 2 Edio.
MARQUES FILHO, Og, VIEIRA NETO, Hugo (1999), Processamento Digital de Imagens,
Editora Brasport Livros, Rio de Janeiro.
GONZALEZ, Rafael C., WOODS, Richard E. (2000), Processamento de Imagens Digitais,
Editora Edgard Blcher Ltda., So Paulo.
INCITS M1/03-0590 (2003), InterNational Committee for Information Technology
Standards, Iris Image Interchange Format, Anexo A, p. 13.
KEE, Gyundo, BYUN, Yungcheol, LEE, Kwanyong, LEE, Yillbyung (2001), Improved
Techniques for an Iris recognition System with High Performance, Proceedings of the
MIRA JNIOR, Joaquim de, MAYER, Joceli (2003), Image Feature Extraction for
application of Biometric Identification of Iris: A Morphological Approach, XVI
63
PARK, Kang Ryoung, KIM, Jaihie (2005), A real-time focusing algorithm for iris recognition
camera, IEEE Transactions on Systems, Man and Cybernetics, Volume 35, p. 441-
444.
PRATT, William K. (2001), Digital Image Processing: PIKS Inside, 3 Edio. John Wiley &
Sons, Inc., ISBN: 047137407-5.
RAD, Ali Ajdari, FAEZ, Karim, QARAGOZLOU, Navid (2003), Fast Circle Detection
Using Gradient Pair Vectors, Proc. VII Digital Image Computing, Sydney, p. 879-
887.
RUSS, John C. (1998), The Image Processing Handbook, 3 Edio, CRC Press LLC, ISBN:
084932532-3.
THE IMAGING SOURCE EUROPE GMBH (2003), Lenses: Selection and Setup,
http://www.1394imaging.com
THEODORIDIS, Sergios, KOUTROUMBAS, Konstantinos (2003), Pattern Recognition,
Academic Press, 2 Edio.
WILDES, Richard P. (1997), Iris Recognition: An Emerging Biometric Tecnology,
Proceedings of the IEEE, Volume 85, n 9.
WILDES, Richard P., ASMUTH, J. C., GREEN, G. L., HSU, S. C. (1994), A System for
Automated Iris Recognition, David Sarnoff Research Center Inc., Princeton, NJ, IEEE.
ZHANG, Pengfei, LI, Qiuming (2005), Resarch on Iris Image Preprocessing Algorithm,
Proceedings of the Fourth International Conference on Machine Learning and
Cybernetics, p. 5220-5224, Guangzhou-China.
RESUMO
Nesta dissertao prope-se um algoritmo para capturar imagens do olho e
localizar de forma automtica a pupila e a ris. O algoritmo proposto tem aplicaes em
sistemas que utilizam as informaes geomtricas do olho (raio e coordenadas do centro da
pupila e da ris), como por exemplo, sistemas de reconhecimento de ris. Para o
desenvolvimento do algoritmo, montou-se um prottipo para aquisio das imagens composto
por uma cmera de vdeo, filtro infravermelho, sistema de iluminao, monitor, objetiva de
100 mm, e uma placa de captura ligada ao computador. O mtodo proposto baseia-se na
reduo do espao de busca para que o processamento de uma imagem possa ser avaliado em
tempo real (30 quadros por segundo). Por isso, realizou-se um estudo em 756 imagens da base
de dados CASIA para utilizar o centride da imagem como uma estimativa para o centro da
pupila e um estudo baseado no histograma da imagem para estimar do raio da pupila. Essas
estimativas permitem que a imagem seja processada de forma rpida, e capturada se
determinados critrios de qualidade forem satisfatrios. Um desses critrios um parmetro
estatstico chamado de diferena das mdias, que foi determinado atravs do estudo de 4018
imagens da base de dados BDIRIS. O outro critrio a estimativa de foco, que uma medida
da nitidez da borda da pupila. Esses critrios permitem aceitar ou rejeitar uma imagem, o que
essencial em um sistema de aquisio automtica de imagens. O algoritmo desenvolvido foi
implementado e testes revelam que o sistema captura imagens de ris em tempo real, bastando
que para isso a pessoa posicione-se corretamente diante da cmera de vdeo.
PALAVRAS-CHAVE
Biometria, captura da ris, reconhecimento de ris, estimativa de foco, tempo real.
REAS DE CONHECIMENTO
10301038 - Anlise de Algoritmos e Complexidade de Computao
10303057 - Processamento Grfico (Graphics)
10303006 - Metodologia e Tcnicas da Computao
2006
N. 419