Anda di halaman 1dari 81

UNIVERSIDADE TECNOLGICA FEDERAL DO PARAN

Programa de Ps-Graduao em Engenharia Eltrica e Informtica Industrial


DISSERTAO
apresentada UTFPR
para obteno do ttulo de
MESTRE EM CINCIAS
por
ANDR ZANIN ROVANI

SISTEMA PARA CAPTURA AUTOMTICA DE IMAGENS DE RIS

Banca Examinadora:
Presidente e Orientador:
Prof. Dr. Humberto Remigio Gamba

UTFPR

Examinadores:
Prof. Dr. Og Marques Filho
Prof. Dr. Maurizio Tazza

Curitiba, 9 de novembro de 2006

FAU - EUA
UTFPR

ANDR ZANIN ROVANI

SISTEMA PARA CAPTURA AUTOMTICA DE IMAGENS DE RIS

Dissertao apresentada ao Programa de PsGraduao em Engenharia Eltrica e Informtica


Industrial da Universidade Tecnolgica Federal
do Paran, como requisito parcial para a
obteno do ttulo de Mestre em Cincias
rea de Concentrao: Informtica Industrial.
Orientador: Prof. Dr. Humberto Remigio Gamba

Curitiba
2006

R873 Rovani, Andr Zanin


Sistema para captura automtica de imagens de ris / Andr Zanin Rovani.
Curitiba. UTFPR, 2006
XV, 63 f. : il. ; 30 cm
Orientador: Prof. Dr. Humberto Remigio Gamba
Dissertao (Mestrado) Universidade Tecnolgica Federal do Paran. Curso
de Ps-Graduao em Engenharia Eltrica e Informtica Industrial. Curitiba,
2006.
1. Processamento de imagens Tcnicas digitais. 2. Informtica industrial. 3.
Algoritmos. 4. Estrutura do olho humano. 5. ris. 6. Pupila. 7. Biomtrica. I.
Gamba, Humberto Remigio, orient. II. Universidade Tecnolgica Federal do
Paran. Curso de Ps-Graduao em Engenharia Eltrica e Informtica Industrial. III. Ttulo
CDD: 621.367

iv

Este trabalho dedicado Karine.

iii

AGRADECIMENTOS
Agradeo a minha famlia pelo incentivo e apoio para a concluso desse curso.
Agradeo a todos os meus amigos que contriburam com idias e
disponibilizaram seu tempo para a captura de imagens.
Agradeo ao Instituto de Automao da Academia Chinesa de Cincias pelo
fornecimento da base de imagens CASIA.
Agradeo aos revisores do trabalho Andressa Zanin Rovani, Karine Greice
Vieira, Tomas Fernandes, e Rafael Locks Lange pelas correes e pela pacincia.
Agradeo especialmente ao professor e orientador Dr. Humberto Remigio
Gamba por apoiar este projeto desde o incio.
E por fim, agradeo a todos que de alguma forma contriburam para a
realizao deste trabalho.

SUMRIO
LISTA DE FIGURAS ...........................................................................................................ix
LISTA DE TABELAS......................................................................................................... xii
RESUMO........................................................................................................................... xiii
ABSTRACT........................................................................................................................xiv
1 INTRODUO...................................................................................................................1
1.1. MOTIVAO .....................................................................................................1
1.2. OBJETIVO DO TRABALHO..............................................................................2
1.3. ESTRUTURA DA DISSERTAO ....................................................................2
2 FUNDAMENTAO TERICA .......................................................................................3
2.1. INTRODUO ...................................................................................................3
2.2. ESTRUTURA DO OLHO HUMANO..................................................................3
2.3. PARMETROS DE UMA LENTE......................................................................3
2.4. FILTRAGEM ESPACIAL ...................................................................................5
2.5. TRANSFORMADA DE HOUGH........................................................................5
2.6. HISTOGRAMA...................................................................................................7
2.7. TEOREMA DE BAYES ......................................................................................7
2.8. MQUINAS DE ESTADO FINITO ....................................................................8
2.9. ALGORITMO DE BRESENHAM PARA CRCULOS........................................9
3 REVISO DA LITERATURA..........................................................................................13
3.1. INTRODUO .................................................................................................13
3.2. MTODOS DE LOCALIZAO DE RIS .......................................................13
3.3. MTODOS DE ESTIMATIVA DE FOCO ........................................................17
4 MATERIAIS E MTODOS ..............................................................................................19
4.1. SISTEMA DE AQUISIO DE IMAGENS .....................................................19
4.2. BASES DE DADOS UTILIZADAS ..................................................................22
4.3. ESTRUTURA DO ALGORITMO DE LOCALIZAO ...................................23
4.3.1. FILTRO GAUSSIANO........................................................................24
4.3.2. CLCULO DO GRADIENTE SOBEL ...............................................25
4.3.3. HISTOGRAMA DA IMAGEM ...........................................................25
4.3.4. ESTIMAO DO RAIO DA PUPILA................................................27
4.3.5. CLCULO DO CENTRIDE DA IMAGEM .....................................30
4.3.6. DETERMINAO DOS PARMETROS DA PUPILA.....................32
4.3.7. LIMIARIZAO DO GRADIENTE ..................................................37
4.3.8. DETERMINAO DOS PARMETROS DA RIS ...........................39
4.3.9. ESTIMATIVA DE FOCO ...................................................................42
4.4. INTERFACE DE CONTROLE DA CAPTURA DE IMAGENS ........................43
5 RESULTADOS .................................................................................................................49
5.1. VALIDAO DA LOCALIZAO DA RIS ..................................................49
5.1.1. GERAO DO VDEO COM IMAGENS ARTIFICIAIS DE RIS ....49
5.1.2. PROCESSAMENTO DO VDEO........................................................50
5.2. VALIDAO DO MTODO DE CAPTURA DE IMAGENS ..........................51
5.3. AVALIAO DO ALGORITMO DE DETECO DE FOCO ........................53
6 CONCLUSO ..................................................................................................................57
6.1. DISCUSSES ...................................................................................................57
6.2. CONCLUSO ...................................................................................................58
6.3. TRABALHOS FUTUROS .................................................................................58
REFERNCIAS BIBLIOGRFICAS ..................................................................................61
vii

viii

LISTA DE FIGURAS
Figura 1 Estrutura do olho humano. ....................................................................................3
Figura 2 Definio da profundidade de campo de uma lente ...............................................4
Figura 3 Transformada de Hough. (PRATT, 2001) .............................................................6
Figura 4 Exemplo de mquina de estado finito para reconhecer seqncias
mpares de nmeros 1........................................................................................9
Figura 5 Esboo traado pela equao da circunferncia. ..................................................10
Figura 6 Algoritmo de Bresenham para crculos................................................................11
Figura 7 Crculo escuro sobre um fundo claro e seus vetores de gradiente.........................14
Figura 8 Imagem de ris transformada de coordenadas retangulares para
coordenadas polares. .......................................................................................16
Figura 9 Posio dos pontos pr-calculados de cada crculo com raio entre 10 e
107 pixels........................................................................................................17
Figura 10 - Princpio de funcionamento do clculo do foco proposto por Park &
Kim (2005)......................................................................................................18
Figura 11 Componentes do sistema de aquisio de imagens. ...........................................19
Figura 12 Cmera de vdeo utilizada no trabalho. Possui CCD com 1/3 de
polegada e 600 linhas de resoluo horizontal. ................................................19
Figura 13 Objetiva com distncia focal de 100 mm utilizada para obter as
imagens de ris. ...............................................................................................20
Figura 14 Monitor de vdeo de 2,5 usado para a realimentao do
posicionamento para o usurio.........................................................................20
Figura 15 Filtro infravermelho Hoya RM90 utilizado para impedir a entrada de
luz com comprimento de onda inferior a 900 nm. ............................................21
Figura 16 Curva de transmisso de radiao de dois modelos de filtro Hoya.
esquerda a curva do RM90, e direta a curva do modelo RM100. ...................21
Figura 17 Programa auxiliar desenvolvido para determinar manualmente os
parmetros das imagens da base de dados CASIA. ..........................................23
Figura 18 Diagrama de blocos do algoritmo de deteco...................................................24
Figura 19 Mscara do filtro gaussiano utilizado na filtragem.............................................24
Figura 20 Mscaras do operador de Sobel.........................................................................25
Figura 21 Imagem de boa qualidade e seu respectivo histograma. Dimenses:
320240 pixels, 256 tons de cinza. Fonte: BDIRIS..........................................26
Figura 22 Imagem de baixa qualidade e seu respectivo histograma. Dimenses:
320240 pixels, 256 tons de cinza. Fonte: BDIRIS..........................................26
Figura 23 Resultado da binarizao da Figura 21. (a) limiar mnimo 43, (b)
limiar mximo 75. Abaixo de cada pupila apresentado o
histograma da imagem original e o ponto onde foi aplicado o limiar
de binarizao. ................................................................................................27
Figura 24 Resultado da binarizao da Figura 22. (a) limiar mnimo 35, (b)
limiar mximo 46. Abaixo de cada pupila apresentado o
histograma da imagem original e o ponto onde foi aplicado o limiar
de binarizao. ................................................................................................28
Figura 25 Mquina de estados para deteco de mximos e mnimos locais. Na
figura, h o vetor de entrada, h[n] o valor atual do vetor, h[n+1]
o valor do prximo elemento do vetor, n o ndice do elemento atual
do vetor, incrementado a cada transio de estado, e listamax e
listamin so listas que armazenam os mximos e os mnimos,
respectivamente...............................................................................................29
ix

Figura 26 Comparao entre o centride (estimativa do centro) e o centro real


da pupila. Nota-se que na grande maioria das imagens o centride
est a uma distncia de quatro ou cinco pixels do centro da pupila...................31
Figura 27 Imagem de ris com seus parmetros determinados e o quadrado
delimitando a regio de busca pela pupila. .......................................................32
Figura 28 Direo dos vetores de gradiente em uma circunferncia...................................33
Figura 29 Esquerda: Imagem de uma ris onde as linhas contornam a pupila e a
ris. Direita: Histograma da imagem da esquerda, onde o nvel de
cinza do primeiro pico indica a mdia estimada da pupila. ...............................34
Figura 30 Grfico que apresenta a probabilidade de ocorrncia de um acerto e
de um erro em funo da DM. .........................................................................35
Figura 31 - Esquerda: Imagem de ris 019_2_2.bmp da base de dados CASIA.
Direita: Resultado da deteco de bordas atravs do operador de
Sobel (mdulo do gradiente)............................................................................38
Figura 32 Fatia da imagem usada para fazer a deteco. As bordas da pupila so
facilmente perceptveis, no entanto as fronteiras da ris no
apresentam bordas ntidas................................................................................39
Figura 33 Vetor gerado a partir da fatia da imagem. O pico estreito entre 180 e
210 causado pelo reflexo do sistema de iluminao. No entanto ele
no interfere na localizao, pois a busca pela ris inicia com um raio
maior que o da pupila. .....................................................................................40
Figura 34 Derivada do vetor gerado a partir da fatia da imagem. Notam-se
pequenos aglomerados que podem representar as bordas da ris.......................40
Figura 35 Resultado da deteco da ris. Os picos representam as bordas da ris,
observadas em seu dimetro horizontal. Neste caso em que aparecem
apenas dois picos, no existe dvida quanto localizao da ris. No
caso em que existe mais de dois picos, a busca deve ser realizada
atravs do clculo dos pares de gradientes. ......................................................41
Figura 36 Princpio de funcionamento do sistema de obteno do foco. (a)
Modelo da ris e as regies de interesse. (b) Situao de uma regio
de intresse que est em foco. (c) Situao de uma regio de interesse
que est fora de foco........................................................................................42
Figura 37 - Grafo DirectX do software de captura de imagens de ris. Da esquerda
para a direita, o primeiro bloco representa o hardware de captura de
imagens, o segundo o filtro de deteco da ris, o terceiro
transforma imagens de 8 para 32 bits, e o ltimo representa o
monitor de vdeo. ............................................................................................43
Figura 39 Tela principal do aplicativo de exemplo de captura automtica de
imagens. O software permite o cadastro de pessoas e tambm a
pesquisa de indivduos atravs da ris. .............................................................44
Figura 40 A Caixa de Dilogo de Cadastro permite que seja tirada uma foto da
pessoa, e que sejam capturadas as imagens de ris............................................45
Figura 41 Caixa de dilogo de captura de ris. Em sua rea cliente est o
controle Windows que gera eventos contendo informaes sobre os
parmetros da ris e da pupila, assim como o valor estimado do foco,
distncia do centro da pupila ao centro da imagem, quadros por
segundo, centride, e regio de busca pelo centro da pupila.............................46
Figura 42 Imagem artificial de ris que compe o vdeo usado para a validao
do algoritmo de deteco. ................................................................................49

Figura 43 Grfico que relaciona a freqncia de erros com o nmero de


imagens. ..........................................................................................................50
Figura 44 Prottipo do sistema de aquisio de imagens ...................................................52
Figura 45 Histograma de uma imagem com pupila pequena. Nesse histograma o
primeiro mximo local que representa a pupila to pequeno que
eventualmente eliminado com o rudo...........................................................53
Figura 46 Resultado de quatro experimentos em que o candidato, prximo da
cmera, foi se afastando lentamente, at que a imagem ficasse
completamente fora de foco. O experimento mostra que existem
mximos nos quatro eventos realizados. ..........................................................54

xi

LISTA DE TABELAS
Tabela 1 Formato do CCD e suas dimenses correspondentes.............................................4
Tabela 2 Parcela inicial dos dados obtidos aps a classificao manual das 4018
imagens da base de imagens BDIRIS...............................................................36
Tabela 3 Desempenho da deteco da ris para limiarizaes do gradiente entre
20 e 60% na base de dados CASIA..................................................................38

xii

RESUMO
Nesta dissertao prope-se um algoritmo para capturar imagens do olho e
localizar de forma automtica a pupila e a ris. O algoritmo proposto tem aplicaes em
sistemas que utilizam as informaes geomtricas do olho (raio e coordenadas do centro da
pupila e da ris), como por exemplo, sistemas de reconhecimento de ris. Para o
desenvolvimento do algoritmo, montou-se um prottipo para aquisio das imagens composto
por uma cmera de vdeo, filtro infravermelho, sistema de iluminao, monitor, objetiva de
100 mm, e uma placa de captura ligada ao computador. O mtodo proposto baseia-se na
reduo do espao de busca para que o processamento de uma imagem possa ser avaliado em
tempo real (30 quadros por segundo). Por isso, realizou-se um estudo em 756 imagens da base
de dados CASIA para utilizar o centride da imagem como uma estimativa para o centro da
pupila e um estudo baseado no histograma da imagem para estimar do raio da pupila. Essas
estimativas permitem que a imagem seja processada de forma rpida, e capturada se
determinados critrios de qualidade forem satisfatrios. Um desses critrios um parmetro
estatstico chamado de diferena das mdias, que foi determinado atravs do estudo de 4018
imagens da base de dados BDIRIS. O outro critrio a estimativa de foco, que uma medida
da nitidez da borda da pupila. Esses critrios permitem aceitar ou rejeitar uma imagem, o que
essencial em um sistema de aquisio automtica de imagens. O algoritmo desenvolvido foi
implementado e testes revelam que o sistema captura imagens de ris em tempo real, bastando
que para isso a pessoa posicione-se corretamente diante da cmera de vdeo.

xiii

ABSTRACT
In this dissertation a new algorithm is considered to capture images of the eye
and to locate automatically the pupil and the iris. The considered algorithm has applications in
systems that use the geometric data of the eye (radius and coordinates of the center of the
pupil and the iris), as for example iris based recognition systems. For the development of the
algorithm, a prototype for acquisition of the images was built, consisting of a video camera,
infrared filter, lighting system, monitor, 100 mm objective, and a frame grabber linked to the
computer. The considered method is based on the reduction of the search space so that the
processing of an image can be evaluated in real time (30 pictures for second). Therefore, a
study in 756 images of the database CASIA was done to use the centroid of the image as an
estimate for the center of the pupil and a study based on the histogram of the image to
estimate the radius of the pupil. These estimates allow the images be fast processed, and
captured if some quality criteria become satisfactory. One of these criteria is a statistical
parameter called `difference of the averages', that was determined through the study of 4018
images of the database BDIRIS. The other criterion is the focus assessment, which is a
measure of the clearness of the edge of the pupil. These criteria allow to accept or to reject an
image, which is essential in a automatic image acquisition system. The developed algorithm
was implemented and tests disclose that the system captures images of iris in real time, being
enough that for this the person remains correctly positioned ahead of the video camera.

xiv

CAPTULO 1
1 INTRODUO
1.1. MOTIVAO
A difuso de uma tecnologia biomtrica depende de vrias caractersticas:
segurana, preo, facilidade de manuseio, tempo de processamento. Dessas, a facilidade de
manuseio a que mais influencia a tecnologia de reconhecimento de ris. Para que seja
possvel capturar imagens do olho de uma pessoa, preciso que ela colabore, posicionando-se
em frente a uma cmera de vdeo e aguardando durante alguns segundos o resultado do seu
cadastro ou identificao. No instante em que a pessoa est olhando para a cmera, o sistema
deve selecionar uma ou mais imagens do seu olho para posterior anlise e comparao.
Assim, o assunto desta dissertao trata da forma com que a captura automtica dessas
imagens de ris deve ser realizada.
A comparao de imagens de ris realizada a uma taxa de 100 mil confrontos
por segundo em um computador com processador de 300 MHz, podendo chegar a um milho
de pessoas por segundo nos processadores modernos de 3GHz. Alm disso, a taxa de falsos
positivos (probabilidade da comparao de duas imagens de olhos distintos resultar em uma
coincidncia) de 10 6 , o que faz a tecnologia de comparao de ris mais confivel do que a

comparao de faces ou impresses digitais (DAUGMAN, 2001).


A captura de imagens de boa qualidade essencial em qualquer sistema
biomtrico, caso contrrio pode elevar as taxas de falsa aceitao e falsa rejeio, ou seja,
pode reduzir o desempenho do sistema. importante tambm evitar que o operador do
sistema decida o instante em que a imagem deve ser capturada, pois assim possvel manter o
banco de dados com imagens do mesmo padro de foco e de posicionamento. E por fim, a
captura automtica diminui o tempo que o usurio tem que olhar fixamente para a cmera,
pois bastam alguns quadros com a imagem em foco e centralizada para que o mesmo seja
dispensado.

2
1.2. OBJETIVO DO TRABALHO
O objetivo desse trabalho desenvolver um sistema para captura automtica de
imagens de ris. A captura das imagens (sob iluminao infravermelha) deve ser realizada
automaticamente e em tempo real quando uma pessoa posicionar-se corretamente em frente
cmera de vdeo. Entende-se por um posicionamento correto aquele que gera uma imagem
centralizada e em foco. O processamento em tempo real permite que todas as imagens do
fluxo de vdeo sejam avaliadas
Como objetivos secundrios tm-se o desenvolvimento de um programa
auxiliar para a determinao manual de parmetros de imagens de ris, a construo de um
prottipo para aquisio de imagens, e a gerao de um vdeo simulador de imagens de ris.
1.3. ESTRUTURA DA DISSERTAO
Esta dissertao est organizada em seis captulos. O Captulo 1 apresenta a
introduo ao trabalho destacando-se as motivaes para o desenvolvimento e os objetivos. O
Captulo 2 apresenta a fundamentao terica necessria para compreender itens especficos
do trabalho. O Captulo 3 apresenta os mtodos de localizao de ris e de estimativa de foco
existentes. O Captulo 4 descreve como foi construdo o prottipo para aquisio de imagens,
e como foi desenvolvido o algoritmo de localizao automtica de ris e de estimativa de foco.
O Captulo 5 descreve os resultados obtidos e o Captulo 6 finaliza com a concluso do
trabalho, discusso, e trabalhos futuros.

CAPTULO 2
2 FUNDAMENTAO TERICA
2.1. INTRODUO
Este item aborda alguns conceitos preliminares que so considerados
importantes para a leitura dessa dissertao.
2.2. ESTRUTURA DO OLHO HUMANO
A Figura 1 apresenta as trs partes do olho humano relevantes para esse
trabalho. A esclera a parte branca que envolve o olho e d forma ao globo ocular. A ris a
parte colorida do olho, que regula a quantidade de luz que atinge a retina. A pupila uma
abertura no centro da ris que permite a passagem da luz.

Figura 1 Estrutura do olho humano.

2.3. PARMETROS DE UMA LENTE


A distncia focal o parmetro mais importante de uma lente. Para determinar
o seu valor necessrio conhecer outras trs variveis: tamanho do objeto a ser observado,
distncia em que o objeto ser observado, e o tamanho do CCD que ser utilizado. O tamanho
nominal do CCD especificado em polegadas em funo de sua diagonal. A Tabela 1
apresenta as dimenses do CCD em milmetros e o seu tamanho nominal em polegadas.

4
Tabela 1 Formato do CCD e suas dimenses correspondentes.
Diagonal (polegadas)

Altura (mm)

Largura
(mm)

1/4
1/3
1/2
2/3
1

2,4
3,6
4,8
6,6
9,6

3,2
4,8
6,4
8,8
12,8

A equao dfa =

do ccda
permite determinar a distncia focal da altura dfa ,
oa + ccda

onde do a distncia do objeto lente, oa a altura do objeto, e ccda a altura do CCD. De


forma semelhante equao dfl =

do ccdl
permite determinar a distncia focal da largura
ol + ccdl

dfl , onde ol a largura do objeto e ccdl a largura do CCD. Assim, a distncia focal da

lente ser o menor valor entre os dois valores calculados (THE IMAGING SOUCE EUROPE
GMBH, 2003).
A profundidade de campo de uma lente a regio do eixo ptico em que a
imagem aparece com nitidez (Figura 2). Quando o objeto se encontra dentro da faixa de
profundidade de campo, diz-se que ele se encontra em foco, caso contrrio o objeto encontrase fora de foco. Quanto maior a distncia focal de uma lente, menor ser a sua profundidade
de campo.

Figura 2 Definio da profundidade de campo de uma lente

A abertura um parmetro que define a quantidade de luz que atravessa a


lente. A profundidade de campo varia com o inverso da abertura, ou seja, quanto maior a
abertura, menor a profundidade de campo.

5
2.4. FILTRAGEM ESPACIAL
Os filtros utilizados no processamento de imagens tm a funo de eliminar
rudos, suavizar ou enfatizar detalhes.
A filtragem espacial assim denominada porque a operao de filtragem
realizada no domnio do espao (opondo-se filtragem no domnio da freqncia, realizada
aps uma transformada de Fourier). Para que se possa filtrar uma imagem no domnio do
espao necessria uma mscara, ou seja, uma matriz de coeficientes que sero utilizados
para efetuar uma multiplicao ponderada com os pixels da imagem (essa multiplicao
ponderada conhecida como convoluo).
Geralmente as mscaras so de tamanho 33, 55, ou 77. Valores maiores
tambm so possveis, mas exigem grande esforo computacional, alm de reduzirem as
dimenses da imagem para valores eventualmente inadmissveis (reduo causada pelo efeito
de borda).
A filtragem consiste em posicionar a mscara sobre o primeiro pixel da
imagem e efetuar a soma das multiplicaes dos coeficientes da mscara pelos pixels
correspondentes da imagem. Assim, o pixel em que est posicionada a mscara receber o
resultado da soma, e a mscara ser deslocada para o pixel seguinte, at que todos os pixels da
imagem filtrada sejam calculados. (GONZALEZ & WOODS, 2000)
2.5. TRANSFORMADA DE HOUGH
A transformada de Hough um mtodo invariante rotao e translao,
utilizado para encontrar formas geomtricas em uma imagem. A idia desse mtodo
transformar a imagem de entrada (aps uma deteco de bordas) em um espao de
parmetros, tambm chamado de espao de Hough. Assim, fica estabelecida uma dualidade
entre o espao original (cartesiano) e o espao de parmetros, que explorado para encontrar
construes geomtricas como linhas ou crculos. A dimenso do espao de parmetros
proporcional ao nmero de parmetros da forma geomtrica que se deseja encontrar. Por
exemplo, um segmento de reta pode ser representado por dois parmetros: o ngulo de sua
normal em relao abscissa e a sua distncia da origem, o que faz com que o espao de
Hough para uma reta tenha duas dimenses. Da mesma forma um crculo pode ser
representado por trs parmetros: suas coordenadas do centro e o seu raio, o que faz com que

6
o seu espao de Hough tenha trs dimenses. A Figura 3 explica o princpio de
funcionamento da transformada de Hough. (PRATT, 2001)

Figura 3 Transformada de Hough. (PRATT, 2001)

Como apresentado na Figura 3a, um segmento de reta pode ser descrito


parametricamente como = x cos + y sen , onde ngulo da reta normal em relao
horizontal e a distncia da reta origem. A transformada de Hough da reta
simplesmente um ponto no espao de parmetros, como mostrado na Figura 3b. Uma famlia
de linhas passando atravs de um ponto em comum, como exibido na Figura 3c mapeia ao
conjunto de pontos conectados da Figura 3d. Agora, considere os trs pontos colineares da
Figura 3e. A transformada de Hough da famlia de curvas que passa atravs dos trs pontos

7
resulta no conjunto de trs curvas paramtricas no espao polar da Figura 3f. Essas trs curvas
se cruzam em um nico ponto correspondente linha tracejada que passa atravs dos trs
pontos colineares.
Cada reta mapeada para o espao de parmetros considerada como um voto.
Ao mapear todos os pontos da imagem de entrada para o espao de parmetros, so obtidos
pontos com maior nmero de votos, que so exatamente aqueles que representam as retas na
imagem de entrada. A mesma idia aplicada para a deteco de crculos. No entanto, o
espao de parmetros dos crculos possui formato de um cone tridimensional, onde cada
ponto do cone corresponde a um crculo na imagem original.
2.6. HISTOGRAMA
O histograma de uma imagem um grfico que mostra a probabilidade de
ocorrncia de uma cor. No caso de uma imagem colorida com trs canais de cores, definem-se
trs histogramas, um para cada cor. Uma imagem monocromtica possuir apenas um
histograma. O nmero de bits utilizados para representar um pixel influencia no nmero de
cores que a imagem pode possuir, e consequentemente no comprimento do histograma. Uma
imagem de 4 bits possui o histograma com 16 nveis, e uma imagem com 8 bits possui
histograma com 256 nveis. Todas as imagens estudadas neste trabalho possuem 256 nveis de
cinza. O histograma de uma imagem pode ser calculado atravs da equao pr (rk ) =

nk
, onde
n

p r (rk ) a probabilidade do k-simo nvel de cinza, nk o nmero de pixels cujo nvel de


cinza corresponde a k, n o nmero total de pixels da imagem, k = 0, 1,..., L-1, onde L o
nmero de nveis de cinza da imagem digitalizada, e 0 rk 1 . (MARQUES FILHO &
VIEIRA NETO, 1999):
2.7. TEOREMA DE BAYES
Sejam x e y dois eventos e suas respectivas probabilidades de ocorrncia
P( x) e P( y ) , tambm conhecidas como probabilidades a priori. Denota-se a probabilidade

de ocorrncia de x dada a ocorrncia de y por P( x | y ) , ou seja, esta a probabilidade de


x condicionada a y . Por definio, P( x, y ) a probabilidade conjunta de x e y . Ento,
P( x, y ) = P( x | y ) P( y ) = P( y | x) ( x) . Este o Teorema de Bayes, uma ferramenta

8
matemtica usada para calcular a probabilidade a posteriori dado que se conhece a
probabilidade a priori. Organizando a igualdade tem-se o Teorema de Bayes em sua forma
mais conhecida P ( x | y) = P( y | x) P ( x) .
P( y )

O Teorema de Bayes utilizado neste trabalho para calcular o limiar de


deciso para a rejeio da localizao da pupila. O limiar de deciso obtido possui valor
timo, ou seja, o valor que causa a menor probabilidade de erro na rejeio.
2.8. MQUINAS DE ESTADO FINITO
Uma mquina de estados finita uma estrutura matemtica definida
formalmente como uma quntupla M = (Q, , , q0 , F ) , onde:

Q um conjunto finito de estados;

um conjunto de caracteres permitidos no alfabeto de entrada;

: Q Q uma funo de transio de estados, que relaciona um estado e um


caractere de entrada a um estado;

q0 o estado inicial;

F um conjunto de estados finais.

Mquinas de estado finito so utilizadas para interpretar (ou reconhecer)


gramticas. Dada uma fita de entrada e um sinal de sincronizao, a mquina percorre os seus
estados de acordo com o caractere de entrada. Se ao trmino da fita, o estado atual pertencer
ao conjunto de estados finais, diz-se que a entrada uma produo da gramtica reconhecida
pela mquina (BARRET & COUCH, 1979).
Existem diversas variaes desse conceito, entre eles o que permite executar
uma ao durante a transio de estados. Neste trabalho foi utilizada uma mquina de estados
para reconhecer extremos locais em uma seqncia de nmeros. Ao trmino da seqncia, a
mquina ter preenchido uma lista com todos os extremos detectados durante a execuo.
A Figura 4 apresenta um exemplo de mquina de estado finito capaz de
reconhecer seqncias mpares de nmero 1. Neste exemplo:

O conjunto finito de estados Q {q0, q1}

O conjunto de caracteres permitidos no alfabeto de entrada {0, 1} (tambm chamado


de vetor de entrada ou seqncia de entrada.)

A funo de transio de estados

definida por (q0,0) = q0 , (q0,1) = q1 ,

(q1,0) = q1 , (q1, 1) = q0

O estado inicial q0

O conjunto de estados finais {q1}


0

q0

1
q1

Figura 4 Exemplo de mquina de estado finito para reconhecer seqncias mpares de


nmeros 1.

Ao iniciar, o autmato encontra-se em q0, e enquanto os caracteres do vetor de


entrada forem iguais a 0, a mquina permanece no estado q0. A mudana de estado s ocorre
quando encontrar o caractere 1, quando muda para o estado q1, que o estado final. Se o
vetor de entrada terminar nesse instante, a mquina encontra-se em um estado final, o que
significa que a seqncia de entrada uma seqncia de nmeros mpares de caracteres 1. No
entanto, se a seqncia no terminar, a mquina poder voltar ao estado q0, indicando que a
seqncia de entrada no contm um nmero mpar de caracteres 1.
2.9. ALGORITMO DE BRESENHAM PARA CRCULOS
Este item aborda um algoritmo que usado em computao grfica para
determinar os pontos que formam uma circunferncia, e que usado nesse trabalho para
detectar os crculos que contornam a pupila e a ris. Este algoritmo conhecido como
Algoritmo de Bresenham para Crculos (BRESENHAM, 1965), e foi elaborado por
Bresenham em 1963 para controlar um plotter digital atravs do computador.
Quando se trata de desenhar uma circunferncia, a primeira idia que surge
utilizar a equao da circunferncia: r = x 2 + y 2 . No entanto, essa equao envolve

10
trigonometria e o clculo de uma raiz quadrada, que indesejvel por envolver instrues de
ponto flutuante. Alm disso, quando esse clculo realizado em funo de uma coordenada,
por exemplo, x, deixa espaos ou pixels no preenchidos ao longo do traado da
circunferncia em y, como apresentado na Figura 5.

Figura 5 Esboo traado pela equao da circunferncia.

Bresenham apresenta uma forma elegante e eficiente para o clculo dos pontos
que formam o traado de uma circunferncia, aproveitando-se da simetria da circunferncia
em relao aos eixos de zero, quarenta e cinco, e noventa graus. Assim, para obter todos os
pontos da circunferncia, basta calcular os pontos de um octante e rebat-los para os outros
sete. Uma das caractersticas desse algoritmo que ele determina o prximo ponto baseado na
posio do ponto anterior. Supondo que o primeiro ponto seja conhecido e localizado no
incio do segundo octante (em noventa graus), o segundo ponto que melhor representa a
circunferncia determinado entre trs alternativas: direita, abaixo, ou diagonal inferior
direita. Para determinar a alternativa correta, calcula-se o erro de cada uma ao longo do raio.
Se o erro for positivo a alternativa indica um ponto fora da circunferncia e implica um
movimento horizontal direita. Se o erro for negativo, o ponto est dentro da circunferncia e
implica um avano vertical para baixo. Se o erro for igual a zero o ponto est localizado sobre
a circunferncia e implica um avano na diagonal inferior direita. Como o clculo deve ser
realizado apenas para o primeiro octante, estes passos devem ser executados apenas enquanto
o ponto estiver localizado acima da diagonal de 45, ou seja, enquanto y x . A Figura 6
apresenta o pseudocdigo do algoritmo de Bresenham para crculos.

11

Figura 6 Algoritmo de Bresenham para crculos.

CAPTULO 3
3 REVISO DA LITERATURA
3.1. INTRODUO
Este item apresenta os principais estudos publicados sobre a captura de
imagens de ris, nos quais este trabalho foi baseado.
3.2. MTODOS DE LOCALIZAO DE RIS
Um dos mtodos mais populares para localizao da ris foi proposto por
Daugman (2001), no qual se utiliza um operador integral-diferencial em uma imagem
suavizada por um filtro gaussiano. A equao max ( r , x , y ) = G (r ) r
0

r , x0 , y 0

I ( x, y )
ds descreve
2 r

o operador proposto, em que r o raio do crculo procurado, G (r ) uma funo gaussiana


de suavizao com desvio padro , * smbolo da convoluo,
parcial,

a notao de derivada

o smbolo da integral de linha sobre a circunferncia de raio r e centro ( x0 , y 0 ) e

I ( x, y ) uma imagem de ris em tons de cinza.


Este operador funciona como um detector de bordas circulares. Daugman
prope que a pupila seja localizada por primeiro, para que ento seja localizada a ris, pois sob
iluminao infravermelha (entre 700 e 900nm) as bordas da pupila so mais salientes que as
bordas da ris.
Outra forma de detectar os parmetros da ris foi proposta por Wildes et al.
(1994), Este mtodo dividido em duas partes: deteco de bordas e Transformada de Hough
(BALLARD, 1981, DUDA & HART, 1975). Para determinar as fronteiras entre a esclera e a
ris, aplica-se um detector de bordas que favorece as direes prximas da vertical. A
motivao que mesmo quando as plpebras estiverem um pouco fechadas, as fronteiras
laterais continuaro visveis. A imagem resultante afinada (ou esqueletizada), e a partir dela
gera-se um espao de trs dimenses segundo os valores permitidos para o raio e as
coordenadas do centro. A transformada de Hough para crculos ento aplicada imagem e o
ponto com o maior nmero de votos considerado o representante dos parmetros
procurados. A determinao dos parmetros da pupila anloga, exceto que a deteco de

14
bordas realizada sem o favorecimento da direo vertical, e restrita regio composta pela
parte interna da ris.
Um algoritmo computacionalmente mais simples e que exige menos memria
que a transformada de Hough foi proposto por Rad et al. (2003), chamado de Deteco
Rpida de Crculos (DRC). Este algoritmo utilizado para detectar crculos escuros em
fundos homogneos mais claros, e composto por quatro etapas. A primeira etapa consiste
em calcular o gradiente da imagem. Quando existirem crculos escuros na imagem, os seus
vetores de gradiente apontaro para fora do crculo, como na Figura 7.

Figura 7 Crculo escuro sobre um fundo claro e seus vetores de gradiente.

A segunda etapa consiste em encontrar todos os pares de vetores de gradiente


que satisfazem as seguintes condies: (i) o ngulo entre os dois vetores igual a 180 e (ii) a
reta que passa entre os dois vetores est na mesma direo dos vetores. Na terceira etapa, um
crculo candidato considerado para cada par de vetores, em que o centro o ponto mdio do
segmento de reta que liga os vetores, e o raio igual metade da distncia entre os vetores. A
quarta etapa extrai os crculos desejados da lista de candidatos gerada na etapa anterior. Para
isso os crculos candidatos so organizados na forma de triplas (centro x, centro y, raio) e
agrupados segundo a distncia euclidiana entre eles. Assim os crculos podem ser encontrados
atravs do centro dos grupos.
Kee et al. (2001) apresentaram um mtodo para a captura da ris em um vdeo
em que cada quadro (ou imagem) passa por uma avaliao de qualidade antes de ser
processado. A avaliao da qualidade da imagem consiste em trs critrios: o primeiro detecta
se as plpebras esto fechadas, o segundo verifica se a ris est centralizada, e o terceiro
calcula a razo entre os componentes de borda verticais e horizontais obtidos atravs do
algoritmo de Sobel para formar um escore. Considera-se que a imagem possui qualidade
suficiente para ser processada se ela atingir um valor mnimo de escore. Para localizar as
bordas da pupila Kee et al. (2001) descrevem um algoritmo de trs etapas: na primeira etapa,
o detector de bordas de Canny (1986) aplicado imagem e seus componentes conectados

15
so rotulados. Na segunda etapa aplica-se a transformada de Hough para encontrar o centro da
pupila, e na terceira etapa os raios obtidos so agrupados e o valor mdio do grupo com a
maior freqncia de ocorrncia considerado o raio da pupila. De forma anloga so
determinados os parmetros da ris.
O mtodo utilizado por Pan & Xie (2005) para detectar a pupila baseia-se na
anlise do histograma da imagem, em que o limiar de segmentao da pupila o valor do
mnimo local entre o primeiro e o segundo mximo local. Aps a segmentao, aplicada
uma morfologia matemtica de eroso e dilatao para fechar os espaos provenientes do
reflexo da iluminao. Para encontrar o centro aproximado da pupila, a imagem dividida em
pequenas regies e aquela que possuir a menor soma de intensidade de pixels considerada a
regio que contm a pupila. Detectando horizontalmente as bordas da regio na imagem
binria obtm-se o centro da pupila. Para determinar os raios da ris e da pupila, algumas
linhas prximas do centro so amostradas e o vetor obtido diferenciado (ou derivado) para
que possam ser obtidos os picos que representam as bordas da ris e da pupila. Atravs desses
picos os respectivos raios so determinados.
Zhang & Li (2005) utilizaram pares de vetores de gradientes resultantes de
uma deteco de bordas de Canny (1986) para a deteco da pupila, posteriormente refinada
atravs do operador integral-diferencial de Daugman (2001). Para detectar a ris, o algoritmo
de Canny (1986) foi aplicado novamente favorecendo as bordas verticalmente direcionadas,
resultando em um conjunto de pixels que formam o vetor de entrada para o algoritmo de
Deteco Aleatria de Crculos, descrito por Chen & Chung (2001).
Mira Jnior & Mayer (2003) apresentaram um mtodo essencialmente
morfolgico para a deteco e extrao de caractersticas da ris. Utilizando iluminao
visvel (ou seja, no infravermelha) determinam as bordas da pupila aplicando a seguinte
seqncia de operadores morfolgicos: limiarizao, abertura e fechamento. Para determinar
as bordas da ris, a seqncia de operadores : limiarizao, fechamento e abertura.
Cui et al. (2004) descrevem um mtodo baseado em uma Mquina de Vetor de
Suporte (THEODORIDIS & KOUTROUMBAS, 2003) para determinar os parmetros da ris.
Para isso, detectam a pupila extraindo duas caractersticas da imagem: a rea, dada pelo
nmero de pixels pretos da imagem binarizada, e a excentricidade, dada pela equao
Ic =

s
, onde s a rea da pupila e r a maior distncia entre o centride da pupila e um
r2

ponto qualquer pertencente mesma. Dada a existncia da pupila, realizada a busca pela

16
ris, que consiste em transformar a imagem do espao de coordenadas retangulares para o
espao polar, tendo o centro da pupila posicionado na origem (Figura 8).

Figura 8 Imagem de ris transformada de coordenadas retangulares para coordenadas


polares.

Ao aplicar uma Anlise Discriminante (MCLACHLAN, 2004), a imagem


resultante classificada como sendo ou no uma imagem de ris.
O mtodo de Menp (2005) para detectar a pupila utiliza a limiarizao
global da imagem. Depois de obtida a imagem binarizada, aplica-se o operador morfolgico
de abertura para remover clios e partes da sobrancelha, que no fazem parte da pupila.
Assim, o centro da pupila determinado calculando-se o centride da regio resultante, e o
raio obtido atravs da equao da rea do crculo r =

, onde r o raio e s a rea da

regio.
Um algoritmo para reconhecimento de ris em tempo real foi apresentado por
Cho et al. (2005) e implementado em um telefone celular com processador ARM de 300MHz.
Para detectar a pupila, utiliza-se uma limiarizao global da imagem. Para minimizar o erro
de localizao, o contraste e o brilho da imagem foram ajustados no conversor analgicodigital da cmera para que houvesse a maior nitidez dos pixels escuros. Assim, os mximos
locais do histograma da imagem referentes pupila e a esclera apresentam-se mais separados,
o que facilita a limiarizao. Da mesma forma o conversor analgico-digital ajustado para a
deteco das bordas da ris. Neste caso, a nitidez deve ser maior nos pixels com tons de cinza
elevados. Assim, a deteco da ris realizada aplicando-se uma verso modificada do
operador integral-diferencial de Daugman (2001). A modificao consiste em pr-calcular a
disposio de alguns pontos de todos os possveis crculos em que a ris pode estar contida.
Assim, a velocidade do processamento aumenta, pois esse clculo no precisa ser efetuado em
tempo de execuo. Tendo os pontos calculados, as diferenas entre os pixels (que
possivelmente esto em torno da borda da ris) so obtidas e o raio que apresentar a maior
soma das diferenas considerado como sendo o raio da ris (Figura 9).

17

Figura 9 Posio dos pontos pr-calculados de cada crculo com raio entre 10 e 107 pixels.

3.3. MTODOS DE ESTIMATIVA DE FOCO


Os mtodos de estimativa de foco podem ser classificados em dois grupos: os
que utilizam toda a imagem e os que utilizam apenas uma regio da imagem para obter o
resultado.
Intuitivamente, uma imagem (ou uma regio) encontra-se em foco quando as
suas bordas so ntidas. Daugman (2001) estima o foco de uma imagem calculando o seu
espectro de Fourier e ento relacionando a quantidade de altas freqncias com as baixas. O
foco estimado da imagem proporcional a essa relao. No entanto, esse mtodo afetado
por clios e sobrancelhas, que quando presentes na imagem geram resultado distorcido, pois
contribuem para a quantidade de altas freqncias. Pessoas que usam culos tambm causam
problemas, pois existe a tendncia de ajustar o foco na lente dos culos, que est a uma
distncia aproximada de um centmetro do olho. Como a profundidade de campo dos sistemas
pticos de captura de ris pequena (as objetivas normalmente usadas so de 50-300 mm) se
o foco estiver ajustado na lente dos culos, o olho ficar completamente fora de foco. Esta a
principal desvantagem de mtodos que avaliam toda a imagem para determinar o foco.
Park & Kim (2005) utilizam um mtodo do segundo grupo (Figura 10), em que
a regio da imagem avaliada para obter o foco a reflexo especular (causada pela retina) do
sistema de iluminao da ris. Quando est em frente cmera, a pessoa pode estar situada em
trs faixas de distncia importantes. Uma dessas faixas aquela em que a imagem da ris est
ntida, ou seja, est na regio de profundidade de campo (faixa PC) do sistema ptico. Nesta
regio, a reflexo especular apresenta-se como um pequeno ponto branco na imagem. As
outras duas faixas so aquelas situadas frente (faixa II) e atrs (faixa III) da regio de
profundidade de campo. Quando a pessoa est situada na faixa II, a imagem est fora de foco,
e a reflexo especular apresenta-se como um disco branco, nitidamente maior que o ponto na

18
faixa PC. Da mesma forma a imagem est fora de foco se a pessoa se encontrar na faixa III, e
a reflexo especular tambm se apresenta como um disco branco. Porm, nesse caso ela
possui um pequeno ponto preto central, que permite identificar, mesmo com a imagem fora de
foco, se a pessoa est muito prxima ou muito distante da faixa de profundidade de campo.
Este o princpio de funcionamento do sistema de foco automtico proposto por Park & Kim
(2005), em que utilizada uma lente varifocal motorizada, que movimentada segundo a
distncia da pessoa em relao lente.

Figura 10 - Princpio de funcionamento do clculo do foco proposto por Park & Kim (2005).

CAPTULO 4

4 MATERIAIS E MTODOS
4.1. SISTEMA DE AQUISIO DE IMAGENS
O sistema de aquisio de imagens utilizado nesse trabalho composto por
uma cmera de vdeo, uma objetiva, um monitor, um filtro infravermelho, e pela placa de
iluminao. A Figura 11 apresenta um diagrama de blocos com os componentes utilizados.
Cmera AYC-577F
CDD 1/3

Objetiva
100 mm

Filtro
Infravermelho
RM90

Iluminao
Computador

Placa de
Captura
Monitor 2.5

Figura 11 Componentes do sistema de aquisio de imagens.

A cmera de vdeo (Figura 12) fabricada pela empresa ADLER CCTV


(http://www.adlercctv.com), modelo AYC-577F. Esta cmera possui um CCD fabricado pela
Sony com tamanho de 1/3 de polegada e alta resoluo (600 linhas horizontais).

Figura 12 Cmera de vdeo utilizada no trabalho. Possui CCD com 1/3 de polegada e 600
linhas de resoluo horizontal.

A objetiva (Figura 13) fabricada pela empresa Leading Optics


(http://www.leadingoptics.com), modelo CNE05100V, com distncia focal varivel entre 5 e
100 mm. Neste trabalho a objetiva foi ajustada para a maior abertura de ris e maior distncia
focal permitidas, e o foco regulado para a visualizao de imagens com nitidez a uma

20
distancia de 30 cm. A profundidade de campo do sistema ptico nessa configurao fica com
aproximadamente um centmetro.

Figura 13 Objetiva com distncia focal de 100 mm utilizada para obter as imagens de ris.

Alguns sistemas de aquisio utilizam avisos sonoros, outros, espelhos para


orientar o usurio sobre o seu posicionamento. Nesse sistema utilizado um monitor da
marca Pustom de 2,5 polegadas (Figura 14) fixado logo abaixo da objetiva, que consiste em
uma terceira alternativa para realimentar o posicionamento para o usurio. A realimentao
realizada quando o usurio corrige a sua posio ao perceber que a sua imagem no est
centralizada no monitor.

Figura 14 Monitor de vdeo de 2,5 usado para a realimentao do posicionamento para o


usurio.

Para impedir a passagem de iluminao visvel pela lente e permitir a


passagem da luz infravermelha foi utilizado um filtro infravermelho (Figura 15). O filtro
fabricado pela empresa HOYA OPTICS, modelo RM90.

21

Figura 15 Filtro infravermelho Hoya RM90 utilizado para impedir a entrada de luz com
comprimento de onda inferior a 900 nm.

Este filtro um passa-baixas (ou passa-longas), que possui freqncia de corte


em 900 nanmetros. Assim, apenas a radiao infravermelha com comprimento de onda
acima de 900 nm atinge o CCD, como mostra a Figura 16.

Figura 16 Curva de transmisso de radiao de dois modelos de filtro Hoya. esquerda a


curva do RM90, e direta a curva do modelo RM100.

A placa de iluminao composta por 4 leds infravermelhos de 5 mm, modelo


LD271, dispostos na forma de linha, com 2 cm de separao. Esses leds emitem radiao
infravermelha com comprimento de onda de 950 nm, com tolerncia de 50 nm para mais ou
para menos.
A cmera foi ligada a um computador porttil atravs de uma placa de captura
de vdeo PCMCIA capaz de processar imagens de tamanho 320240 pixels em at 30 quadros
por segundo no padro NTSC.

22
4.2. BASES DE DADOS UTILIZADAS
No decorrer desse trabalho foram utilizadas duas bases de dados de ris: uma
de domnio pblico e outra privada.
A base de dados privada, BDIRIS, constituda por 4018 imagens
provenientes de 22 pessoas. Esto armazenadas no formato bitmap com 256 tons de cinza e
com tamanho de 320240 pixels. Esta base possui imagens originadas de vrios modelos de
cmeras, nveis de iluminao, assim como a distncia do indivduo lente.
A base de dados de domnio pblico conhecida como CASIA
(http://www.sinobiometrics.org/casia iris.htm) e constituda por 756 imagens provenientes
de 108 pessoas, com cada pessoa contribuindo com sete imagens de ambos os olhos (trs
imagens de um olho e quatro de outro). As imagens tambm esto em formato bitmap com
256 tons de cinza e tamanho de 320280 pixels. A grande maioria dessas imagens de
orientais, explicando assim a obstruo causada por clios em algumas delas.
A principal dificuldade com o processamento de imagens definir os valores
timos de limiarizao, tamanho de mscaras de filtro, larguras de janelas, entre outras.
Nesses casos interessante possuir um mecanismo para auxlio na determinao desses
valores. Neste trabalho, esse mecanismo uma base de imagens de ris com todos os
parmetros importantes da ris pr-determinados. Por isso, foi desenvolvido um programa que
permite determinar manualmente e armazenar em um banco de dados os parmetros das 756
imagens da base de dados CASIA. Os parmetros armazenados so os raios e os centros da
pupila e da ris. Assim, em alguns casos, os valores para uma constante do software de
deteco so determinados estatisticamente utilizando-se esses parmetros como referncia. A
Figura 17 apresenta a tela principal desse programa auxiliar.

23

Figura 17 Programa auxiliar desenvolvido para determinar manualmente os parmetros das


imagens da base de dados CASIA.
4.3. ESTRUTURA DO ALGORITMO DE LOCALIZAO
O algoritmo de localizao composto pelos blocos da Figura 18. No primeiro
bloco a imagem convoluda com mscaras gaussianas (RUSS, 1998) de tamanho 55. Ento
os gradientes horizontais e verticais so calculados atravs do mtodo de Sobel (GONZALEZ
& WOODS, 2000). No terceiro bloco calcula-se o histograma da imagem, que ser utilizado
posteriormente para diversas consideraes. Atravs do histograma, o raio da pupila
estimado e o centride da imagem calculado. Neste ponto possvel reduzir o espao
tridimensional de busca pela pupila. Calcula-se uma estimativa do raio atravs do histograma,
o que significa que no ser necessrio iterar por todos os raios possveis para que ele seja
encontrado. Calcula-se uma estimativa do centro da pupila atravs do centride (ou centro de
massa) da imagem binarizada, limitando a busca pelo centro da pupila a uma regio reduzida
da imagem. Na seqncia realizada a procura pela pupila, a limiarizao dos gradientes, a
busca pela ris, e no ltimo bloco o foco da imagem estimado. Nos prximos itens cada um
desses blocos ser explicado com detalhes.

24

Figura 18 Diagrama de blocos do algoritmo de deteco.


4.3.1. FILTRO GAUSSIANO
O filtro gaussiano aplicado no domnio do espao, atravs de uma
convoluo de uma mscara com a imagem. O objetivo da aplicao desse filtro suavizar a
imagem para evitar a presena de picos nos valores de gradiente, causados pelo rudo. A
mscara utilizada possui os valores apresentados na Figura 19, conforme sugerido por Russ
(1998). O tratamento de bordas realizado na imagem resultante feito com o preenchimento
dos valores da imagem original.

Figura 19 Mscara do filtro gaussiano utilizado na filtragem.

25
O tamanho dessa mscara assim como a varincia da funo gaussiana foi
selecionado empiricamente, de forma a no comprometer o tempo de processamento e o
tamanho resultante da imagem.
4.3.2. CLCULO DO GRADIENTE SOBEL
O operador de Sobel (GONZALEZ & WOODS, 2000) composto pelas
mscaras de convoluo apresentadas na Figura 20. Esse operador utilizado para detectar os
gradientes horizontais e verticais da imagem de ris. Na implementao desse operador foi
feita uma simplificao em que ao invs de calcular a distncia euclidiana para obter o valor
do mdulo em um determinado ponto da imagem, considerou-se o mdulo como sendo
apenas a soma dos valores do gradiente na horizontal e vertical. Uma alternativa para detectar
as bordas da pupila seria a utilizao do operador de Canny (CANNY, 1986). Apesar dos
resultados apresentados por esse mtodo serem superiores (pois ele detecta os componentes
conectados das bordas) aos do operador de Sobel, a escolha pelo ltimo foi mantida, pois de
rpido processamento.

Figura 20 Mscaras do operador de Sobel


4.3.3. HISTOGRAMA DA IMAGEM
Neste bloco gerado o histograma da imagem. Pelo histograma de uma
imagem de ris possvel inferir algumas caractersticas, como por exemplo, o contraste e a
mdia dos nveis de cinza da pupila. Como apresentado na Figura 21, o histograma de uma
imagem de ris de boa qualidade apresenta dois mximos locais com um mnimo local bem
caracterstico entre eles. O primeiro mximo, com um nvel de cinza menor e nitidamente
mais isolado dos outros formado essencialmente pelos pixels pertencentes pupila. O
segundo mximo apresenta uma varincia maior que o primeiro e constitudo em sua
maioria pelos pixels que formam a ris.
No entanto, nem sempre as imagens so de boa qualidade e com freqncia
encontra-se imagens de baixo contraste como aquela ilustrada na Figura 22. O histograma

26
dessa imagem continua apresentando os dois mximos locais referidos anteriormente, porm
eles no tm a evidncia que os mximos da Figura 21 apresentam, ou seja, seus valores
mximos so baixos em relao aos outros picos da imagem e no apresentam uma fronteira
ntida de separao. Alm disso, no existe o mnimo local citado anteriormente.
Ainda, observa-se que o nvel de cinza do primeiro mximo local ,
aproximadamente, a mdia do conjunto de pixels que constituem a pupila. Sendo assim,
quando a imagem binarizada e utilizando-se como limiar o menor valor entre os dois picos,
o resultado uma imagem que contm apenas a pupila.

Figura 21 Imagem de boa qualidade e seu respectivo histograma. Dimenses: 320240


pixels, 256 tons de cinza. Fonte: BDIRIS.

Figura 22 Imagem de baixa qualidade e seu respectivo histograma. Dimenses: 320240


pixels, 256 tons de cinza. Fonte: BDIRIS.

27
4.3.4. ESTIMAO DO RAIO DA PUPILA
Utilizando o valor de limiar sugerido no item 4.3.3 possvel obter uma
estimativa da rea da pupila, distorcida apenas pela regio de reflexo e por alguns clios um
pouco mais escuros. Essa estimativa permite reduzir o espao de busca por crculos
candidatos a pupila, pois a busca deixa de ser feita por todo o intervalo possvel em que se
pode encontrar o raio da pupila, para ser feita no raio estimado com uma pequena tolerncia
pr-definida.
Para demonstrar a importncia do contraste da imagem e da separao entre os
mximos locais, a Figura 23 e a Figura 24 fazem uma comparao entre os valores mximos e
mnimos permitidos para o limiar de binarizao.

Figura 23 Resultado da binarizao da Figura 21. (a) limiar mnimo 43, (b) limiar mximo
75. Abaixo de cada pupila apresentado o histograma da imagem original e o ponto onde foi
aplicado o limiar de binarizao.

Na Figura 23, o limiar mnimo de binarizao 43, e o mximo 75, o que


indica uma tolerncia de 32 nveis de cinza para a escolha do limiar sem que a rea estimada
da imagem tenha uma variao significativa.

28

Figura 24 Resultado da binarizao da Figura 22. (a) limiar mnimo 35, (b) limiar mximo
46. Abaixo de cada pupila apresentado o histograma da imagem original e o ponto onde foi
aplicado o limiar de binarizao.

Na Figura 24 o limiar mnimo de 35 e o mximo 46, constituindo uma faixa


de 11 nveis de cinza, sendo que a partir do nono nvel a rea de preto comea a aumentar
significativamente. Alm disso, no existe um mnimo local bem definido para que se possa
atribuir o limiar de binarizao.
Assim, fica evidente que um dos parmetros que define a qualidade de uma
imagem de ris um histograma que apresenta um mnimo local bem definido entre os
mximos locais que correspondem pupila e a ris.
Considere agora o histograma de uma imagem de ris, como aquele
apresentado na Figura 21. ntida a existncia de falhas peridicas em sua seqncia de
valores que so causadas pelo hardware de captura de imagens. Para corrigir essas falhas
aplica-se um filtro de mdia com uma janela de cinco pixels de lado, que tambm elimina
pequenos rudos e suaviza a curva. O tamanho da janela de cinco pixels foi determinado
experimentalmente, de forma a preencher as falhas e ao mesmo tempo no comprometer os
detalhes do histograma. Neste momento o histograma est pronto para ser submetido a uma
anlise sinttica para a determinao de seus extremos locais. Essa anlise sinttica feita
pela mquina de estados apresentada na Figura 25.
Ao detectar extremos locais em um histograma (ou em um vetor qualquer),
nota-se a existncia de cinco estados (Figura 25):

29

Subindo: Ocorre quando o valor do prximo elemento do vetor de entrada maior que o
valor atual.

Descendo: Ocorre quando o valor do prximo elemento do vetor de entrada menor que o
valor atual.

Plano Subindo: Ocorre quando o valor do prximo elemento do vetor de entrada igual
ao valor atual e o estado anterior era Subindo.

Plano Descendo: Ocorre quando o valor do prximo elemento do vetor de entrada igual
ao valor atual e o estado anterior era Descendo.

Plano Incio: Ao iniciar o autmato, no se pode considerar um dos estados anteriores


como o estado inicial. Por isso existe o estado Plano Incio, que o estado inicial e faz
com que o vetor seja considerado plano at que o valor do prximo elemento do vetor
cause uma mudana de estado para subindo ou descendo.
Aps o trmino da execuo, existiro duas listas de extremos locais, uma de

mximos e outra de mnimos, que so preenchidas conforme esses extremos so detectados.


Incio

h[n+1]=h[n]

Plano
incio

h[n+1]=h[n]

h[n+1]<h[n]

Plano
subindo

h[n+1]>h[n]

h[n+1]<h[n]
Mximo Local Detectado
listamax.adicionar( (n+ip)/2 )

h[n+1]<h[n]
Descendo

h[n+1]>h[n]

h[n+1]=h[n]
Incio de Plano
ip = n
h[n+1]>h[n]

h[n+1]>h[n]
Mnimo Local Detectado
listamin.adicionar(n)

h[n+1]<h[n]
Mximo Local Detectado
listamax.adicionar(n)

h[n+1]=h[n]
Incio de Plano
ip = n

Subindo

h[n+1]>h[n]
Mnimo Local Detectado
listamin.adicionar( (n+ip)/2 )

h[n+1]<h[n]
Plano
descendo
h[n+1]=h[n]

Figura 25 Mquina de estados para deteco de mximos e mnimos locais. Na figura, h o


vetor de entrada, h[n] o valor atual do vetor, h[n+1] o valor do prximo elemento do
vetor, n o ndice do elemento atual do vetor, incrementado a cada transio de estado, e
listamax e listamin so listas que armazenam os mximos e os mnimos, respectivamente.

30
No histograma de uma imagem de ris, o primeiro mximo local encontrado
aquele associado pupila. Ou seja, os pixels que formam a pupila possuem nveis de cinza
prximos ao nvel de cinza em que este mximo se encontra. Neste trabalho, este nvel de
cinza chamado de mdia estimada da pupila, e ela tende a se aproximar da mdia real
quando diminuem os reflexos na regio da pupila.
Ao primeiro mnimo local encontrado aps o mximo associado pupila
atribudo o limiar de binarizao da pupila. O nmero de pixels que possuem nveis de cinza
abaixo desse limiar considerado a rea estimada da pupila (em pixels). Dividindo-se esse
valor por e extraindo-se a raiz quadrada obtm-se o raio estimado da pupila.
4.3.5. CLCULO DO CENTRIDE DA IMAGEM
Tendo determinado o limiar de binarizao, o prximo passo o clculo do
centride da imagem. Em geometria, o centride de um objeto R, pertencente a um espao ndimensional, a interseco de todos os hiperplanos que dividem R em quantidades iguais de
movimento com relao ao hiperplano. Quando o objeto possui densidade uniforme, o centro
de massa coincide com o centride do objeto. No caso da imagem limiarizada da pupila,
pode-se fazer uma analogia do nvel de cinza preto de cada pixel com a densidade de massa
uniforme. Dessa forma, dada a sua geometria circular, o centride da imagem tende a se
aproximar do centro da circunferncia que circunscreve a pupila.
As equaes (1) e (2) fornecem as coordenadas (c x , c y ) do centride da
imagem limiarizada da ris nas direes horizontal e vertical, respectivamente.
J

cx =

j I ( j, k )
j =1 k =1
J

I ( j, k )

(1)

j =1 k =1

k I ( j, k )
cy =

j =1 k =1
J

I ( j, k )

(2)

j =1 k =1

Nas equaes (1) e (2), I a imagem limiarizada (binarizada), j a


coordenada do eixo horizontal, k a coordenada do eixo vertical, J a largura da imagem, e
K a altura da imagem.

31
Dessa forma, fez-se um estudo para avaliar qual a variao mdia entre as
coordenadas do centride e do centro da pupila. Os centrides foram obtidos
matematicamente atravs da imagem binarizada, mas o centro da imagem precisa ser
informado a priori para que o estudo seja realizado. Por isso foram utilizadas as 756 imagens
da base de dados CASIA, que foram limiarizadas e as coordenadas do centro da imagem
determinadas manualmente, conforme explicado no item 4.2.
A Figura 26 apresenta o grfico da distncia do centride ao centro da pupila
versus o nmero de imagens.

Figura 26 Comparao entre o centride (estimativa do centro) e o centro real da pupila.


Nota-se que na grande maioria das imagens o centride est a uma distncia de quatro ou
cinco pixels do centro da pupila.

Neste grfico, o eixo vertical conta o nmero de imagens e o horizontal indica


a distncia euclidiana que o centride est do centro da pupila (em pixels). Por exemplo, a
terceira barra indica que existem 248 (de um total de 756) imagens em que a distncia do
centride ao centro de cinco pixels.
Este grfico importante porque fornece uma constante para o algoritmo de
localizao. Essa constante determina o raio de busca nas redondezas do centro estimado da
pupila. Se no existisse uma estimativa para o centro, a alternativa seria utilizar toda a
imagem como rea de busca, mas nesse caso o tempo de localizao aumentaria
proporcionalmente ao nmero de pixels. Ao observar as barras do grfico da Figura 26,
plausvel considerar o raio de busca igual a dez pixels. O nmero de imagens com o erro
maior que dez nesse grfico desprezvel, alm do que esse erro causado por sobrancelhas e
clios, muitas vezes com o centro da pupila posicionado na parte inferior da imagem.

32
A Figura 27 apresenta uma imagem de ris em que seus parmetros foram
determinados (bordas da ris e da pupila). O quadrado branco com 41 pixels de lado revela na
imagem a regio de busca pela pupila. Percebe-se assim que o espao de busca diminui
consideravelmente em relao busca na imagem toda.

Figura 27 Imagem de ris com seus parmetros determinados e o quadrado delimitando a


regio de busca pela pupila.

4.3.6. DETERMINAO DOS PARMETROS DA PUPILA


O raio da pupila estimado atravs de uma tcnica baseada no histograma
(item 4.3.4), e as coordenadas do centro da pupila so estimadas pela posio do centride da
imagem binarizada (item 4.3.5). Dessa forma, o espao de busca por esses parmetros fica
reduzido s suas estimativas, ou seja, existem limites para cada uma dessas variveis. Os
limites das coordenadas do centro so os pixels que se encontram dentro de um quadrado de
41 pixels de lado, centralizado na posio do centride (Figura 27). Os limites do raio so
re 4 r re + 4 , onde re o raio estimado da pupila (item 4.3.4). Neste trabalho, a
tolerncia de procura pelo raio da pupila igual a quatro pixels, para mais ou para menos.
Esta tolerncia foi obtida empiricamente com o compromisso de no excluir o raio verdadeiro
do intervalo e ao mesmo tempo no comprometer o desempenho do sistema. O tamanho do
espao sem as estimativas para uma imagem de 320240 pixels, com o raio mximo da pupila
igual 50 de (320 2 50 ) (240 2 50 ) 50 = 1.540.000 , mais de um milho e meio de

triplas possveis. Considerando-se as estimativas do centro e do raio, o tamanho do espao de


busca fica reduzido para 41 41 9 = 15.129 , ou seja, uma reduo de 100 vezes que se reflete
no tempo de processamento da imagem.
Para determinar o centro e o raio da pupila adaptaram-se as tcnicas propostas
por Bresenham (1965), para determinar os pontos de uma circunferncia (item 2.9), e por Rad
(2003), para localizao de crculos (item 3.2) atravs de pares de vetores de gradientes.

33
Seja uma tripla t = ( x, y , r ) pertencente ao espao de busca da pupila, em que x
e y so as coordenadas do centro e r o raio da pupila. Atravs do algoritmo de Bresenham
(1965) so obtidos os pontos da circunferncia definida por essa tripla. A seguir procura-se
por pares de vetores de gradiente. Conforme ilustra a Figura 28, para que dois vetores sejam
considerados um par necessrio que eles estejam na mesma direo e possuam sentidos
opostos. Experimentalmente detectou-se que comum a existncia de pupilas que no
formam um crculo perfeito (como por exemplo, a pupila da Figura 29). Por isso, optou-se por
estabelecer uma tolerncia para que a direo dos vetores seja considerada a mesma, ou seja,
definiu-se um ngulo mximo de desvio () que os vetores podem ter em relao direo
radial para que sejam considerados um par. Assim, se p1 for um ponto no primeiro octante, e
p 2 um ponto no quinto octante (ou qualquer combinao de octantes simtricos), pode-se
afirmar que eles formam um par de vetores se d 180 o ou d , onde d resto da
diviso entre a diferena do ngulo de p1 e o ngulo de p 2 por 180 (resto de

p1 p 2
).
180

Cada uma das 15.129 triplas existentes no espao (cada combinao possvel
para x, y, r ) avaliada e associada a um escore, com valor proporcional ao nmero de pares
de vetores encontrados. Ento as triplas so ordenadas por ordem de maior escore e apenas as
primeiras 20 triplas so armazenadas. O valor 20 foi determinado empiricamente de forma a
no comprometer a eficincia da localizao, pois considerando-se um valor muito baixo
pode-se descartar a tripla procurada e, ao contrrio, considerando-se um valor muito alto
pode-se avaliar todas as 15.129 triplas no pior caso, o que impediria o sistema de executar em
tempo real a 30 quadros por segundo.

Figura 28 Direo dos vetores de gradiente em uma circunferncia.

O prximo passo localizar a pupila determinando qual dessas triplas


candidatas corresponde aos parmetros da pupila presente na imagem, ou ento rejeitar todas
as candidatas no caso em que a imagem no possua simetria suficiente para a existncia de

34
uma pupila. Apenas o escore da tripla no suficiente para rejeitar uma imagem, por isso
definiu-se um novo parmetro chamado de DM mdulo da diferena entre as mdias. A DM
consiste no valor absoluto da subtrao do valor mdio dos pixels que formam a pupila do
valor mdio estimado da pupila, obtido atravs do primeiro mximo local do histograma da
imagem (item 4.3.4). Assim, se esse parmetro possuir um valor baixo, significa que a mdia
estimada, observada no histograma da imagem (Figura 29), est muito prxima da mdia dos
nveis de cinza da pupila, efetivamente contados na imagem.

Figura 29 Esquerda: Imagem de uma ris onde as linhas contornam a pupila e a ris. Direita:
Histograma da imagem da esquerda, onde o nvel de cinza do primeiro pico indica a mdia
estimada da pupila.

Se a circunferncia da tripla candidata envolver corretamente a pupila, a


diferena entre as duas mdias ser pequena, causada apenas por reflexos especulares
(gerados pela iluminao do sistema de captura) e pelas imperfeies nas bordas da pupila.
Para determinar estatisticamente o valor timo de deciso para a DM foi
desenvolvido um programa auxiliar que permitisse localizar automaticamente a pupila,
levando em considerao apenas o escore das triplas, para ento classificar o resultado e a
DM como um acerto ou um erro.
O processamento das imagens da base BDIRIS resultou em 3575 acertos e 443
erros, totalizando 4018 imagens. O resultado est apresentado no grfico da Figura 30. Neste
grfico, a DM representada no eixo das abscissas (em nveis de cinza) e as probabilidades de
ocorrncia de acertos e de erros esto indicadas na ordenada.

35

Figura 30 Grfico que apresenta a probabilidade de ocorrncia de um acerto e de um erro


em funo da DM.

Percebe-se que quando a DM encontra-se entre 0 e 5, a probabilidade de


ocorrncia de um acerto de quase 100%. O mesmo ocorre para a probabilidade de
ocorrncia de um erro quando a DM encontra-se acima de 15. O intervalo de incerteza entre 5
e 15 onde ficar ajustado o limiar de deciso. Para no aumentar a complexidade do estudo,
optou-se por considerar que o custo de um falso erro igual ao custo de um falso acerto.
Deste modo, o limiar timo de deciso situa-se no ponto de cruzamento das curvas, em que o
valor da DM igual a 14. A Tabela 2 apresenta os dados utilizados na construo do grfico.

36

Tabela 2 Parcela inicial dos dados obtidos aps a classificao manual das 4018 imagens da
base de imagens BDIRIS.
DM

Probabilidade de acerto
dada uma DM p( A | DM )

Probabilidade de erro
dada uma DM p(E | DM )

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

0,995
0,999
1,000
0,995
1,000
1,000
0,967
0,987
0,983
0,900
0,968
0,762
0,846
0,563
0,600
0,375
0,000
0,000
0,000
0,000
0,000
0,000
0,000

0,005
0,001
0,000
0,005
0,000
0,000
0,033
0,013
0,017
0,100
0,032
0,238
0,154
0,438
0,400
0,625
1,000
1,000
1,000
1,000
1,000
1,000
1,000

Ao dividir o nmero de acertos pelo total de imagens obtm-se a probabilidade


de acerto a priori, igual a 89%. De forma complementar, a probabilidade de erro a priori de
11%.
O resultado dessa classificao manual permite obter a probabilidade de uma
DM ocorrer, dado que tenha ocorrido um acerto (e tambm para que tenha ocorrido um erro).
A probabilidade de ocorrncia de uma DM qualquer determinada dividindo-se o nmero de
imagens que obtiveram tal diferena pelo total de imagens. Dessa forma tm-se todas as
informaes necessrias para obter a probabilidade a posteriori atravs do Teorema de Bayes
(DUDA et al. 2001, THEODORIDIS & KOUTROUMBAS, 2003).
A probabilidade a posteriori era o que faltava para completar a deciso a favor
de uma das triplas, pois dada uma tripla candidata, seu escore, e sua DM, possvel decidir

37
com a menor probabilidade de erro (em que a amostra da populao foi baseada na BDIRIS)
qual delas representa mais corretamente a pupila, ou se nenhuma delas a representa.
Pelo Teorema de Bayes (2.7) tem-se que p( A | DM ) =

p(DM | A) p ( A)
onde
p(DM )

p( A | DM ) a probabilidade de ocorrer um acerto dada uma diferena de mdias DM, p( A)

a probabilidade de ocorrncia de um acerto, e p( DM ) a probabilidade de ocorrncia da


diferena das mdias DM, e p(DM | A) a probabilidade de ocorrncia de uma DM dada a
ocorrncia de um acerto. Assim, a probabilidade de ocorrncia a posteriori de um acerto
calculada a partir de sua probabilidade de ocorrncia a priori, obtida atravs da classificao
manual. A probabilidade de ocorrncia a posteriori de um erro obtida da mesma forma que
para um acerto, p(E | DM ) =

p( DM | E ) p (E )
, exceto pela substituio das probabilidades
p(DM )

de acerto p( A) pelas probabilidades de erro p( E ) , e das probabilidades condicionais


p(DM | E ) e p(E | DM ) .

Isto posto, decide-se por um acerto caso p( A | DM ) p( E | DM ) ou por um


erro caso p( A | DM ) < p( E | DM ) .
Na Tabela 2 percebe-se que p( A | DM ) < p( E | DM ) para DM 15 . Assim
sendo, pode-se rejeitar imagens com a menor probabilidade erro se o valor de DM for maior
ou igual a 15.
4.3.7. LIMIARIZAO DO GRADIENTE
Esta etapa est representada pelo stimo bloco do diagrama da Figura 18, que
antecede a localizao da ris. Os gradientes referentes aos pixels que contornam a pupila so
geralmente os mais elevados da imagem, o que facilita a localizao da pupila. O mesmo no
ocorre para a borda entre a ris e a esclera, pois sob iluminao infravermelha essa borda no
se apresenta to ntida quanto sob a iluminao do espectro de luz visvel (Figura 31).

38

Figura 31 - Esquerda: Imagem de ris 019_2_2.bmp da base de dados CASIA. Direita:


Resultado da deteco de bordas atravs do operador de Sobel (mdulo do gradiente).

Portanto, para facilitar a deteco da ris, valores muito baixos de gradiente


devem ser evitados para que no sejam confundidos com as bordas da ris. Assim,
necessrio determinar um valor de corte para limiarizar os gradientes. Nesta proposta de
algoritmo o valor de corte determinado de forma dinmica, baseando-se nos parmetros da
imagem. Para determinar esse valor, gera-se o histograma da imagem do mdulo do gradiente
considerando-se o valor de corte aquele que trunca 40% desses valores. Este procedimento
elimina 40% dos menores valores de gradiente, que nesse caso so considerados como sendo
rudo. Esta porcentagem a que apresentou o maior nmero de ris localizadas na base de
dados CASIA. A Tabela 3 apresenta os dados do desempenho do algoritmo para valores de
corte entre 20 e 60%.
Tabela 3 Desempenho da deteco da ris para limiarizaes do gradiente entre 20 e 60% na
base de dados CASIA.
Limiar (%)

Rejeio (%)

20
25
30
35
40
45
50
55
60

3
4
4
4
3
3
3
3
3

Acertos (%)
Centro
Raio
90
90
91
91
91
90
91
91
90

81
81
81
81
82
81
81
81
80

39
4.3.8. DETERMINAO DOS PARMETROS DA RIS
A deteco da ris consiste em encontrar o raio e as coordenadas do centro da
ris. A determinao desses parmetros s possvel se a localizao da pupila for bem
sucedida, pois parte-se do princpio de que a ris e a pupila so dois crculos concntricos ou
quase concntricos. Assim, conhecendo-se o centro da pupila, qualquer tipo de busca pelos
parmetros da ris resume-se ao espao delimitado pelas redondezas do centro da pupila.
O primeiro passo para a deteco da ris a seleo de uma fatia horizontal
de vinte e uma linhas da imagem na altura do centro da pupila, como apresentada na Figura
32. Nota-se que as bordas entre a ris e a esclera so bastante suaves, o que dificulta a
definio de um valor de limiar, principalmente na presena de reflexos de iluminao nessa
regio.

Figura 32 Fatia da imagem usada para fazer a deteco. As bordas da pupila so facilmente
perceptveis, no entanto as fronteiras da ris no apresentam bordas ntidas.

O prximo passo transformar essa fatia em um vetor (Figura 33). Para isso,
calcula-se a mdia de cada coluna dessa fatia, que ser o valor do vetor naquela posio.
Nessa etapa existe um compromisso entre o nmero de linhas que compem a fatia e a
nitidez da borda da ris, pois quanto maior a altura da fatia, mais imune a rudos ser o
resultado, porm, como a borda da ris circular, ela ser suavizada e se tornar menos ntida.
Para uma ris com dimetro aproximado de 200 pixels, experimentalmente detectou-se que
uma fatia com altura de 21 pixels no compromete a nitidez da borda e pouco sensvel a
rudos.

40

Figura 33 Vetor gerado a partir da fatia da imagem. O pico estreito entre 180 e 210
causado pelo reflexo do sistema de iluminao. No entanto ele no interfere na localizao,
pois a busca pela ris inicia com um raio maior que o da pupila.

O terceiro passo a aplicao de um operador de derivada (ou de diferenas)


nesse vetor, a partir do centro da pupila em direo aos extremos, que resulta em um novo
vetor, apresentado na Figura 34. Nesta figura nota-se que as bordas da ris esto representadas
por dois aglomerados prximos das posies 81 e 301, e tambm que estes dados apresentam
rudos que dificultam a localizao exata da ris, principalmente em regies prximas das
extremidades da imagem.

Figura 34 Derivada do vetor gerado a partir da fatia da imagem. Notam-se pequenos


aglomerados que podem representar as bordas da ris.

Para reduzir o rudo aplica-se um filtro de mdia simtrico. Esse filtro


caracteriza-se por possuir duas janelas de mdia, posicionadas inicialmente na coordenada x
do centro da pupila. A cada iterao, as janelas deslocam-se uma posio em sentidos

41
opostos, em direo das extremidades do vetor. Com isso, um novo vetor gerado, onde o
valor de cada ponto igual mdia dos valores das duas janelas.
A aplicao do filtro de mdia no vetor apresentado na Figura 34 gera o vetor
representado pelo grfico da Figura 35. Nota-se que esse grfico simtrico, e que apresenta
picos candidatos a representarem as borda da ris. Quando existem apenas dois candidatos,
no existe dvida quanto a posio das bordas, pois um deles representa a borda direita e o
outro a esquerda. No entanto, quando existirem quatro, seis ou mais picos, calcula-se os pares
de vetores de gradiente para os candidatos (como explicado no item 4.3.6) e atribui-se a borda
da ris para o par de picos que possuir o maior escore.

Figura 35 Resultado da deteco da ris. Os picos representam as bordas da ris, observadas


em seu dimetro horizontal. Neste caso em que aparecem apenas dois picos, no existe dvida
quanto localizao da ris. No caso em que existe mais de dois picos, a busca deve ser
realizada atravs do clculo dos pares de gradientes.

O ltimo passo da localizao da ris o refinamento. O refinamento


necessrio porque o filtro de mdia simtrico aplicado no vetor de derivadas resulta em uma
deteco em que a pupila e a ris so concntricas. No entanto essa concentricidade no pode
ser assumida, pois na maioria das pessoas a pupila tem a tendncia de deslocamento nasal e
inferior em relao ris (DAUGMAN, 2001).
No refinamento, tem-se a informao aproximada de onde esto localizadas as
bordas da ris, portanto, seleciona-se no vetor da Figura 34 (que possui rudo, porm menos
distorcido pelo filtro de mdia simtrico) os dois mximos locais nas vizinhanas das bordas
encontradas, se eventualmente existirem. Enfim, o raio da ris calculado como a metade da
distncia entre as duas bordas, e a coordenada horizontal do centro como a metade da soma
das posies dessas bordas.

42
4.3.9. ESTIMATIVA DE FOCO
Conforme mencionado no item 4.1, a profundidade de campo (regio em que a
imagem aparece com nitidez) do sistema ptico para captura de ris de aproximadamente 1
cm, para imagens capturadas a 30 cm da lente. difcil para uma pessoa se posicionar sem
suporte exatamente a essa distncia e permanecer em foco e centralizada por alguns segundos
para que a sua ris seja registrada. Por isso, optou-se por desenvolver uma rotina para detectar
se uma imagem do vdeo que est sendo capturado est em foco.
Entre os mtodos de estimativa de foco existentes, pode-se citar aquele
desenvolvido por Park & Kim (2005), em que utilizaram o reflexo da iluminao na retina
para determinar se a imagem encontra-se em foco. Quando em foco, o reflexo apresenta-se
como um ponto branco na imagem, e quando fora de foco esse reflexo apresenta-se com um
pequeno disco. Pode-se citar tambm o mtodo utilizado por Daugman (2001), em que se
determina o foco de uma imagem atravs da potncia espectral obtida pela transformada de
Fourier da imagem.
O mtodo desenvolvido nesse trabalho baseia-se em caractersticas locais da
imagem para determinar o foco. O foco calculado aps a localizao da ris, e seu valor
obtido avaliando-se a nitidez das bordas verticais da pupila. O objetivo desse mtodo
atribuir um valor de foco para cada imagem, de forma que uma entre as diversas imagens
fornecidas pela cmera possa ser selecionada.

A Figura 36 apresenta o princpio de

funcionamento do sistema de obteno de foco. Nota-se que se a imagem estiver em foco, as


bordas da pupila sero bem definidas, e nos casos em que a imagem estiver fora de foco as
bordas da pupila apresentaro uma transio suave do nvel de cinza da pupila para o nvel da
ris.

Figura 36 Princpio de funcionamento do sistema de obteno do foco. (a) Modelo da ris e


as regies de interesse. (b) Situao de uma regio de intresse que est em foco. (c) Situao
de uma regio de interesse que est fora de foco.

43
Toma-se a mdia de cinco (valor obtido empiricamente) pixels esquerda da
borda, comparando-se com a mdia de cinco pixels direita. O valor absoluto da diferena
dessas mdias constitui o foco dessa borda. Da mesma forma calcula-se o foco da borda
oposta. O menor deles considerado o foco da imagem, pois nos casos em que a pupila for
localizada incorretamente e uma das bordas ficarem posicionada sobre uma regio homognea
da imagem, o resultado ser um baixo valor para o foco.
4.4. INTERFACE DE CONTROLE DA CAPTURA DE IMAGENS
O algoritmo de deteco foi implementado com linguagem de programao
C++, e encapsulado na forma de um Filtro de Transformao DirectX. DirectX uma
tecnologia do sistema operacional Windows que permite a manipulao de vdeos e sons na
forma de um grafo. De fato, o dispositivo de captura, os filtros de transformao, e o monitor
do microcomputador so nodos desse grafo. Uma das grandes vantagens dessa tecnologia a
possibilidade de criao de grafos em que os seus nodos so independentes entre si.
Assim, fica a cargo de um software aplicativo (escrito em qualquer linguagem
de programao que suporte DirectX) montar o grafo de captura, inserir os filtros desejados e
implementar a interface com o usurio.
A interface de controle da captura de imagens desenvolvido nesse trabalho foi
escrita em linguagem de programao C#.NET, na forma de um controle Windows. A
interface utiliza o grafo DirectX apresentado na Figura 37 e recebe mensagens do filtro de
deteco a cada instante em que uma imagem localizada. A mensagem enviada pelo filtro
contm os valores dos parmetros da ris e da pupila, assim como o valor estimado do foco.
Ao receber uma mensagem, o controle desenha a imagem em sua rea cliente, desenha os
crculos correspondentes s bordas da pupila e da ris, e lana um evento para sinalizar a
disponibilidade de uma imagem.

Figura 37 - Grafo DirectX do software de captura de imagens de ris. Da esquerda para a


direita, o primeiro bloco representa o hardware de captura de imagens, o segundo o filtro de

44
deteco da ris, o terceiro transforma imagens de 8 para 32 bits, e o ltimo representa o
monitor de vdeo.

Assim, cabe ao aplicativo que contm o controle capturar esse evento decidir o
que fazer com os dados fornecidos. Tendo assim um controle Windows, foi desenvolvido um
aplicativo de exemplo para demonstrar o funcionamento do sistema e realizar testes de
captura. A tela principal da interface exibida na Figura 38.

Figura 38 Tela principal do aplicativo de exemplo de captura automtica de imagens. O


software permite o cadastro de pessoas e tambm a pesquisa de indivduos atravs da ris.

A interface possui dois casos de uso: cadastro e pesquisa. Para realizar o


cadastro, seleciona-se a opo de menu Arquivo e depois Cadastrar Pessoa... , abre-se
ento a caixa de dilogo de cadastro, exibida na Figura 39.

45

Figura 39 A Caixa de Dilogo de Cadastro permite que seja tirada uma foto da pessoa, e que
sejam capturadas as imagens de ris.

Ao cadastrar uma pessoa possvel armazenar o seu nome, foto, e capturar as


imagens da ris. Tanto a foto como as imagens de ris podem ser obtidas de arquivo ou
capturadas a partir da cmera. Para capturar uma imagem de ris, seleciona-se a placa de
captura como o dispositivo de origem, e clica-se no boto +D para capturar imagens do
olho direito e o boto +E para imagens do olho esquerdo. Clicando em um desses botes
surge a caixa de dilogo de captura de ris (Figura 40).

46

Figura 40 Caixa de dilogo de captura de ris. Em sua rea cliente est o controle Windows
que gera eventos contendo informaes sobre os parmetros da ris e da pupila, assim como o
valor estimado do foco, distncia do centro da pupila ao centro da imagem, quadros por
segundo, centride, e regio de busca pelo centro da pupila.

Como o controle fornece diversos eventos de captura, preciso selecionar


aquele que contm uma imagem com parmetros satisfatrios. Por isso, para obter uma
imagem, antes de tudo preciso que ela tenha um foco mnimo de 30 nveis de cinza (com o
conjunto de lentes, cmera, e iluminao utilizado no possvel obter imagem com uma
diferena de cinza maior que 45 nveis, por isso o valor mnimo de foco igual a 30 uma
limitao de hardware) e que o centro da pupila esteja a uma distncia euclidiana mxima de
20 pixels do centro da imagem. Ao obter uma imagem com essas caractersticas, aguarda-se
mais um segundo por uma imagem com foco melhor ou cujo centro da pupila esteja mais
prximo do centro da imagem. Recebendo ou no outras imagens, quando o tempo de um
segundo se esgotar a caixa de dilogo fecha-se automaticamente disponibilizando a imagem
de ris capturada. Ento, possvel capturar mais imagens ou efetuar a insero das
informaes no banco de dados.
Se dentro de vinte segundos no for possvel obter pelo menos uma imagem
com parmetros satisfatrios, a caixa de dilogo fechada automaticamente e a captura falha.
Os tempos utilizados nesse procedimento so configurveis por software, e foram obtidos de
forma experimental durante o desenvolvimento levando-se em considerao duas pessoas sem
prtica na aquisio de imagens.

47
Tambm possvel pesquisar uma pessoa na base de dados. Para isso, clica-se
no boto capturar da tela principal, e depois de obtida uma imagem efetua-se a busca
selecionando-se a opo Procurar. Os registros encontrados so ento apresentados no
quadro Resultado da Busca.

CAPTULO 5

5 RESULTADOS
5.1. VALIDAO DA LOCALIZAO DA RIS
A validao do algoritmo de localizao est dividida em duas partes: gerao
do vdeo com imagens artificiais de ris e o processamento do vdeo utilizando o algoritmo de
localizao.
5.1.1. GERAO DO VDEO COM IMAGENS ARTIFICIAIS DE RIS
Para gerar o vdeo com imagens artificiais criou-se um componente DirectX,
escrito em linguagem C++, que fornece imagens simulando aquelas de uma cmera. As
imagens geradas so semelhantes ao modelo apresentado na Figura 41.

Figura 41 Imagem artificial de ris que compe o vdeo usado para a validao do algoritmo
de deteco.

Para simular movimento, a imagem desloca-se linearmente dentro do quadro


at colidir com uma das paredes, quando muda de direo e continua seu movimento. O
raio da ris permanece fixo com 90 pixels, mas o raio da pupila varia a cada quadro dentro do
intervalo de 20 a 62 pixels (aproximadamente entre 20 e 70% do tamanho da ris). O centro da
pupila coincide com o centro da ris em todos os quadros. Utilizou-se essa abordagem para
criar um vdeo composto por 500 quadros de tamanho 320240.

50
5.1.2. PROCESSAMENTO DO VDEO
O GraphEdit um programa distribudo junto com o DirectX e tem a
finalidade de simular fluxos de udio e vdeo. Com o GraphEdit criou-se um grafo
(semelhante ao apresentado na Figura 37) em que o vdeo gerado encontra-se na entrada do
componente que implementa o algoritmo de localizao. Ao executar o grafo, o componente
de localizao processa cada quadro do vdeo e armazena as informaes de localizao em
um arquivo. Como os parmetros da pupila e da ris do vdeo artificial so conhecidos, fez-se
uma comparao entre os valores reais e os obtidos atravs do algoritmo de localizao. O
resultado da comparao est apresentado na Figura 42.

Figura 42 Grfico que relaciona a freqncia de erros com o nmero de imagens.

Este grfico apresenta os erros obtidos para os raios da pupila e da ris, assim
como os erros das coordenadas de seus centros. Observa-se que existe um grande nmero de
acertos nos raios da pupila e da ris, e uma freqncia elevada de erros por trs pixels da
coordenada x da ris. Observando-se as imagens constatou-se que esse um erro de tendncia
em que o centro da ris localizado pouco esquerda (trs pixels) de sua posio exata.
Entre as 500 imagens, em uma delas no foi possvel localizar a pupila, e em
outra no foi detectada a ris. Em duas imagens houve um erro de quatro pixels no clculo da
coordenada x, assim como em duas imagens houve o mesmo erro no raio da ris.

51
5.2. VALIDAO DO MTODO DE CAPTURA DE IMAGENS
Foram realizados testes de captura de imagens em ambiente fechado, em que
participaram 6 pessoas, sendo que trs delas possuam ris de cor clara e o restante de cor
escura. O teste constituiu em posicionar a pessoa em frente cmera (sem culos e sem lentes
de contato), tirar uma foto, capturar o olho direito e depois o olho esquerdo.
Depois de posicionadas em frente cmera, as pessoas levaram em torno de 20
segundos para ter cada uma de suas ris capturadas. O processamento de cada quadro de
320240 pixels levou em torno de 11 ms em um Notebook Sony Vaio SZ160P, com
processador Intel Centrino Duo Core 1,86 GHz. Isso faz com que a captura ocorra em tempo
real a uma taxa de 29 quadros por segundo.
A principal dificuldade para a captura de imagens fazer com que a pessoa
centralize o seu olho na imagem e ento entre em foco, projetando-se para frente ou para trs
at que uma imagem de boa qualidade possa ser gerada. Alm disso, o monitor de vdeo em
que a pessoa recebe a realimentao de sua posio (Figura 43) gera imagens espelhadas,
ou seja, quando a pessoa desloca-se para a esquerda, a sua imagem desloca-se para a direita, e
vice-versa. Isso gera grande desconforto e uma sensao de que a correo no posicionamento
no surte efeito na imagem. Portanto, pessoas habituadas a realizar este procedimento tm
suas ris capturadas com mais facilidade, reduzindo o tempo de captura. Durante o teste, uma
pessoa no pde ser cadastrada no sistema, pois no conseguiu posicionar-se corretamente
diante da cmera. Isto plausvel, pois a captura realizada com o usurio sem culos ou
lentes de contato, o que causa grande dificuldade (principalmente quando a pessoa portadora
de astigmatismo) para fazer a sua ris entrar na regio de foco da lente. Aparentemente um
sistema de aquisio de imagens com teleobjetivas de zoom automtico poderia corrigir essa
deficincia de captura, contudo isso no foi avaliado nesse trabalho.

52

Figura 43 Prottipo do sistema de aquisio de imagens

Outro problema encontrado est relacionado com a maquiagem na regio dos


olhos. Produtos utilizados para pintar as plpebras e os clios possuem colorao muito escura
sob iluminao infravermelha. Consequentemente, essa regio escura permanece na imagem
aps a binarizao, causando um deslocamento no centro de gravidade da imagem. Quando
esse deslocamento exagerado, ou seja, quando a rea dessa regio escura muito grande, o
espao de busca no contm o centro da pupila, o que impede que os parmetros da ris sejam
detectados.
A luz do sol tambm prejudica a captura de imagens. O filtro infravermelho
utilizado na lente possui freqncia de corte em 900 nanmetros, e a radiao encontrada na
luz natural, mesmo quando projetada de forma indireta, possui muitos componentes de
freqncia com comprimentos de onda maiores que 900 nanmetros. Ao contrrio, lmpadas
incandescentes e fluorescentes interferem pouco na aquisio, pois so de baixa potncia ou
possuem poucos componentes de baixa freqncia. Ao analisar o histograma de uma imagem
capturada com reflexos de luz solar percebe-se que o valor mdio dos nveis de cinza da
imagem aumenta e o contraste tambm aumenta. No entanto, algumas pupilas tornam-se to
pequenas (com raios da ordem de 10 pixels) que no so detectadas pelo algoritmo. O motivo

53
que a rea da pupila torna-se pequena e assim o pico do histograma, formado pelos pixels
que constituem a pupila, torna-se tambm pequeno, sendo confundido com o rudo e
eliminado pela suavizao do histograma (Figura 44).

Figura 44 Histograma de uma imagem com pupila pequena. Nesse histograma o primeiro
mximo local que representa a pupila to pequeno que eventualmente eliminado com o
rudo.

Outro problema est relacionado com a forma geomtrica da pupila. Existem


pupilas que no so circulares, e sim elpticas (Figura 29). uma premissa do algoritmo de
deteco que a pupila e a ris sejam circulares (mas no necessariamente concntricas).
Quando o valor da excentricidade da pupila muito diferente de 1.0, a deteco falha. O
motivo que os pares de vetores de gradiente no coincidem, e o escore resultante do crculo
baixo, fazendo que a tripla candidata pupila seja descartada. A deteco tambm falha
quando a pupila circular, mas est posicionada de forma oblqua lente, gerando uma
projeo ortogonal elptica da pupila em relao lente.
5.3. AVALIAO DO ALGORITMO DE DETECO DE FOCO
Conforme mencionado no item 4.3.9, para que o programa de deteco da ris
e da pupila tenha sucesso fundamental que durante o processo de captura da imagem o olho
esteja dentro do intervalo de profundidade de campo do sistema ptico. Dessa forma, garantese a aquisio de uma imagem bem definida e a medida exata dos parmetros da pupila. Nesse
trabalho programou-se uma rotina que avalia o foco da imagem em tempo real para que seja
possvel armazenar a imagem automaticamente.
O funcionamento dessa abordagem foi avaliado em um experimento com duas
pessoas em que o foco da imagem foi estimado em todos os quadros com localizao bem
sucedida. O experimento consiste em a pessoa posicionar o olho muito prximo da lente de
captura e afastar-se lentamente na direo axial dessa lente, passando pelo valor mximo de

54
foco e finalizando quando a imagem ficar completamente fora de foco. O grfico gerado a
partir dos dados obtidos nesse experimento est apresentado na Figura 45.

Figura 45 Resultado de quatro experimentos em que o candidato, prximo da cmera, foi se


afastando lentamente, at que a imagem ficasse completamente fora de foco. O experimento
mostra que existem mximos nos quatro eventos realizados.

55
Neste grfico, o valor do foco (em nveis de cinza) dado pela ordenada e o
nmero da imagem na abscissa. Quando o olho est muito prximo da lente o foco tem um
valor baixo, que aumenta progressivamente at atingir o ponto de mximo, para ento
decrescer novamente. Essas curvas mostram que quando a imagem da ris passa por um valor
mximo de nveis de cinza o qual corresponde ao foco, o mtodo de clculo retorna um valor
mximo.
Segundo as recomendaes do item anexo A.4 do padro INCITS M1/030590, a imagem deve ter no mnimo 90 nveis de cinza de separao entre a esclera e a ris, e
no mnimo 50 nveis entre a ris e a pupila. Com o sistema de aquisio utilizado no trabalho,
o maior valor de foco obtido foi de 45 nveis (como pode ser visto no grfico da
Figura 45), portanto no foi possvel obter imagens como aquelas
recomendadas pelo INCITS. Para obter imagens conforme as recomendaes do INCITS
necessrio que a lente e a cmera sejam adequadas para operar na faixa de infravermelho, e
que a iluminao seja uniforme e com potncia suficiente para causar tal contraste na imagem.
Uma alternativa, que no foi abordada nesse trabalho, realizar a captura das imagens na
faixa de iluminao visvel.
Testes de captura em ambiente fechado foram realizados (sem a interferncia
da iluminao solar) com dez pessoas. Quando o teste realizado em ambiente fechado,
significa dizer que a ris ser iluminada apenas pelo sistema de iluminao infravermelha
construdo. Empiricamente, o valor mnimo de foco exigido para a captura foi ajustado para
35 nveis de cinza. Nesses termos, todas as imagens capturadas apresentaram-se em foco, o
que comprova a eficincia desse mtodo, condicionada a esta restrio.

CAPTULO 6

6 CONCLUSO
6.1. DISCUSSES
Neste trabalho foi desenvolvido um sistema para a captura automtica de
imagens de ris para fins biomtricos. O tempo para determinar a existncia de uma ris em
uma imagem e calcular os seus parmetros assim como o seu foco ficou em torno de 11 ms
em um computador Intel Centrino Duo Core 1,86 GHz. Assim, suficiente que uma pessoa
permanea poucos instantes com o seu olho centralizado e no ponto focal diante da cmera
para ter a sua ris capturada. Para a deteco dos crculos referentes pupila e ris foi
utilizado o mtodo de Pares de Vetores de Gradiente (RAD et. al, 1998) auxiliado pelo
algoritmo de Bresenham (1965) para crculos, como uma alternativa Transformada de
Hough Circular (BALLARD, 1981).
Determinar a qualidade das imagens a etapa mais difcil de ser realizada em
um sistema biomtrico. Por isso foram determinadas algumas caractersticas que afetam
diretamente a qualidade assim como formas de mensur-las, tais como a estimativa de foco e
a forma do histograma. Mesmo assim, essas caractersticas so vlidas apenas para imagens
em que o olho preenche grande parte da rea da imagem.
A estimativa de foco realizada somente nos casos em que a pupila for
localizada corretamente, pois depende diretamente desses parmetros. Por isso, esse mtodo
no adequado para tentar avaliar o foco antes da deteco dos parmetros. No entanto, este
mtodo ajuda a rejeitar algumas imagens localizadas incorretamente, naqueles casos em que o
raio da pupila erroneamente estimado. Assim, considerando que o raio da pupila real
maior que o da pupila estimada, pelo menos um dos estimadores de foco apresenta resultado
muito baixo, o que permite que a imagem seja rejeitada.
Tambm foi observado nos testes que eventualmente so capturadas imagens
no instante em que a pessoa est olhando para o lado. Isso ocorre quando o raio da pupila
torna-se muito pequeno, e uma conseqncia do algoritmo de deteco de crculos atravs
de pares de vetores de gradiente. De fato, quanto menor o crculo, menos pares de gradiente
ele possui para ser avaliado. Como poucos pares de vetores so suficientes para produzir uma

58
tripla com escore alto, isso gera um falso candidato. Uma soluo para esse problema
capturar imagens de tamanho maior, como por exemplo, 640480 pixels. Assim, o raio
mnimo admitido para a pupila seria de 30, e no 15 pixels, o que se espera que elimine o
problema, alm de melhorar a qualidade das imagens.
O padro INCITS M1/03-0590 para imagens de ris sugere que imagens de alta
qualidade devem ter 200 pixels ou mais como dimetro da ris, o que indica uma resoluo de
aproximadamente 20 pixels por milmetro. Observa-se que essa resoluo a mesma utilizada
para capturar imagens em grandes sistemas de reconhecimento de impresses digitais.
No algoritmo de deteco percebe-se um erro de tendncia. A causa desse erro
o empate do escore das triplas em todos os critrios utilizados. Assim, fica claro que seria
interessante utilizar mais um critrio, dessa vez com capacidade de discriminar as triplas pela
sua posio. Atualmente, se nove triplas vizinhas possurem o mesmo escore, a primeira delas
seria a escolhida. Um aperfeioamento poderia selecionar aquela que possusse a menor
distncia em relao s outras. Uma forma mais simples poderia apenas deslocar os centros
uma unidade para baixo e para a direita, considerando que este no um erro aleatrio e sim
de tendncia.
6.2. CONCLUSO
O software para a captura automtica de imagens de ris foi desenvolvido e
testado no prottipo construdo e permite a captura de imagens sem a interveno do
operador. O algoritmo de localizao foi validado no simulador de ris proposto e determinou
os parmetros de 99% das imagens avaliadas.
6.3. TRABALHOS FUTUROS
Realizar a deteco em imagens de tamanho 640480 (tamanho VGA) permite
que o usurio tenha uma mobilidade maior, ou seja, ele no precisaria centralizar exatamente
o seu olho para realizar a captura. Alm disso, a captura de imagens maiores aumenta a
qualidade da imagem e do sistema como um todo, pois tende a reduzir as taxas de falsa
aceitao e de falsa rejeio do software. Sugere-se que para processar uma imagem VGA, a
mesma seja reduzida para 320240 e, depois de determinados, os parmetros passem por um
refinamento na imagem de tamanho original. Infelizmente no comum atualmente encontrar

59
placas de vdeo que capturem imagens VGA de boa qualidade a uma taxa de 30 quadros por
segundo e ainda assim disponibilizando tempo hbil para o processamento dos quadros.
Detectar plpebras rapidamente importante para alertar o usurio (atravs de
um sinal sonoro ou luminoso) para abrir ao mximo o seu olho no instante da captura. Assim
evita-se tambm que os clios interfiram na deteco dos parmetros.
Estimar o foco com diferentes nveis de iluminao e com diferentes cores de
ris interessante por apresentar a variao do resultado em funo de fatores encontrados no
dia a dia. O primeiro por influncia da luz solar, e o segundo porque de fato as ris de olhos
azuis so mais escuras (do ponto de vista infravermelho) do que as de cor marrom.
Outra sugesto de trabalho futuro aperfeioar o simulador de ris para que as
imagens geradas sejam mais prximas da realidade. Por exemplo, pode-se aplicar efeitos de
iluminao no uniforme, distoro por rudo, suavizao de bordas, e variao de foco.

CAPTULO 6
REFERNCIAS BIBLIOGRFICAS

BALLARD, D. H. (1981), Generalizing the Hough Transform to Detect Arbitrary Shapes,


Pattern Recognition, Volume 13, p. 111-112.
BARRET, William A., COUCH, John D. (1979), Compiler Construction: Theory and
Practice, Science Research Associates Inc., 1 Edio, p. 69.

BRESENHAM, J. E. (1965), Algorithm for computer control of a digital plotter, IBM


Systems Journal, Volume 4, N 1, p. 25-30.
CANNY, J. (1986), A computational approach to edge detection, IEEE Transactions on
Pattern Analysis and Machine Intelligence, Volume 8, p. 679-698.
CASIA IRIS DATABASE, http://www.sinobiometrics.org/casia iris.htm
CHEN, Tehchuan, CHUNG, Kuoliang, (2001), An Efficient Randomized Algorithm for
Detecting Circles, Computer Vision and Image Understanding, p. 172-191.

CHO, Dal Ho, PARK, Kang Ryoung, RHEE, Dae Woong (2005), Real-Time Iris Localization
for Iris Recognition in Cellular Phone, Sixth International Conference on Software

Engineering, Artificial Intelligence, Networking and Parallel/Distributed Computing


and First ACIS International Workshop on Self-Assembling Wireless Networks
(SNPD/SAWN'05), p. 254-259.
CUI, Jiali, MA, Li, WANG, Yunhong, TAN, Tieniu, SUN, Zhenan (2004), An AppearanceBased Method for Iris Detection, The 6th Asian Conference on Computer Vision,

Volume 2, p. 1091-1096, Jeju Korea.


DAUGMAN, John (2001), High Confidence Recognition of Persons by Iris Patterns,
University of Cambridge, The Computer Laboratory, IEEE.

62
DUDA, Richar O., HART, Peter E. (1975), Use of the Hough Transform to Detect Lines and
Curves in Pictures, Communications of the ACM 15, p. 11-15.

DUDA, Richar O., HART, Peter E., STORK, David G. (2001), Pattern Classification, John
Wiley & Sons Inc., 2 Edio.
MARQUES FILHO, Og, VIEIRA NETO, Hugo (1999), Processamento Digital de Imagens,
Editora Brasport Livros, Rio de Janeiro.
GONZALEZ, Rafael C., WOODS, Richard E. (2000), Processamento de Imagens Digitais,
Editora Edgard Blcher Ltda., So Paulo.
INCITS M1/03-0590 (2003), InterNational Committee for Information Technology
Standards, Iris Image Interchange Format, Anexo A, p. 13.

KEE, Gyundo, BYUN, Yungcheol, LEE, Kwanyong, LEE, Yillbyung (2001), Improved
Techniques for an Iris recognition System with High Performance, Proceedings of the

14th Australian Joint Conference on Artificial Intelligence: Advances in Artificial


Intelligence, Volume 2256, p. 177-188.
MENP, Topi (2005), An Iterative Algorithm for Fast Iris Detection, Advances in
Biometric Person Authentication: International Wokshop on Biometric Recognition
Systems, p. 127, IWBRS 2005, Beijing, China, Springer Berlin, ISBN: 354029431-7.
MCLACHLAN, Geoffrey J. (2004), Discriminant Analisys and Statistical Pattern
Recognition, John Wiley & Sons Inc., Hoboken, New Jersey.

MIRA JNIOR, Joaquim de, MAYER, Joceli (2003), Image Feature Extraction for
application of Biometric Identification of Iris: A Morphological Approach, XVI

Simpsio Brasileiro de Computao Grfica e Processamento de Imagens, So Carlos,


So Paulo, Brasil.
PAN, Lili, XIE, Mei (2005), The algorithm of iris image preprocessing, Fourth IEEE
Workshop on Automatic Identification Advanced Technologies, p. 134-138.

63
PARK, Kang Ryoung, KIM, Jaihie (2005), A real-time focusing algorithm for iris recognition
camera, IEEE Transactions on Systems, Man and Cybernetics, Volume 35, p. 441-

444.
PRATT, William K. (2001), Digital Image Processing: PIKS Inside, 3 Edio. John Wiley &
Sons, Inc., ISBN: 047137407-5.
RAD, Ali Ajdari, FAEZ, Karim, QARAGOZLOU, Navid (2003), Fast Circle Detection
Using Gradient Pair Vectors, Proc. VII Digital Image Computing, Sydney, p. 879-

887.
RUSS, John C. (1998), The Image Processing Handbook, 3 Edio, CRC Press LLC, ISBN:
084932532-3.
THE IMAGING SOURCE EUROPE GMBH (2003), Lenses: Selection and Setup,
http://www.1394imaging.com
THEODORIDIS, Sergios, KOUTROUMBAS, Konstantinos (2003), Pattern Recognition,
Academic Press, 2 Edio.
WILDES, Richard P. (1997), Iris Recognition: An Emerging Biometric Tecnology,
Proceedings of the IEEE, Volume 85, n 9.
WILDES, Richard P., ASMUTH, J. C., GREEN, G. L., HSU, S. C. (1994), A System for
Automated Iris Recognition, David Sarnoff Research Center Inc., Princeton, NJ, IEEE.

ZHANG, Pengfei, LI, Qiuming (2005), Resarch on Iris Image Preprocessing Algorithm,
Proceedings of the Fourth International Conference on Machine Learning and
Cybernetics, p. 5220-5224, Guangzhou-China.

RESUMO
Nesta dissertao prope-se um algoritmo para capturar imagens do olho e
localizar de forma automtica a pupila e a ris. O algoritmo proposto tem aplicaes em
sistemas que utilizam as informaes geomtricas do olho (raio e coordenadas do centro da
pupila e da ris), como por exemplo, sistemas de reconhecimento de ris. Para o
desenvolvimento do algoritmo, montou-se um prottipo para aquisio das imagens composto
por uma cmera de vdeo, filtro infravermelho, sistema de iluminao, monitor, objetiva de
100 mm, e uma placa de captura ligada ao computador. O mtodo proposto baseia-se na
reduo do espao de busca para que o processamento de uma imagem possa ser avaliado em
tempo real (30 quadros por segundo). Por isso, realizou-se um estudo em 756 imagens da base
de dados CASIA para utilizar o centride da imagem como uma estimativa para o centro da
pupila e um estudo baseado no histograma da imagem para estimar do raio da pupila. Essas
estimativas permitem que a imagem seja processada de forma rpida, e capturada se
determinados critrios de qualidade forem satisfatrios. Um desses critrios um parmetro
estatstico chamado de diferena das mdias, que foi determinado atravs do estudo de 4018
imagens da base de dados BDIRIS. O outro critrio a estimativa de foco, que uma medida
da nitidez da borda da pupila. Esses critrios permitem aceitar ou rejeitar uma imagem, o que
essencial em um sistema de aquisio automtica de imagens. O algoritmo desenvolvido foi
implementado e testes revelam que o sistema captura imagens de ris em tempo real, bastando
que para isso a pessoa posicione-se corretamente diante da cmera de vdeo.

PALAVRAS-CHAVE
Biometria, captura da ris, reconhecimento de ris, estimativa de foco, tempo real.
REAS DE CONHECIMENTO
10301038 - Anlise de Algoritmos e Complexidade de Computao
10303057 - Processamento Grfico (Graphics)
10303006 - Metodologia e Tcnicas da Computao
2006
N. 419

Anda mungkin juga menyukai