Anda di halaman 1dari 116

ANAI

SDACONFERNCI AI
NTERNACI ONAL
DECINCIASFORENSESEM MULTIMDIA
ESEGURANAELETRNICA

18a21deSetembrode2012
Bras
li
a/DF,Bras
il
ANAIS DA CONFERNCIA INTERNACIONAL
DE CINCIAS FORENSES EM MULTIMDIA
E SEGURANA ELETRNICA

18 a 21 Setembro de 2012
Braslia-DF
Sumrio
3 Apresentao
6 Tutorial: Perspectivas da Fontica Forense num Cenrio de Quebra
do Dogma da Unicidade
28 Artigos
29 Aplicao de Engenharia Reversa em Exames de Verificao de
Edies de Vdeos Digitais
34 Identificao de Origem e Verificao de Edies em Filmes
Fotogrficos: Anlise de Um Caso Real.
40 Deteco de Nudez Utilizando Redes Neurais Artificiais
44 Mtodo para Compatibilidade entre Impresses Digitais com e sem
Contato
49 Estudo de Performance de Algoritmos de Verificao de Impresses
Digitais Aplicveis a Smart-Card
57 Avaliao de Tcnicas de Seleo de Quadros Chave na
Recuperao de Informao por Contedo Visual para Identificar
Crimes Cibernticos em Contedo Multimdia
64 Reconstruo de Trajetria de Voo para Simulaes 3D em
Sinistros Aeronuticos
72 FI2 - Uma Proposta de Ferramenta para Investigao Forense em
Imagens
78 Exames de Reconhecimento Facial na Polcia Federal
86 Estimativa de Altura de Indivduos em Imagens de Perspectiva
Cnica com Distores Esfricas (Caso Prtico)
94 On the Practical Aspects of Applying the PRNU Approach to Device
Identification Tasks
100 Avaliao de Classificadores Haar Projetados para Deteco Facial
107 Identificaco de Cmeras de Celulares Usando Sensor Pattern
Noise
Apr
esent
ao
com muita satisfao que reunimos nesta obra os
artigos que foram submetidos I Conferncia Internacional de
Cincia Forenses em Multimdia e Segurana Eletrnica e
selecionados por sua relevncia no desenvolvimento e na
divulgao do trabalho pericial correlatado anlise forense de
evidncias multimdia e implementao de sistemas de
segurana eletrnica.
Fruto do trabalho de Peritos Criminais e pesquisadores,
os artigos selecionados so reflexo de uma iniciativa de
grandioso valor que busca a disseminao e uniformizao do
conhecimento na realizao de exames periciais, a integrao
entre os especialistas forenses e o desenvolvimento de tcnicas,
mtodos e doutrinas relacionados a prtica pericial na realizao
de exames que envolvam a anlise de evidncias multimdia e
sistemas de segurana eletrnica.
Sendo assim, podemos destacar alguns estudos de caso
onde Peritos Criminais relatam a soluo de problemas
importantes na prtica da atividade pericial, envolvendo a anlise
de contedo de evidncias multimdia, como vdeos, imagens e
registros de udio, bem como a busca de indcios de edio. A
realizao de tais estudos serve no somente para a divulgao
dos trabalhos, mas tambm para a discusso de outras

4
abordagens e solues, bem como para a uniformizao de
procedimentos, sempre observando as melhores prticas.
Tambm so apresentados trabalhos de pesquisa
envolvendo proposio de solues para diferentes problemas,
com suas vantagens e desvantagens, assim como novas
abordagens para problemas em aberto. Nesse contexto, so
apresentados trabalhos relacionados utilizao e ao
desempenho de sistemas de biometria por impresses digitais,
biometria facial, deteo de nudez e identificao de origem de
imagens estticas.
Alguns trabalhos relacionados metodologia
empregada em exames periciais envolvendo a anlise de
evidncias multimdia foram realizados, funcionando como
catalizadores para uma evoluo sistemtica e paulatina das
prticas periciais, visando um melhor aproveitamento da prova
material.
Este compndio traz ainda um excelente tutorial
relacionado a metodologia empregada em exames na rea de
fontica forense. O tutorial intitulado Perspectivas da Fontica
Forense num Cenrio de Quebra do Dogma da Unicidade, aborda
um tema de extrema importncia para a Criminalstica como um
todo, e de grande atualidade.
Gostaramos, por ltimo, de agradecer a todos os
autores que, com sua participao, contriburam para a
produo de um evento de qualidade.

Comisso Tcnica da ICMedia 2012

5
Tut
ori
al
Perspectivas da fontica forense num cenrio de
quebra do dogma da unicidade
Charles Rodrigues Valente
SEPAEL, Instituto Nacional de Criminalstica
Braslia, DF, CEP 70.610-902, Brasil
charles.crv@dpf.gov.br

RESUMO Na percia oficial brasileira ainda h pouca  um exame de DNA forense que investi-
discusso a respeito da chamada mudana de paradigma
na Criminalstica, com sua crtica ao dogma da unicidade. ga se um resduo biolgico foi produzi-
Este tutorial apresenta os principais argumentos que emba- do por um determinado suspeito;
sam as propostas recentes de uma nova abordagem para a
comparao forense de locutor, alm de tambm discutir a  um exame de reconhecimento de pa-
utilizao de razes de verossimilhana (LR, Likelihood dro que procura determinar se uma
Ratios) nesse tipo de exame.
marca de solado provm de determina-
1. INTRODUO
do calado;

Muitas reas da Criminalstica envolvem o  um exame de reconhecimento facial em


que chamaremos aqui de problema da determi- que se compara a imagem da face de
nao da fonte ou origem: dado um vestgio uma pessoa em um vdeo de um siste-
o material questionado , uma pessoa ou objeto ma de vigilncia com a fotografia de
suspeitos de o terem produzido (ou terem sido um suspeito obtida em situao contro-
utilizados na sua produo) so apresentados lada;
percia, para obteno de material de mesma  um exame de fontica forense em que
natureza do material questionado, o qual cons- se avalia se as falas em uma gravao
tituir o material padro. Em alguns casos, o questionada foram emitidas por uma
material padro pode ter sido obtido por outras determinada pessoa.
instncias que no a pericial, sendo posterior-
Os exames relacionados determinao da
mente encaminhado aos peritos.
fonte so tradicionalmente abordados a partir
O que se pergunta percia : a pessoa ou de uma metodologia de comparao de caracte-
objeto suspeitos produziram o vestgio? rsticas que tem os seguintes passos gerais:
So exemplos desse tipo de exame: 1) anlise prvia do material questionado
 um confronto microbalstico no qual se a fim de verificar se ele contm infor-
investiga se um projetil foi disparado mao suficiente para possibilitar a
por uma determinada arma de fogo; comparao;

 um exame grafoscpico (ou grafotcni- 2) obteno de material padro apropria-


co) que avalia se lanamentos manus- do, ou anlise do material enviado pe-
critos questionados foram produzidos rcia a ttulo de padro para verificar se
por uma determinada pessoa; utilizvel. Em geral, esse estgio leva
em conta requisitos referidos nos textos
 um confronto datiloscpico que procura de Criminalstica como adequabilida-
atribuir (ou no) a produo de um de, quantidade, contemporaneida-
fragmento de impresso digital a uma de, autenticidade e
determinada pessoa; espontaneidade (por exemplo, ver:
[1], p. 203-204; [2], p. 300-314; [3], p.
286-287);

7
3) extrao ou levantamento de um deter- por exemplo, algum diz eu me identifico
minado conjunto de caractersticas jul- com Fulano de Tal, quer dizer que v entre si
gadas discriminadoras do material pa- e Fulano de Tal um conjunto de caractersticas
dro e do material questionado; comuns (preferncias, viso de mundo, atitudes
etc.) que permitem colocar a si e Fulano de Tal
4) comparao das caractersticas levanta-
em uma mesma classe, e esse significado de
das e concluso a respeito da coinci-
identificao est relacionado ao primeiro
dncia ou no da origem do material
conceito definido no pargrafo anterior. J
padro e do material questionados.
quando, por exemplo, no noticirio dito que
A respeito dessa metodologia geral, h duas o suspeito do crime foi identificado, o signi-
questes subjacentes de grande importncia e ficado de identificao (ou deveria ser) o que
que esto inter-relacionadas: se denominou no pargrafo anterior de indivi-
Questo 1: que embasamento cientfico os dualizao.
respectivos ramos da Criminalstica Se a anlise pericial demonstrar que proprie-
apresentam para concluir sobre a ques- dades do material questionado e do padro in-
to da determinao da fonte ou origem dicam que o ente (pessoa ou objeto) que os
a partir dessa metodologia geral? produziu tem um certo conjunto de caractersti-
Questo 2: que tipo de concluso possvel cas comuns, ter, a rigor, determinado uma
apresentar? Quantitativa, qualitativa, classe de seres que poderiam dar origem ao
categrica, escala de probabilidade? vestgio, e realizado uma identificao, no
uma individualizao. Essa identificao est
2. IDENTIDADE QUALITATIVA E IDENTIDADE NUMRICA relacionada, conforme [4], p. 206, ao que tam-
bm denominado identidade qualitativa dos
Para tentar responder s questes propostas membros da classe.
ao final da introduo, necessrio primeira-
mente distinguir duas operaes lgico-concei- Por outro lado, se a anlise da origem apon-
tuais que, normalmente, na determinao fo- tar uma pessoa ou objeto especfico como
rense da origem de um vestgio, tanto nos lau- aquele que originou o vestgio, o que se reali-
dos periciais quanto em muitos livros e peri- zou foi uma individualizao, a qual est rela-
dicos da rea, so confundidas. cionada ao que se denomina identidade num-
rica daquela pessoa ou objeto especfico.
2.1. IDENTIFICAO E INDIVIDUALIZAO
Pela prpria natureza das duas operaes,
Usando a nomenclatura encontrada em [4], v-se que a identidade qualitativa, no caso da
p. 206, essas duas operaes so denominadas investigao de origem, pode ser estabelecida a
identificao (ou identificao qualitativa, partir do levantamento de caractersticas co-
como veremos a seguir) e individualizao muns entre dois entes ou, ainda, pelas caracte-
(ou identificao numrica, como tambm rsticas comuns entre traos ou marcas por eles
veremos a seguir). produzidas. J a identidade numrica s pode
A identificao seria o agrupamento de um ser estabelecida, a rigor, pela garantia da conti-
conjunto de seres em uma classe com base no nuidade no tempo, no caso, entre o instante em
levantamento de caractersticas comuns entre que o ser produziu o vestgio e o instante em
esses seres. J a individualizao seria a opera- que a sua identidade foi atestada.
o de destaque de um nico ser. Portanto, da identidade qualitativa no se-
Deve-se notar que, na lngua portuguesa, no gue, por deduo, a identidade numrica.
seu uso comum, identificao, bem como
2.2. ESCOLHA DE CARACTERSTICAS DEFINIDORAS DA CLASSE
cognatos como identidade, so termos amb-
guos, que podem ter, conforme o contexto, Deve-se notar que o estabelecimento da
qualquer um dos dois significados. Quando, identidade qualitativa processo que chamare-

8
mos aqui de identificao qualitativa est reconhece que a comparao de caractersticas,
umbilical e necessariamente associado esco- que o cerne da metodologia geral apresentada
lha de um modelo e/ou de um conjunto de ca- na Introduo, no acompanha no tempo o ob-
ractersticas as quais so usadas para definir a jeto ou indivduo que produziram o vestgio.
classe de seres.
2.4. HIERARQUIA DE PROPOSIES
Essa escolha pode implicar, dependendo do
tipo das caractersticas classificadoras, em ter Como visto, a anlise pericial da questo da
outro nvel de escolha embutido: a determina- origem feita com base na metodologia geral
o, qualitativa ou quantitativa, de quando se apresentada na Introduo no capaz, por
considera a caracterstica presente ou no, ou a uma limitao lgica, de realizar a identifica-
adoo de uma escala de gradao que vai da o numrica. Porm, a identificao numrica
ausncia ou presena, em grau mximo, da ca- um pressuposto, ao menos terico, no qual se
racterstica. fundamenta a imputao penal. Essa constata-
o poderia levar a concluir que a percia tem
No caso da percia de determinao da fonte, uma contribuio pequena para a Justia, o que
o que se quer dizer que o resultado da percia obviamente incorreto.
diretamente dependente dos parmetros de
comparao e da mtrica escolhida para men- Em primeiro lugar, o que se deve ter em
surar a distncia entre o material questionado e mente que a percia, apesar de ser um ele-
o material padro. mento importante na cadeia de persecuo pe-
nal, no retira do rgo julgador a responsabili-
Esse processo de escolha no pressuposto dade ltima pela deciso de mrito, em particu-
lgico necessrio no estabelecimento da identi- lar sobre a fixao penal da autoria do delito.
dade ou identificao numrica.
Alm disso, deve-se ter em mente que a per-
2.3. CONTINUIDADE NO TEMPO cia no se restringe aplicao da metodologia
A continuidade no tempo no uma questo bsica de investigao da origem.
alheia ao contexto jurdico-policial e pericial. Uma maneira de situar o trabalho da percia
Por exemplo, ela a preocupao central quan- na cadeia de persecuo penal a proposta de
do se fala em cadeia de custdia ([4], p. 207), hierarquia de proposies contida em [5], que
ou seja, quando se implementam mecanismos comentada, por exemplo, em [6], p. 118-120.
que busquem garantir que o vestgio colhido na
Com base nesse artigo, adaptando a aborda-
cena de crime ou apresentado como prova per-
gem para o enfoque aqui desenvolvido, pode-
manea o mesmo ao longo de toda a cadeia de
se dizer que as hipteses ou proposies pass-
persecuo penal.
veis de serem confrontadas pela percia so
E ainda que muitos manuais tradicionais de classificveis em trs nveis:
Criminalstica no explicitem a diferena lgi-
 nvel I ou nvel da fonte (source):
ca entre a identificao qualitativa e a identifi- aquele em que as proposies ou hip-
cao numrica, ela est implcita em relao teses se referem determinao da fon-
continuidade no tempo em um dos requisitos te ou origem do material questionado.
desejveis do material padro: a contempora- O exame centrado na anlise do vest-
neidade em relao ao material questionado gio e do material padro;
(ver, por exemplo: [2], p. 300 e 308; [1], p.
203-204; [3], p. 286 e 292).  nvel II ou nvel da atividade (activity):
aquele em que as proposies se refe-
Exceto em exames associados a caractersti- rem efetiva presena do suspeito no
cas tidas como perenes ou de alterao apenas tempo, lugar e situao em que se deu a
em eventos drsticos como o caso do mate- ao ou omisso objeto de questiona-
rial gentico e dos desenhos papilares, respecti- mento;
vamente o requisito da contemporaneidade

9
 nvel III ou nvel do delito (offence): formao de natureza circunstancial, ou seja,
aquele em que a percia trata de hipte- informao que agregasse elementos de conti-
ses referentes prtica da ao ou nuidade no tempo anlise. Proposies desse
omisso pelo suspeito. tipo j seriam do nvel II na hierarquia proposta
em [5].
Do nvel I para o nvel III cresce a aproxima-
o entre as proposies e o estabelecimento Progredindo na hierarquia, no nvel III tem-
da autoria delitiva. se que as hipteses a serem confrontadas dizem
respeito ao cometimento, pelo suspeito, da
importante salientar que essa hierarquia
ao ou omisso descritas no tipo penal. O tra-
no um esquema rgido (ver [5], p. 233), po-
balho da percia nesse nvel tangencia o dom-
dendo haver superposio de nveis. Alm dis-
nio que , por excelncia, do julgador. Acima
so, o objetivo final dos autores daquele artigo
do nvel III esto as questes jurdico-penais
possibilitar uma anlise baseada em razes de
propriamente ditas: inteno (dolo e culpa), ex-
verossimilhana (LR, likelihood ratios), que
cludentes de ilicitude etc.
veremos mais frente. Por esse motivo, as hi-
pteses ou proposies, em cada nvel, so No sistema processual brasileiro, e na pr-
sempre analisadas em pares antagnicos, sendo pria cultura da sua percia criminal oficial, o
tambm importante distinguir entre proposi- perito no incentivado a incluir na sua anlise
es e explicaes (ver [7]). elementos que vo alm dos vestgios propria-
mente ditos, e, principalmente, informao
Seja, como exemplo, um caso de furto quali-
contextual, e portanto extracientfica, que, ape-
ficado, em que so encontradas marcas de cal-
sar de no necessariamente incorreta, depende
ado no local de crime. A concluso de um
de outros tipos de prova (por exemplo, a teste-
exame de reconhecimento de padro que con-
munhal) ou mesmo da assuno de elementos
trasta essas marcas questionadas com aquelas
circunstanciais.
de um calado do suspeito ser de nvel I.
O fato de [5] incluir a participao da percia
O nvel I o campo por excelncia da per-
em consideraes de nvel II e, principalmente,
cia. No caso da investigao da origem, esse
nvel III que no seriam da alada pericial na
o nvel em que se situa a metodologia geral
tradio brasileira talvez se explique porque,
descrita na Introduo e mesmo qualquer outra
na tradio processual dos autores daquele arti-
metodologia que tenha o mesmo objetivo,
go o Reino Unido os peritos sejam costu-
como as baseadas em razes de verossimilhan-
meiramente chamados para testemunhar em ju-
a.
zo e opinar sobre esse nveis, sendo esse teste-
A rigor, no nvel I, no est em questo a munho parte integrante do trabalho pericial. No
continuidade no tempo. Portanto, no nosso Brasil, a percia se manifesta fundamentalmen-
exemplo, mesmo que houvesse sido estabeleci- te por meio do laudo pericial, podendo ser ou-
do que as marcas encontradas no local de crime vida em audincia apenas para esclarecer sobre
vieram do calado do suspeito (veremos mais a o exame (art. 159, 5o, inciso I e art. 400, ca-
frente qual o grau de certeza possvel de se put e 2o, todos do Cdigo de Processo Penal
ter numa afirmao desse tipo), isso no garan- CPP, [8]).
tiria que foi o suspeito quem adentrou o local
Alm disso, como fica evidenciado em [7],
do furto, pois, por exemplo, outra pessoa pode-
mesmo no nvel III a percia avalia pares de hi-
ria estar usando aquele calado, emprestado
pteses passveis de possibilitar uma anlise
pelo, ou subtrado do, suspeito.
estatstica, sendo isso distinto da mera emisso
Dessa forma, a percia no pode afirmar, de uma opinio.
com base apenas no vestgio em questo e no
Em todo caso, talvez seja prudente conside-
material padro, que efetivamente o suspeito
rar que concluses de nvel II e III, a rigor, s
estava no local, tempo e circunstncia em que
sero da alada pericial quando os elementos
ocorreu o furto. Para isso, seria necessria in-

10
circunstanciais forem colhidos pela prpria pe- TABELA 1
IDENTIFICAO QUALITATIVA VERSUS IDENTIFICAO NUMRICA
rcia, que, munida de sua f pblica, pode agre-
Tipo de identifica- Qualitativa Numrica
g-los nas consideraes a serem feitas no lau- o
do pericial.
Resultado O resultado uma clas- O resultado uma
sificao (a fonte do individualizao.
No exemplo da marca de calado, a existn- vestgio ou no da
cia de prova testemunhal que relacione o sus- mesma classe da fonte
do padro).
peito ao local e ao horrio provvel de ocorrn-
cia do furto um elemento circunstancial rela- Nmero de seres Varivel conforme o 1 (um).
discriminados caso, podendo ser qual-
cionado ao nvel II, porm no de natureza as- quer inteiro maior ou
similvel a prova pericial. igual a 1.
Dependncia em Dependente intrinseca- No utiliza parme-
Nada impede, entretanto, que essa informa- relao escolha mente. tros de classifica-
de parmetros de o.
o seja indiretamente includa na anlise peri- classificao/com-
cial por meio, por exemplo, de um quesito que parao
pede um estudo de plausibilidade de uma de- Relao com a No pressupes meca- A continuidade no
terminada dinmica de eventos que inclui o continuidade no nismo de garantia de tempo pressuposto
tempo continuidade. O resulta- essencial.
suspeito como o agente delituoso. do pode variar se a fonte
do material questionado
Em contraste, um exemplo de proposio se alterar.
efetivamente pericial de nvel II seria a que Correlao com a Relacionada a proposi- Relacionada a pro-
conclusse, num exame de local em suspeita de hierarquia de pro- es de nvel I (fonte). posies de nvel II
posies (atividade) e III (de-
crime de telecomunicao, por meio de consta- lito).
tao in loco realizada pela equipe de peritos,
que uma estao clandestina operada por um Deve ficar claro que as questes de persis-
determinado indivduo transmitia informao tncia e, em particular, transferncia podem
por processo eletromagntico. ser, e normalmente so de fato, pericialmente
importantes na aceitao, como vestgio, do u-
2.5. RESUMO DAS CARACTERSTICAS DOS DOIS TIPOS DE dio questionado. Porm, isso no parte do
IDENTIFICAO exame de comparao forense de locutor, mas
A Tabela 1 contrape a identificao qualita- do exame de verificao de edio (ver [9], p.
tiva e a identificao numrica tendo em vista 299; [3], p. 284-285).
o que foi apresentado at aqui.
3. O DOGMA DA UNICIDADE
Os exames periciais de determinao da fon-
A diferena entre identificao qualitativa e
te se baseiam, como regra geral, em anlise de
identificao numrica teria pouca relevncia
material questionado e padro, circunscreven-
prtica na percia se fosse possvel demonstrar
do-se ao nvel I (nvel da fonte) da hierarquia
para os exames de determinao da fonte cir-
de proposies e constituindo uma atividade de
cunscritos ao nvel I da hierarquia de proposi-
identificao qualitativa.
es que a metologia de anlise, ainda que
Esse o caso de todos os exemplos dados na em condies especficas, seria capaz de deter-
Introduo quando a anlise se basear em me- minar classes que contivessem um nico ele-
todologias de comparao entre vestgio e ma- mento.
terial padro, sem preocupao direta com
Ou, equivalentemente, se fosse possvel de-
questes de persistncia e transferncia de mar-
monstrar o que chamaremos aqui de unicidade:
cas e traos.
apenas um nico ente (pessoa ou objeto) pode-
Em particular, o caso da comparao fo- ria produzir o vestgio com as caractersticas
rense de locutor (ltimo exemplo dado na In- levantadas pela anlise pericial.
troduo).
Juntando-se unicidade o requisito da con-
temporaneidade do material padro, que garan-

11
tiria a continuidade no tempo, chegar-se-ia sistemas, evidentemente ela tambm varia ao infini-
concluso de que o exame de investigao da to.
Se assim no fosse, a percia grafotcnica, que acei-
fonte realizado conforme a metodologia de ta universalmente, no teria o menor valor.
comparao delineada na Introduo, que ([1], p. 29; grifos em negrito meus).
uma identificao qualitativa, faria as vezes,
para os fins prticos, de uma individualizao. De modo semelhante, mas em relao aos
exames comparativos na balstica, outro texto
3.1. A FALCIA DA INDIVIDUALIZAO afirma:
No se analisaro aqui as questes relativas (...) assim como pacfico que duas impresses digi-
tais cujos desenhos coincidam exatamente s podem
ao requisito da contemporaneidade, que depen-
corresponder a um mesmo dedo, assim tambm pode-
dem de consideraes particulares para cada se ter como indiscutvel que a presena de deforma-
tipo de vestgio. es normais convergentes, em dois ou mais projetis,
significa que foram todos expelidos por um s e mes-
No que se refere ao pressuposto da unicida- mo cano raiado.
de, verifica-se que, em geral, na Criminalstica ([2], p. 316; grifos meus).
ele no somente assumido como hiptese de
trabalho provisria, a ser colocado sob teste Para exemplos semelhantes na literatura em
empiricamente, mas como verdade bvia e evi- ingls, ver [11], p. 203-206.
dente (ver [10] e [11]). 3.2. PREMISSAS DA FALCIA DA INDIVIDUALIZAO
O que se observa em muitos textos devota- Como discutido em [10] e [11], h diversas
dos ao tema da Criminalstica - e no somente razes, inclusive de cunho sociolgico, que po-
no Brasil - bem como na prtica diria de vri- dem explicar a presena razoavelmente disse-
as reas da percia, a assuno da unicidade minada da falcia da individualizao, ou
como um verdadeiro dogma. seja, da afirmao categrica da capacidade in-
Sua base consiste de um raciocnio indutivo dividualizadora dos exames baseados em com-
que iguala infrequncia a unicidade, fundamen- parao de caractersticas, na Criminalstica.
tado no acmulo de experincia pessoal no Destacam-se a seguir duas das justificativas
sistematizada, reforado pelas afirmaes de levantadas em [11] e que podem ser observadas
estudiosos vistos como baluartes nas suas res- nas duas citaes diretas feitas acima.
pectivas reas (argumento de autoridade).
3.2.1. O NMERO DE COMBINAES POSSVEIS
Alm disso, como afirmado em [4], p. 208, a
hiptese da unicidade da fonte no s assumi- A primeira diz respeito ao nmero de combi-
da como verdade mas tambm transferida, naes possveis de determinadas caractersti-
sem questionamento, para o vestgio produzi- cas. Ainda que esse nmero seja grande, indi-
do. cando que a possibilidade de coincidncias
baixa, a matemtica e a estatstica no permi-
Configura-se, assim, o que [11] chama de tem concluir que ela pode ser assumida, mes-
falcia da individualizao. mo para os fins prticos, como sendo nula.
Por exemplo, para justificar a capacidade de O conhecido paradoxo do dia de anivers-
determinao individualizadora da percia gra- rio (ver, por exemplo, [12], p. 64) mostra que
foscpica, um texto da rea afirma: o clculo de probabilidades apresenta muitas
A escrita individual. A escrita resultante de est- vezes resultados que no so intuitivos. Assim
mulos cerebrais que determinam movimentos e estes que, apesar de haver, desconsiderando-se os
criam as formas grficas. bissextos, 365 dias em um ano, basta tomar 23
Muito embora os crebros de todos sejam anatomica- pessoas ao acaso para que a probabilidade de
mente iguais, a sua funo varia de pessoa para pes-
soa. O mesmo ocorre com o sistema somtico. Vale que pelo menos duas delas faam aniversrio
dizer, portanto, que ambos tendem variar (sic) ao in- no mesmo dia seja maior do que 50% (na ver-
finito. Como a escrita resulta do concurso desses dois dade, essa probabilidade ser de aproximada-

12
mente 50,73%). Com 57 pessoas, a probabili- Outros processos como por exemplo, a
dade de ter pelo menos uma coincidncia ultra- aquisio de marcas de uso em solados de cal-
passa 99%. ados e de marcas de disparo em projetis de ar-
mas de fogo de alma raiada muitas vezes ca-
Esses nmeros 23 e 57 so, respectiva-
recem de modelamentos e levantamentos esta-
mente, duas e uma ordem de grandeza menores
tsticos que permitam apresentar concluses
do que o universo de possibilidades, 365.
em exames periciais de modo mais objetivo.
No caso geral, havendo um universo de k
Isso leva a uma consequncia, que parte da
possibilidades equiprovveis de combinaes
boa prtica cientfica, mas, surpreendentemen-
de um conjunto de caractersticas e n seres que
te, tem ainda pouca ressonncia na cultura de
apresentam uma dessas combinaes, a proba-
muitas reas periciais: a necessidade de realizar
bilidade p de que pelo menos dois desses seres
levantamentos empricos e validaes estatsti-
tenham as mesmas caractersticas :
cas, ao invs de se assumir a unicidade como
p = 1 p2 uma premissa inquestionvel.
onde p2 a probabilidade de que no haja ne-
Mesmo quando os fundamentos bsicos do
nhuma coincidncia, ou seja,
mecanismo sob anlise so bem estabelecidos,
k k 1 k ( n1 ) k!
p 2= = como no caso do DNA, a estatstica, vale lem-
k k k (k n)!k n brar, no leva individualizao. Por sua pr-
e, portanto, pria natureza, o que ela permite a quantifica-
k! o objetiva de uma inferncia. O exame peri-
p=1 n (1)
( k n )!k cial de investigao da fonte continua sendo
Pode-se argumentar que, na prtica, dada a uma identificao qualitativa ([13], p. 199; [4],
enorme quantidade de possibilidades de combi- p. 209). A rigor, somente a verificao de todo
naes de um determinado conjunto de caracte- o espao amostral poderia levar individuali-
rsticas por exemplo, os pontos caractersti- zao ([11], p. 7).
cos em um fragmento de impresso digital , o Apesar da simplicidade da considerao em-
clculo de probabilidade de coincidncias ao butida na equao (1), importante refor-la.
acaso utilizando (1) (ou qualquer expresso se- Muitas reas da Criminalstica, ainda hoje, de-
melhante) resultaria em valores nfimos para p, senvolvem raciocnios equivocados que preten-
que permitiriam, mesmo considerando toda a dem embasar concluses individualizadoras
populao de fontes possveis no planeta, fazer para seus respectivos exames a partir da mera
uma identificao individualizadora categrica. determinao do nmero possvel de combina-
Entretanto, muitas caractersticas envolvidas es de um conjunto de caractersticas (para
em problemas de determinao da fonte co- um exemplo desse equvoco, ver [14]).
muns na Criminalstica no tm o seu mecanis- 3.2.2. CONHECIMENTO PACFICO E INDISCUTVEL
mo satisfatoriamente descrito pela cincia. Outra justificativa subjacente defesa aprio-
Clculos de nmero de combinaes poss- rstica da unicidade e da capacidade individua-
veis via de regra fazem suposies como a de lizadora dos exames de investigao da ori-
independncia de variveis e distribuio uni- gem, mesmo no nvel I da hierarquia de propo-
forme de possibilidades. Porm, se o mecanis- sies, a inocorrncia de coincidncias, ou
mo fsico de determinao dessas caractersti- seja, de seres diferentes produzindo vestgios
cas no foi cientificamente levantado de modo indistinguveis, observada pelos peritos ao lon-
satisfatoriamente completo, pode haver, na rea- go de sua experincia profissional.
lidade, variveis ainda no descobertas que fa- Como destacado em [11], p. 212-213 e em
zem determinadas combinaes mais provveis [10], h vrios problemas nesse raciocnio.
do que outras.

13
Um deles lgico: a induo pode e em bases cientificamente mais slidas, do pro-
usada cientificamente na formulao de hipte- blema da determinao da fonte.
ses, porm o acmulo de observaes no pro- Considerando o nvel I da hierarquia de pro-
va a hiptese. Na realidade, basta uma observa- posies, a metodologia tradicional de compa-
o em discordncia com a hiptese para colo- rao de caractersticas entre os materiais ques-
c-la em cheque (conceito da falseabilidade das tionado e padro dever ser complementada
teorias cientficas, proposto por Karl Popper). pela avaliao estatstica da distribuio dessas
Afirmativas sobre a capacidade de individu- mesmas caractersticas no restante da popula-
alizao de exames criminalsticos deveriam, o de entes que, potencialmente, poderiam ter
ao menos, ser mais modestas, sob o risco de produzido ou ter sido utilizados na produo
pretenderem colocar a Criminalstica acima do vestgio.
das prprias Cincias Naturais. O ideal, portanto, para a abordagem do pro-
Outro problema que, no cenrio de diver- blema da determinao da origem, no ape-
sas reas das chamadas cincias forenses, v-se nas estabelecer o grau de compatibilidade entre
poucos estudos dedicados verificao, emba- as marcas ou traos do vestgio e as marcas ou
sada no mtodo cientfico, da hiptese da indi- traos do material padro ou seja, o seu grau
vidualizao. Baixo nvel de pesquisas formais de similaridade , mas tambm avaliar estatis-
e mesmo de esforo concentrado em busca de ticamente se as caractersticas observadas no
falsos positivos, alm da ausncia de levanta- vestgio poderiam ter-se originado de outros
mentos extensos e bancos de dados, parecem seres de uma populao de referncia, ou seja,
ser mais a regra do que a exceo, incluindo na o grau de tipicidade do conjunto de caracters-
rea de comparao forense de locutor. ticas do vestgio.
Epistemologicamente, todas as Cincias Na- Por exemplo, um alto grau de similaridade
turais tm no raciocnio indutivo um dos seus entre vestgio e material padro , em princ-
pilares e, do ponto de vista sociolgico, os ci- pio, favorvel a uma concluso positiva a res-
entistas, na prtica do dia a dia, tambm podem peito da identidade qualitativa entre a fonte do
tender a apropriar como dogma as hipteses e material questionado e do material padro. Po-
teorias de ampla aceitao na comunidade ci- rm, se o conjunto de caractersticas do vest-
entfica em dado momento histrico, at por gio for muito comum, ou seja, seu grau de tipi-
uma questo de eficincia (ver [15] ou [16]). cidade for grande, isso ser desfavorvel
concluso positiva a respeito da identidade
Porm, a cultura cientfica, ao mesmo tem-
qualitativa.
po, tambm destaca a necessidade de testes sis-
tematizados e objetivos no processo de estabe- Considera-se atualmente que a metodologia
lecimento de hipteses. mais adequada para realizar os exames de de-
terminao da fonte segundo esses princpios
Considerando, alm disso, que em muitas
a que utiliza razes de verossimilhana no con-
reas, incluindo a comparao de falantes,
texto da anlise bayesiana de dados.
como veremos mais adiante, ainda no h par-
metros objetivos quantitativos para todos os as- 4.1. ANLISE BAYESIANA DE DADOS
pectos levados em conta na anlise, seria dese-
jvel implantar uma cultura de incentivo a tes- A abordagem, teoria ou interpretao bayesi-
tes cegos de proficincia dos grupos periciais ana da probabilidade, bem como sua faceta
([10]; [11], p. 201-202). operacional, a chamada anlise bayesiana de
dados, uma das teorias matemticas que tra-
4. RAZO DE VEROSSIMILHANA tam do tema da probabilidade. Na realidade,
no totalmente correto falar em uma nica
Abandonado o dogma da unicidade, a lgica interpretao bayesiana da probabilidade,
inferencial de base estatstica se apresenta pois pode haver pequenas diferenas de viso
como a ferramenta preferencial para a soluo,

14
sobre aspectos especficos da probabilidade de Nas dcadas seguintes, entretanto, os princ-
acordo com o autor consultado. pios do trabalho de Laplace foram colocados
em xeque, sob o argumento de que careciam de
Neste tutorial, adota-se em linha geral, cha-
rigor matemtico, por estarem baseados em
mando de abordagem, teoria ou interpretao
uma noo intuitiva e subjetivista da probabili-
bayesiana, a encontrada em [17] e [18].
dade.
A teoria bayesiana pretende ser um sistema
Prevaleceu, a partir da, a chamada teoria
lgico que permite atribuir um peso ou grau
frequentista, onde a probabilidade de um even-
plausibilidade de eventos incertos. A incerteza
to incerto X, aqui indicada por p(X), (por
deriva da ausncia de informao que permita
exemplo, ver [20]):
determinar por deduo e seguramente se o
evento ocorre ou no. A probabilidade, na vi- n( X ) (2)
p ( X )lim
so bayesiana, , portanto, um estado de conhe- n n
cimento, no uma entidade do mundo fsico,
onde:
externa ao observador ([19], p. 10-11).
n o nmero de repeties, reais ou imagina-
Apesar de haver um foco no observador, o das hipoteticamente, da situao ou experimen-
que faz com que em geral se classifique a abor- to em que X pode aparecer;
dagem bayesiana como uma teoria subjetiva da n(X) o nmero de vezes em que se observa X.
probabilidade, ela permite atingir resultados
A teoria frequentista tambm conhecida
objetivos definidos, ou seja, inferncias de ca-
como a teoria tradicional ou ortodoxa da pro-
rter conclusivo obtidas por deduo, a partir
babilidade. Ela fortemente dependente do
de inferncias tomadas como hipteses de tra-
conceito de aleatoriedade (randomness), en-
balho indutivas, as quais so tambm informa-
quanto a teoria bayesiana, por outro lado,
das pelos dados observados. V-se, desde logo,
centrada no conceito de incerteza.
o papel importante que a probabilidade condi-
cional desempenha na anlise bayesiana. Como a noo de inferncia inerente de-
finio bayesiana de probabilidade, essa teoria
Para uma discusso aprofundada da teoria
transita naturalmente para o campo da infern-
bayesiana, ver [18].
cia estatstica, ao passo que, no contexto da
A teoria bayesiana se contrape, tanto do abordagem tradicional da probabilidade, a infe-
ponto de vista filosfico quanto do ponto de rncia estatstica considerada uma disciplina
vista operacional, a muitos dos aspectos da distinta, ainda que correlacionada com a proba-
chamada teoria frequentista da probabilidade, bilidade.
que, historicamente, norteou os estudos da pro-
Outra diferena que a abordagem tradicio-
babilidade na maior parte das geraes de ma-
nal, por sua definio de probabilidade, leva
temticos nos sculos XIX e XX.
diretamente regra da probabilidade conjunta
A abordagem bayesiana centrada no teore- de eventos, podendo-se dizer ento que essa re-
ma de Bayes, que recebe seu nome do matem- gra se sobressai nessa teoria. Na abordagem
tico e reverendo ingls Thomas Bayes, o qual, bayesiana, a regra bsica a da probabilidade
em um artigo publicado postumamente em condicional, que veremos mais adiante. Opera-
1763, apresenta expresses e raciocnios relaci- cionalmente, ela permite obter resultados a par-
onados probabilidade condicional. tir da assuno de um grau de plausibilidade a
Entretanto, na realidade, a formulao defi- priori. Ao mesmo tempo, essa regra seria a ex-
nitiva, e utilizada atualmente, do chamado teo- presso da prpria validade da abordagem ba-
rema de Bayes deve-se a Laplace (1749-1827), yesiana.
que, em 1812, publicou um estudo no qual de- A Tabela 2 mostra, de maneira resumida, as
senvolvia vrios aspectos de uma teoria da pro- principais diferenas entre a interpretao fre-
babilidade propriamente bayesiana. quentista e a bayesiana. Alguns aspectos pre-

15
sentes na tabela sero abordados no prximo Um dos marcos na retomada do interesse
item. pela teoria bayesiana foi a publicao do livro
da referncia [17], cuja primeira edio de
TABELA 2
INTERPRETAO FREQUENTISTA VERSUS INTERPRETAO BAYESIANA DA 1939.
PROBABILIDADE
Entretanto, do ponto de vista dos fundamen-
Interpretao: Frequentista Bayesiana tos da teoria, [23] tem relevncia proeminente
Significado de pro- Frequncia relativa Grau de plausibili- por tentar deduzir matematicamente, a partir de
babilidade dade
princpios elementares, as regras bsicas da in-
Natureza da pro- Propriedade da situao Estado de conheci-
babilidade sob anlise mento sobre a situa- ferncia lgica. Em outras teorias, como a fre-
o sob anlise quentista e a de Kolmogorov, essa dificuldade
Na relao obser- objeto ...observador no existe. Na teoria frequentista, essas regras
vador/objeto fo-
cada no ...
bsicas decorrem facilmente da definio de
Deduo x induo Se pretende uma teoria Pode-se dizer que
probabilidade. Na teoria de Kolmogorov, elas
puramente dedutivo- indutivo-dedutiva, so admitidas como axiomas ou so postas
matemtica se aproximando da como definies (ver [22], p. 20-21 e 27-28).
fsica-matemtica
Regra mais ca- Probabilidade conjunta Probabilidade con- Em [23], as regras deduzidas so:
racterstica dicional
Conceito impor- Aleatoriedade Incerteza probabilidade condicional:
tante
p ( X , Y I )= p ( X Y , I ) p ( Y I ) (3)
Admisso na teoria No admite, mas as tem Admite
matemtica de
probabilidades
de certa forma embuti-
das na escolha do mo-
probabilidade do complementar (ou re-
apriorsticas delo de inferncia esta- gra da soma):
tstica, que disciplina
a parte p ( X I )+ p ( X I )=1 (4)
Inferncia estatsti- uma disciplina parte conceitualmente
ca parte da teoria onde:
Papel do teorema Regra de aplicao no um mtodo geral
- a vrgula indica a operao E lgica;
de Bayes clculo de probabilida- de anlise - a barra vertical | significa dado ou su-
de condicional
pondo, ou seja, p(A|B) deve ser lido como
Dependncia em J era dominante antes Deve parte de sua probabilidade de A dado B, ou, equivalente-
relao dissemi- da disseminao dessas atual popularidade
nao de ferra- ferramentas disseminao do mente, p(A) supondo que p(B)=1;
mentas computaci- microcomputador a - X significa X falso ou X no ocorre;
onais partir da dcada de
1980 - I a informao ou evento de referncia
(background information), que destaca o fato
A teoria bayesiana no a nica abordagem de que toda probabilidade depende de pressu-
alternativa frequentista. O sistema axiomtico postos ([19], p. 5).
de Kolmogorov, por exemplo, utiliza teoria dos
conjuntos para fundamentar o estudo da proba- Nas expresses acima, como I pressuposto
bilidade (muitos manuais de probabilidade, para todos os eventos ou informaes, ele
como [21] e [22], usam essa abordagem). Po- pode, por economia na notao, ser omitido,
rm, o sistema de Kolmogorov mais afim desde que nunca seja esquecido que condio
com a teoria frequentista do que com a teoria prvia para todo o restante.
bayesiana. No caso pericial, podem-se citar como
Para outras teorias da probabilidade, inclusi- exemplos de pressupostos I em um exame de
ve que se afirmam bayesianas mas diferem do determinao da fonte no nvel I (um) da hie-
entendimento desse termo aqui delineado, ver rarquia de proposies: a integridade da cadeia
[18], apndice A. de custdia da prova, de modo que o vestgio
apresentado a exame aquele coletado na cena
4.2. O TEOREMA DE BAYES do crime; a validade da teoria cientfica que

16
subjaz ao exame, por exemplo, os princpios da mas prticos, incluindo no uso forense das ra-
gentica em um exame de DNA. zes de verossimilhana, no relevante.
Dados dois eventos X e Y, a partir da regra da Ao contrrio do que a nomenclatura dos ter-
probabilidade condicional temos que: mos pode talvez sugerir, no apenas a funo
de verossimilhana que pode ser uma
{pp((YX ,,YI )= p ( XY , I )p (YI )
XI )= p(YX , I )p( X I )
funo. Qualquer dos termos do teorema de
Bayes pode ser uma funo densidade de pro-
mas: babilidade discreta ou contnua, ou um valor de
probabilidade de um evento especfico.
p ( X , Y I )= p ( Y , X I )
pois falar no evento X e Y o mesmo que fa- No h em princpio restries para o valor
lar no evento Y e X. Das expresses acima ou funo admitida para a probabilidade a pri-
obtm-se, ento: ori, mas o valor de convergncia da probabili-
dade a posteriori, se houver um, poder ser al-
p ( X Y , I )p ( Y I )= p ( Y X , I )p ( X I )
canado com maior ou menor quantidade de
p ( Y X , I )p ( X I ) dados dependendo da funo a priori utilizada.
p ( XY , I )= (5)
p (YI ) Esse comentrio introduz outra caracterstica
A expresso (5) conhecida como teorema da anlise bayesiana de dados, que o fato de
de Bayes, e pode, como fica evidente acima, demandar mais esforo computacional para de-
ser obtida e utilizada no contexto da teoria fre- terminados problemas do que se utilizada uma
quentista e de outras teorias da probabilidade, abordagem de natureza frequentista. No co-
j que, basicamente, um corolrio de (3) (ver, incidncia, portanto, que a popularizao do
por exemplo, [20], p. 36, e [22], p. 30-31). microcomputador a partir da dcada de 1980
tenha coincidido com o aumento significativo
O que distingue seu papel na probabilidade de interesse pela anlise bayesiana de dados.
bayesiana que, nela, o teorema de Bayes a
ferramenta de anlise principal. Para apreciar 4.3. APLICAO FORENSE DO TEOREMA DE BAYES: LR
sua importncia, consideremos, na expresso
Para equacionar o problema pericial da de-
(5), que X uma hiptese H cuja probabilidade
terminao da fonte, seja Hso a hiptese de que
se deseja calcular e Y a informao ou evi-
vestgio e material padro tenham vindo da
dncia E obtida dos dados empricos. Dessa
mesma fonte (so: same origin), no caso a pes-
forma:
soa ou objeto suspeitos.
p ( E H , I )p ( H I )
p ( HE , I )= (6) De (6), tem-se:
p( EI )
p ( E H so , I )p ( H so I )
A expresso (6) mostra que o teorema de Ba- p ( H soE , I )= (7)
yes uma maneira de calcular a probabilidade p ( EI )
da hiptese luz dos dados empricos a cha- De igual forma, seja Hdo a hiptese de que a
mada probabilidade a posteriori, p(H|E,I) , fonte no seja o suspeito (do: different origin).
partindo de duas informaes: uma estimativa De (6):
inicial do valor dessa probabilidade a proba-
p ( EH do , I ) p ( H doI ) (8)
bilidade a priori, p(H|I) e o clculo da proba- p ( H doE , I )=
bilidade de que os dados empricos seriam real- p ( EI )
mente aqueles observados caso a hiptese fosse Pode-se dizer que (7) uma medida da simi-
verdadeira a chamada funo de verossimi- laridade entre vestgio e material padro, en-
lhana, p(E|H,I). quanto (8) uma medida da tipicidade do ves-
O termo p(E|I) uma espcie de constante tgio, pois quanto maior p(Hdo|E,I), mais tpico
de proporcionalidade que, em muitos proble- o vestgio, pois maior a probabilidade de

17
que tenha se originado de outra fonte que no a de a posteriori o que interessa diretamente ao
suspeita. julgador.
A razo entre as expresses (7) e (8), portan- Para chegar razo de probabilidade a pos-
to, permitir avaliar conjuntamente esses dois teriori, necessrio, como mostra a expresso
aspectos: (9), ter um valor de razo de probabilidade a
p ( H soE , I ) p ( EH so , I ) p ( H so I ) priori, a qual representar o aporte, por parte
= (9) do julgador, de outras consideraes pertinen-
p( H doE , I ) p (EH do , I ) p( H doI ) tes ao caso.
Razo de Razo de Razo de 5. LR NA COMPARAO FORENSE DE LOCUTOR
probabilidade verossimilhana probabilidade
a posteriori a priori A gentica forense foi a primeira rea da Cri-
minalstica a adotar de forma generalizada uma
Como mostrado acima, cada um dos termos metodologia baseada em razes de verossimi-
da expresso (9) possui, a exemplo do que se lhana (ver, por exemplo, [10]). Seu papel pio-
tem no teorema de Bayes, um nome especfico. neiro demonstra que a sistemtica passvel de
A razo esquerda da igualdade chamada implementao.
razo de probabilidade a posteriori. Na fontica forense, os chamados sistemas
direita da igualdade, o primeiro termo a de reconhecimento automtico de locutor
razo de verossimilhana ou LR (Likelihood (RAL) ou sistemas ASR (Automatic Speaker
Ratio). O segundo a razo de probabilidade Recognition) que incorporam a abordagem por
a priori. LR e no meramente apresentam, como o
caso, em geral, das aplicaes de controle de
O termo p(E|I) acaba se cancelando quando
acesso, um resultado do tipo positivo ou ne-
passamos de (7) e (8) para (9).
gativo so uma ferramenta que tambm de-
Tendo em vista que a percia realiza a anlise monstra a aplicabilidade da metodologia na
cientfica do vestgio e no deve, nem preten- comparao forense de locutor.
de, substituir o julgador, a expresso (9) forne-
Entretanto, importante ter em mente que a
ce uma base metodolgica bastante adequada
abordagem por LR no uma panaceia, nem
para os exames de determinao da fonte.
pode ser aplicada sem ter em vista suas princi-
O objetivo dos exames passa a ser o forneci- pais caractersticas.
mento da razo de verossimilhana, LR, obtida
a partir da anlise do vestgio e do material pa- 5.1. CARACTERSTICAS E LIMITES DA ABORDAGEM POR LR
dro, bem como da amostra de uma populao 5.1.1. A EVIDNCIA NO O VESTGIO
de referncia. Dessa forma, a percia se atm
O emprego da anlise por LR no altera a
evidncia material.
natureza do exame de determinao da fonte:
Um LR maior do que um indica que maior ele continua sendo uma identificao qualitati-
a probabilidade da evidncia considerando que va, no uma individualizao.
o suspeito a fonte; um LR menor do que um
Valem, portanto, as observaes feitas no
significa que maior a probabilidade da evi-
item 2.2.: o resultado do exame diretamente
dncia supondo que sua fonte seja diversa do
dependente das caractersticas e da mtrica uti-
suspeito; um valor igual a 1 significa que am-
lizados na comparao.
bas as probabilidade so iguais.
Na expresso da razo de verossimilhana,
muito importante, entretanto, notar que, na
abordagem via LR, o exame pericial no for- p ( EH so , I )
LR= (10)
nece valores ou razes de probabilidade a pos- p( EH do , I )
teriori. Mas em geral a razo de probabilida-

18
a evidncia E no o vestgio, mas o resultado Os sistemas ASR forenses (ou FSAR, Fo-
da anlise comparativa entre o vestgio e o ma- rensic ASR), por exemplo, fazem anlise pre-
terial padro, ou seja, a evidncia construda dominantemente de parmetros acsticos fre-
durante a anlise, estando nela embutida a es- quenciais e, na prtica, costumam usar os coe-
colha de parmetros a serem extrados. ficientes cepstrais, filtrados e transpostos se-
gundo a escala Mel ([26], p. 262-265; [27], p.
No caso do DNA, a tcnica atual obtm um
432-433), recebendo a denominao de coefi-
perfil gentico que distinto do sequenciamen-
cientes mel-cepstrais (MFCC, Mel Frequency
to completo do genoma, baseando-se, na reali-
Cepstral Coeficients).
dade, no tamanho (massa) de segmentos espe-
cficos do DNA (para detalhes, ver [24], p. Outras tecnologias especficas so tambm
249-264). empregadas nesses sistemas, sendo muito co-
mum o modelamento estatstico por mistura de
No caso da fala, por outro lado, a distncia
gaussianas (GMM, Gaussian Mixture Model)
entre vestgio e evidncia ainda maior do que
com modelo de locutor de referncia nico
na gentica forense, onde h um acentuado iso-
(UBM, Universal Background Model).
morfismo entre ambos. Na comparao forense
de locutor, a evidncia no a gravao questi- Obviamente, isso no significa que essas es-
onada, mas o resultado da anlise comparativa colhas de implementao foram arbitrrias.
entre essa gravao e a gravao padro, que Testes objetivos e controlados e, portanto, ci-
depender das metodologias manuais e/ou entificamente consistentes foram realizados
automticas; acsticas e/ou articulatrias em- mostrando, por exemplo, que a abordagem por
pregadas no exame. GMM era mais eficiente do que HMM (Hid-
den Markov Model) para fins forenses (ver, por
Enquanto o vestgio gentico do tipo dis-
exemplo,[28]).
creto, sem intravariabilidade excetuando-se
os casos rarssimos de quimerismo e mosaicis- Porm, tendo em vista a diferena entre ves-
mo , sem possibilidade de ser disfarado e tgio e evidncia, e as condies de contorno
praticamente imutvel no tempo, o vestgio na do vestgio forense de voz, pode-se afirmar
comparao forense de locutor tem caractersti- que, embora os atuais sistemas FASR sejam
cas muito mais variveis (ver [6], p. 7-9; [9], p. uma ferramenta importante de anlise, eles no
303; [25], p. 148-151), pois: so definitivos ([29], seo 3.3.2). Por exem-
plo, ainda h um grande campo de pesquisa
h intravariabilidade intrnseca na fala,
aberto a outras abordagens acsticas, automti-
em todos os seus nveis;
cas ou semiautomticas, como a anlise de rit-
os parmetros (tanto acsticos quanto mo ([29], seo 3.4.3 e p. 59).
articulatrios) so contnuos; A discusso sobre o chamado UK position
pode ocorrer tentativa de disfarce; statement ([30]; [25]; [9], p. 305-306; e [31])
mostra que a rea de comparao forense de lo-
a gravao do udio depende das ca- cutor est distante da fase de sedimentao de
ractersticas do canal e do ambiente, metodologias. Levantamento recente (ver [32])
como rudo de fundo e reverberao. sugere que ainda no h uniformidade, em n-
Pode-se dizer, ento, que os resultados de vel mundial, nos mtodos de execuo desse
uma anlise por LR na comparao forense de exame e na forma de expressar seu resultado.
locutor ser intrinsecamente mais dependente Deve-se ter em mente que a comparao fo-
da sistemtica de obteno da evidncia a par- rense de locutor envolve situaes especficas
tir do vestgio do que no caso do exame de (como a possibilidade de disfarce da voz; am-
DNA. biente com rudos especficos e reverberao),
5.1.2. SISTEMAS DE RECONHECIMENTO AUTOMTICO DE no levadas em conta em outras aplicaes,
LOCUTOR como o controle de acesso, e que tendem a di-

19
minuir drasticamente o ndice de validade e que venham a ser abordados por meio de ra-
confiabilidade dos sistemas ASR. zes de verossimilhana.
De particular relevncia, tanto no alerta que 5.1.4. QUANTITATIVO VERSUS QUALITATIVO
faz, vlido para todas as metodologias de reali- A expresso (9) e mesmo toda a anlise ba-
zao do exame de comparao forense de lo- yesiana no necessariamente dependem de da-
cutor, quanto pela experincia dos seus autores, dos explicitamente colhidos, em base quantita-
alguns deles com contribuio cientfica decisi- tiva, de um levantamento estatstico explcito.
va para o prprio avano dos sistemas ASR, As inferncias podem ter por base estimativas
o artigo da referncia [33]. do observador, no caso o perito.
5.1.3. POPULAO DE REFERNCIA
A referncia [9], por exemplo, admite a pos-
A abordagem por LR, sendo um mtodo es- sibilidade de atribuio de valores para as pro-
tatstico, depende da amostragem de uma po- babilidades envolvidas no clculo da LR na
pulao de referncia. comparao forense de locutor a partir da ex-
Tem-se dois conjuntos de questes envolvi- perincia do perito. Porm, como destaca na p.
dos, os quais, imbricados com a escolha das ca- 306, apenas se essa experincia foi submetida a
ractersticas de comparao (item 5.1.1.), tam- testes cientificamente controlados de confiabi-
bm iro influenciar diretamente no resultado lidade.
da anlise: primeiramente, as questes perti- Esse requisito de estimativa do desempenho
nentes definio da populao de referncia; de peritos ou de grupos de percia, em reas
e, em segundo lugar, as relacionadas defini- onde o mtodo basicamente o convencimento
o da amostra. do examinador ([10], p. 894), entretanto, est
Essas questes so relevantes e ainda no es- longe de ser alcanado na prtica.
to totalmente resolvidas no somente nas re- Como discute [10], e j foi comentado no
as onde a abordagem estatstica relativamente item 3.2.2., programas continuados de aferio
nova, como na fontica forense, mas tambm da proficincia de peritos e grupos de percia
em reas tradicionais como a gentica foren- em condies de teste cego, com dados realsti-
se. cos, so praticamente inexistentes na maioria
As questes passveis de serem levantadas e dos ramos da Criminalstica. A fontica forense
suas solues podem variar de caso a caso e re- brasileira no exceo.
fletir-se no somente no clculo da LR, mas 5.1.5. LR E OS NVEIS DA HIERARQUIA DE PROPOSIES
tambm na informao de referncia I e nas Embora, como ilustram os exemplos dados
probabilidades a priori. Para um panorama na Introduo, quando se fala em exames de
desses problemas, ver [34]. determinao da fonte basicamente se est re-
Do ponto de vista prtico, para o desenvolvi- ferenciando exames no nvel I da hierarquia de
mento da comparao forense de locutor na pe- proposies discutida no item 2.4., o uso de ra-
rcia oficial brasileira, importante que esse zes de verossimilhana no se restringe a esse
tema seja amplamente e continuamente debati- nvel.
do, gerando procedimentos de construo e uti- Pelo contrrio, como j apontado naquele
lizao de bancos de amostras para o portugus item, os proponentes dessa hierarquia a defini-
brasileiro, preferencialmente comuns e com- ram com base na possibilidade de realizar a
partilhados por todos os rgos de percia ofi- anlise pericial em termos de LR em qualquer
cial. importante lembrar que essa discusso nvel.
no se aplica somente aos bancos de amostras
necessrios para os sistemas FASR do tipo As proposies, portanto, no so explica-
MFCC/GMM/UBM, mas para toda a gama de es ou hipteses quaisquer, mas apenas aque-
possveis parmetros, acsticos e articulatrios, las passveis de algum tipo de anlise estatsti-

20
ca por LR, onde o perito possa, com seu conhe- Na anlise forense de udio e vdeo, os exa-
cimento cientfico, auxiliar a Justia. mes de verificao de edio so uma das reas
que podem se beneficiar do aprofundamento
Para ilustrar essa diferena, [7] oferece al-
dos estudos da aplicao de LR em nveis aci-
guns exemplos. Um deles (p. 4) diz respeito a
ma do nvel I da hierarquia de proposies.
uma mancha de sangue, encontrada em local de
crime, cujo perfil gentico concordante com 5.2. A METODOLOGIA E A CONCLUSO DO LAUDO DE
o do suspeito. Um conjunto de hipteses apa- COMPARAO FORENSE DE LOCUTOR
rentemente possvel em nvel I seria:
Embora desejvel do ponto de vista cientfi-
hiptese da acusao (H1): a mancha de co, a introduo da anlise por LR em todos os
sangue do suspeito; aspectos hoje utilizados nos exames de compa-
rao forense de locutor bastante problemti-
hiptese da defesa (H2): a mancha de
ca, como alerta [31].
sangue de outra pessoa que, por aca-
so, tem o mesmo perfil gentico do sus- O cenrio atual, aparentemente (ver [32]),
peito. ainda de predomnio, em nvel mundial, da
anlise do tipo impressionstica baseada na
Apesar de serem explicaes possveis, o par
comparao de caractersticas acsticas e arti-
de proposies H1 e H2 no passvel de anli-
culatrias.
se pericial. Dadas as caractersticas da evidn-
cia gentica j discutidas em 5.1.2., p(E|H1, I) Como discutido nos itens 5.1.2. e 5.1.3., en-
1, como em geral nos exames de DNA, onde tretanto, um cenrio na verdade muito pior, em
o numerador da LR ou 0, ou 1. termos da qualidade dos resultados fornecidos
pela percia de comparao forense de locutor,
Porm, p(E|H2, I), pelo modo como H2 foi
seria aquele em que sistemas FASR do tipo
formulada, tambm 1, o que daria
MFCC/GMM/UBM fossem usados com exclu-
p ( EH 1 , I ) sividade sem a compreenso das suas limita-
LR= =1 .
p ( EH 2 , I ) es e dos cuidados de implementao.
Para esse exemplo, um par de proposies Admitindo, portanto, que a melhor soluo
passvel de anlise pela percia seria, na verda- no momento no seja abandonar as metodolo-
de: gias tradicionais, mas buscar agregar a elas,
paulatinamente, cada vez mais elementos base-
hiptese da acusao (Hso): a mancha ados na abordagem por LR, so apresentadas a
de sangue do suspeito; seguir algumas consideraes sobre as con-
hiptese da defesa (Hdo): a mancha de cluses dos exames.
sangue foi deixada por uma outra pes- 5.2.1. CONCLUSES CATEGRICAS ATRIBUTIVAS DE IDENTIDADE
soa que no o suspeito.
Independente do uso ou no da abordagem
A medida que se avana para os nveis II e bayesiana com razes de verossimilhana, a
III da hierarquia, com o aporte de informao anlise lgica apresentada no item 2. e as con-
contextual, fica mais crtica no somente a ob- siderao feita no item 3. mostram que, mesmo
teno e anlise de dados estatsticos, mas tam- quando peritos emitem um laudo com conclu-
bm a percepo pelo perito dos pares de pro- so categrica atribuindo a identidade entre a
posies adequados para a anlise por LR. fonte do vestgio (material questionado) e a
fonte do material padro, com base exclusiva-
Entretanto, possvel, em teoria, como mos-
mente na anlise desses materiais, essa conclu-
trado em [7], essa anlise, de maneira que a pe-
so deve ser interpretada como uma afirmao
rcia possa trazer informao estatstica de base
do grau (mximo) de convico dos peritos,
cientfica a fim de auxiliar o julgador, seja na
no como uma identificao numrica (indivi-
constituio da autoria, seja na constituio da
dualizao).
materialidade delitiva.

21
O mais adequado, portanto, seria no utilizar Esse limitante so as decises
concluses categricas de atribuio de identi- atributivas/no atributivas de identidade por
dade, a fim de no dar ao exame a aparncia de meio de avaliao localizada, seja de trechos
um peso cientfico que ele no possui. menores ou maiores da gravao, as quais fun-
5.2.2. CONCLUSES CATEGRICAS DE EXCLUSO DE IDENTIDADE damentam a prpria delimitao do que consti-
tui a fala questionada.
Outra questo diz respeito possibilidade ou
no de concluses categricas de excluso (ne- A necessidade dessa seleo fica evidente
gativas de identidade), quando a anlise aponta quando a gravao questionada claramente
flagrantes incompatibilidades entre o vestgio e por uma avaliao lgico-indutiva, no exclusi-
o material padro. vamente lgico-dedutiva contm falas de
mais de um locutor, mas essa atividade de sele-
De acordo com [25], item 3.3.1, que se atm o existe mesmo quando h, claramente,
ao nvel I da hierarquia de proposies, esse apenas falas de um locutor.
tipo de concluso possvel no caso de anlise
de caractersticas discretas, como o caso do Pode-se dizer que a admisso de que essa se-
DNA. leo correta faz parte da hiptese I da ex-
presso (9).
De fato, se admitidos como condio de con-
torno I na expresso (9) os princpios da gen- Esse tema pertinente, tambm, s questes
tica, a no ocorrncia de erros no procedimento da continuidade no tempo e da hierarquia de
de exame (por exemplo, contaminao) e a no proposies, j que o limite entre o que acei-
ocorrncia de quimerismo ou mosaicismo, en- tvel de intravariabilidade de um locutor, bem
to, se no houve correspondncia entre o per- como o limite de distino, via intervariabilida-
fil gentico do vestgio e do suspeito, de, entre locutores distintos, quando se analisa
um determinado conjunto de gravaes questi-
p(E|Hso, I) = 0 e LR = 0. onadas, mesmo que a seleo seja feita por sis-
Independente da razo de probabilidade a temas automticos ou semiautomticas de dia-
priori, a razo de probabilidade a posteriori rizao, calibrados a partir de experimentos
tambm ser nula, e possvel uma afirmao onde a origem das falas garantida por meio
categrica, em nvel I da hierarquia de proposi- da garantia de continuidade no tempo, sempre
es. ser, no final das contas, um limite estatstico.
Entretanto, a natureza distinta da fala huma- Esse limite , sob outro ponto de vista, o li-
na, conforme comentado em 5.1.2., no permi- mite inerente lgica indutiva que fundamenta
tiria esse tipo de raciocnio na comparao de o mtodo cientfico.
locutor, o que impediria o uso de concluses Para [31], o peso lgico-indutivo de uma
categricas de excluso. afirmao que exclui a identidade o mesmo
[31], por outro lado, reafirma a defesa da das avaliaes localizadas que embasam todo o
possibilidade desse tipo de concluso categri- exame de comparao forense de locutor. Por
ca, lembrando, alm de outras consideraes, esse motivo, esse artigo admite concluses ca-
que h um limitante lgico, inescapvel, na tegricas de excluso.
anlise de gravaes de voz no contexto dos Na verdade, essa admisso, implicitamente,
exames de comparao forense de locutor, in- considera suficiente o julgamento impressio-
clusive se todo o exame for realizado por meio nstico do perito.
de razes de verossimilhana, de modo manu-
al, semiautomtico ou automtico (mesmo se A anlise da questo em [25], entretanto, no
empregados sistemas de diarizao; ver, por levantou esse ponto especificamente, embora
exemplo, [35]). seja foroso admitir que, para atingir higidez
lgica na sua defesa do uso incondicional da
abordagem por LR, o referido artigo [25] deve-

22
ria defender tambm que a capacidade de reali- anlise, conforme lista no exaustiva levantada
zao dessas atribuies/no atribuies locali- em [31], nada impediria que esse nmero cons-
zadas se subsumisse sistemtica de testes de titusse, por si s, a concluso do laudo.
calibrao/proficincia segundo o mtodo cien- De fato, essa a sistemtica adotada nos
tfico, preferivelmente sendo realizada por m- exames de DNA.
todos automticos de diarizao.
Porm, na prtica, essa questo no to
De qualquer forma, na prtica, pelo menos simples. A prpria experincia na rea de gen-
no estado atual das metodologias, talvez seja tica forense mostra que a percepo do real sig-
mais prudente seguir, por exemplo, o que apre- nificado de uma LR no contexto da anlise ba-
senta [29], seo 3.8.1, e tambm no utilizar yesiana de dados em si um desafio.
concluses categricas de excluso.
5.2.3. CONCLUSES EM SITUAES DE CONJUNTO FECHADO
Uma das maiores dificuldades separar o
que a razo de probabilidade a posteriori dos
Outra questo que diz respeito ao uso ou no demais termos direita da igualdade na expres-
de concluses categricas refere-se aos casos so (9). Esses conceitos razes de probabili-
em que, ao invs de um conjunto aberto de dade a priori e a posteriori e razo de verossi-
possveis fontes para o vestgio, tem-se um milhana , embora sejam matematicamente
conjunto fechado de suspeitos. simples, no so intuitivos.
[30], item 5, fala, por exemplo, de situaes A situao se complica ainda mais porque h
em que se tem, por gravaes de vdeo, a ima- uma dificuldade em compreender os prprios
gem dos falantes presentes. limites lgico-cientficos da atuao da percia.
Essa questo extrapola o nvel I da hierar- Como se viu na discusso do item 3., essa ob-
quia de proposies, pois inclui questes relati- servao se aplica at mesmo aos prprios pe-
vas continuidade no tempo. ritos.
Pode-se dizer que, se as filmagens incluem o Por esse motivo, a experincia com o DNA
udio ambiente e as imagens mostram clara- mostra que contar com um razovel grau de en-
mente os movimentos de articulao da fala em tendimento dos termos da expresso (9) por
cada locutor mostrado, o exame de comparao parte dos demais atores da cadeia de persecu-
de locutor se torna desnecessrio, podendo o o penal pode levar a profundas frustraes
problema ser abordado do ponto de vista da ve- (ver, por exemplo, [36]).
rificao de edio e do reconhecimento facial. Alm disso, um valor numrico de LR pode
Se, de qualquer modo, nessa ou em outras si- ser de pouco esclarecimento e utilidade para o
tuaes, um exame de comparao de locutor julgador, como apontado por [29], p. 61-62.
em situao de conjunto fechado solicitado, a E, no raro, o valor de LR assumido, para
metodologia bsica a ser seguida no deveria os fins prticos, por alguns ou mesmo todos os
diferir daquela empregada nos exames de con- demais atores da cadeia de persecuo penal,
junto aberto (ver [25], item 3.3.2), talvez ape- como um valor de razo de probabilidade a
nas se considerando um menor nmero de pas- posteriori, absolutizando o resultado do exame
sos de anlise ou espao amostral, para se che- de determinao da fonte, ainda que ele seja,
gar a uma concluso, a qual seria, ainda, no como vimos, uma identificao qualitativa de
categrica. nvel I.
5.2.4. O FORNECIMENTO DE VALORES DE LR NA CONCLUSO DO Quando a LR muito maior do que 1, a acu-
LAUDO E AS ESCALAS DE PROBABILIDADE
sao pode lanar mo do seu valor e, median-
Em princpio, se fosse ou for algum dia te a chamada falcia da acusao, tom-la
possvel, nos exames de comparao forense como razo de probabilidade a posteriori e
de locutor, fornecer um valor de LR engloban- afirmar que a probabilidade do suspeito ser
do todas as caractersticas relevantes para a

23
culpado igualmente enorme (ou seja, para os Dependendo do tipo de vestgio (ver 5.2.1.),
fins prticos, o suspeito culpado). a Criminalstica pode fornecer concluses cate-
gricas de excluso. A questo se complica, en-
Da mesma forma, a defesa, lanando mo de
tretanto, quando no h possibilidade de afir-
um raciocnio conhecido como falcia da de-
mar a excluso ([6], p. 95).
fesa, pode chegar a um valor de razo de pro-
babilidade a posteriori muito baixo admitindo No caso do exame de determinao da fonte,
uma razo de probabilidade a priori no reals- quando h algum grau de convergncia entre o
tica por exemplo, igual ao inverso de toda a vestgio e o material padro, no incomum o
populao de um pas. A partir da razo de pro- emprego da expresso h compatibilidade en-
babilidade a posteriori obtida, a defesa argu- tre (em ingls, comum o uso do termo is
menta que, na verdade, muito maior a proba- consistent with; ver [11], p. 216) para expres-
bilidade do suspeito ser inocente do que culpa- sar essa convergncia.
do, e portanto, havendo dvida de tal monta, Infelizmente, esse termo, por sua amplitude,
ele deve ser absolvido. no fornece nenhuma pista a respeito do grau
Em ambas as falcias, a falha no se levar de compatibilidade ([6], p. 96), nem tampou-
em conta as outras provas e circunstncias per- co fornece subsdios para uma concluso sobre
tinentes ao caso. probabilidades a posteriori, como alerta [25],
seo 3.4.3.
No caso da comparao forense de locutor,
onde no h, no horizonte de mdio prazo e A luz dessas ponderaes, no seria indicado
talvez no de longo prazo , perspectiva de che- o uso de concluses que gravitam em torno do
gar sequer a uma situao de uso integral da termo compatvel e semelhantes, a menos
abordagem por LR, talvez seja mais interessan- que seja dado tambm o grau dessa compatibi-
te, no atual momento, englobar os diversos ti- lidade.
pos de anlises (impressionstica/semiautom- O mesmo tipo de observao feito por [6],
tica/automtica) em um esquema de concluso p. 96, a respeito de expresses como a evidn-
por escalas verbais de probabilidade. cia no exclui determinada hiptese.
A referncia [29], p. 60, traz um exemplo de
escala, a qual, frise-se, no faz, mesmo nos 6. NOMENCLATURA DO EXAME

graus mximo (atribuio) e mnimo (exclu- Neste tutorial, adotamos para o exame foren-
so), concluses categricas. se de determinao da fonte em que a fala o
Deve-se estar ciente que qualquer tentativa vestgio de interesse a denominao compara-
de uso de uma escala qualitativa ainda que a o forense de locutor, ou simplesmente
partir da correspondncia objetiva entre, por comparao de locutor.
exemplo, faixas de valores numricos de LR e Na percia criminal oficial brasileira, a deno-
expresses verbais qualitativas sempre estar minao atualmente mais encontrada para o
sujeita a crticas, como a ocorrncia do efeito exame verificao de locutor. Esse nome
do valor de limiar (cliff-edge effect). Para deta- o utilizado na primeira publicao de flego a
lhes, ver [25], p. 151-155 e [6], p. 133-136. respeito desse exame no Brasil ([37], de 1999;
5.2.5. O EMPREGO DO TERMO COMPATVEL E OUTROS a segunda edio, [38], de 2003, mantm a
SEMELHANTES mesma nomenclatura) e foi adotado, por exem-
Uma questo relacionada ao tema da conclu- plo, no Departamento de Polcia Federal e, por
so do laudo, no somente na comparao fo- meio de programas de capacitao, difundiu-se
rense de locutor, mas em outros tipos de exame para outros rgos de percia criminal oficial.
de determinao da fonte, o uso da palavra Deve-se observar que, apesar da operao
compatvel e semelhantes. lgica de verificao 1-para-1 presente no exa-
me de verificao de locutor encontrado na

24
rea de controle de acesso ser a mesma do exa- caso), um dos exemplos que se relacionam
me forense, como nota [39], p. 9, as nomencla- aos problemas discutidos no item 3..
turas predominantes em ingls, internacional- J para a fala, a prpria referncia [4] enten-
mente, empregaram termos como recogniti- de no haver, atualmente (no caso, o ano de
on e identification, e no verification, por 2006, mas essa afirmao continua vlida), su-
entender que na rea forense havia condies porte cientfico que d a afirmaes de unicida-
de contorno distintas, como falta de controle da de grau de verossimilitude suficiente.
qualidade do material questionado e possibili-
dade de no cooperao por parte dos fornece- Esse fato j era comentado, por exemplo, em
dores das amostras de fala. [39], ao tratar da multidimensionalidade da fala
e dos limites de intravariabilidade e intervaria-
Para detalhes, ver, alm de [39], p. 5-10, a bilidade.
discusso mais aprofundada encontrada em
[26], captulo 5. Em linhas gerais, a mesma Essas ponderaes, em face tambm do que
classificao taxonmica dos exames da rea foi discutido nos itens 3. e 4., tm levado vri-
de processamento da fala, mas com vis acsti- os pesquisadores da rea de fontica forense a
co, focada em ferramentas computacionais au- preferir nomenclaturas que se afastem da ideia
tomatizadas, pode ser encontrada em [40]. de individualizao.
O fato da fala ser efetivamente uma biome- Ao invs de reconhecimento, identifica-
tria ou seja, ela tem valor discriminador o, verificao ou discriminao, o ter-
no necessariamente significa que ela seja indi- mo julgado mais adequado tem sido o de
vidualizadora. Como se afirma na referncia comparao ([9], p. 300-301; [25], item 3.2;
[4], p. 208, apenas a verificao emprica pode [30]; [29]).
dar maior ou menor grau de verossimilitude O presente tutorial emprega, alm do termo
a afirmaes de que determinada biometria comparao, a expresso comparao de lo-
atende o critrio de unidade. cutor, o invs, por exemplo, de comparao
Naquela referncia, por exemplo, se admite de voz (como preferem, por exemplo, [9] e
que a afirmao da unicidade da decadactilar, [25]) ou comparao de fala (como usado
colhida em condies ideais, atinge um grau de em [29]).
verossimilitude suficiente para que seja admiti- Essa escolha foi motivada pela experincia
da na prtica. de trabalho do autor e pelas argumentaes
Outra questo, diferente, a da ocorrncia apresentadas em [29], que distingue voz de
ou no de erros na coleta da decadactilar, o que fala. Essencialmente, o mesmo argumento de
passvel de acontecer, j que estamos falando [29] aparece em [31], p. 146, mas, ao lembrar
de uma atividade humana, ou mesmo do de- que tambm caractersticas extralingusticas
sempenho de determinado algoritmo do tipo so relevantes no exame, o termo locutor pa-
AFIS (Automatic Fingerprint Identification rece mais adequado do que fala.
System) no que concerne ao armazenamento ou Deve-se notar que as denominaes usadas
recuperao das informaes baseadas nas tradicionalmente j esto amplamente difundi-
imagens da decadactilar. das, no sendo possvel afirmar, no atual mo-
Outra questo, ainda, a da transferncia de mento, se, na literatura tcnica da rea, elas
informao de uma digital para um fragmento iro perdurar ou se sero substitudas.
de digital em um local de crime. Um caso fa-
moso de erro cometido pelo FBI, que havia 7. CONCLUSO
afirmado ter uma identificao com 100% de O dogma da unicidade, subjacente s meto-
probabilidade em caso de grande repercusso dologias tradicionalmente empregadas nos exa-
(ver [41] para uma anlise oficial sobre o mes de diversas reas da Criminalstica dedica-
das ao problema da determinao da fonte, foi

25
alvo de crticas contundentes principalmente a DEUS, Jorge Dias de (Org.). A crtica da cincia. Rio de
Janeiro, RJ: Zahar, 1979, p. 53-80.
partir do final da ltima dcada do sculo pas- [17] JEFFREYS, Harold. Theory of probability. 3. ed. Oxford, UK:
sado. Oxford University Press, 1998. ISBN: 978-0198503682.
[18] JAYNES, Edwin Thompson. Probability theory: the logic of
science. 1. ed. Cambridge, UK: Cambridge University Press,
Essas crticas motivaram uma mudana de 2003. ISBN: 978-0521592710.
entendimento sobre o papel e o alcance das pe- [19] SIVIA, D. S.; SKILLING, J.. Data analysis: a bayesian tutorial.
2. ed. Oxford, UK: Oxford University Press, 2006. ISBN: 978-
rcias que envolvem a identificao de uma 0198568322.
pessoa ou objeto. [20] ROZANOV, Y. A.. Probability theory: a concise course. New
York, USA: Dover Publications, Inc., 1977. ISBN: 978-
Neste tutorial foi feito um apanhado dos 0486635446.
[21] FELLER, William. An introduction to probability theory and its
principais conceitos envolvidos nessa mudan- applications. 3. ed. USA: Wiley & Sons, Inc., 1968. ISBN: 978-
a, com foco nos impactos sobre a rea de 0471257080.
[22] PAPOULIS, Athanasios. Probability, random variables, and
comparao forense de locutor, mostrando stochastic processes. 3. ed. New York, USA: McGraw-Hill,
tambm as dificuldades para que se tenha a im- 1991. ISBN: 0-07-048477-5.
[23] COX, Richard T.. Probability, frequency and reasonable
plementao integral de uma abordagem basea- expectation. American Journal of Physics, v. 14, n. 1, 1946, p. 1-
da em razes de verossimilhana nessa rea. 13.
[24] FIGINI, Adriano R. L. et al.. Identificao humana. 2. ed.
Campinas, SP: Millennium, 2003. ISBN: 978-85-7625-002-9.
REFERNCIAS [25] ROSE, Philip; MORRISON, Geoffrey S.. A response to the UK
Position Statement on forensic speaker comparison. The
[1] MENDES, Lamartine Bizarro. Documentoscopia. 2. ed. International Journal of Speech, Language and the Law, v. 16,
Campinas, SP: Millennium, 2003. ISBN 85-86833-93-2. n. 1, 2009, p. 139-163.
[2] TOCCHETTO, Domingos. Balstica forense: aspectos tcnicos [26] ROSE, Philip. Forensic speaker identification. 1. ed. London,
e jurdicos. 4. ed. Campinas, SP: Millennium, 2005. ISBN 85- UK: Taylor & Francis, 2002. ISBN: 0-415-27182-7.
7625-065-9. [27] BIMBOT, Frdric et al.. A tutorial on text-independent speaker
[3] TOCCHETTO, Domingos; ESPINDULA, Alberi (Coord.). verification. EURASIP Journal fon Applied Signal Processing,
Criminalstica: procedimentos e metodologias. 2. ed. Porto n. 4, 2004, p. 430-451.
Alegre, RS: [s.n.], 2009. ISBN 978-85-99541-01-2. [28] REYNOLDS, D. A.; QUATIERI, T. F.; DUNN, R. B.. Speaker
[4] MEUWLY, Didier. Forensic individualization from biometric verification using adapted Gaussian Mixture Models. Digital
data. Science & Justice, v. 46, n. 4, 2006, p. 205-213. Signal Processing, v. 10, 2000, p. 19-41.
[5] COOK, R.; EVETT, I. W.; JACKSON, G.; JONES, P. J.; [29] ERIKSSON, Anders. Aural/acoustic vs. automatic methods in
LAMBERT, J. A.. A hierarchy of propositions: deciding which forensic phonetic case work. In: NEUSTEIN, A.; PATIL, H. A.
level to address in casework. Science & Justice, v. 34, n. 4, (Org.). Forensic speaker recognition: a law enforcement and
1998, p. 231-239. counter-terrorism. New York, USA: Springer-Verlag, 2011, p.
[6] LUCY, David. Introductions to statistics for forensic scientists. 41-69. ISBN: 978-1-4614-0262-6
West Sussex, Inglaterra: John Wiley & Sons, Ltd, 2005. ISBN [30] FRENCH, J. Peter; HARRISON, Philip. Position statement
978-0470022016. concerning use of impressionistic likelihood terms in forensic
[7] EVETT, I. W.; JACKSON, G.; LAMBERT, J. A.. More on the speaker comparison cases. The International Journal of Speech,
hierarchy of propositions: exploring the distinction between Language and the Law, v. 14, n. 1, 2007, p. 137-144.
explanations and propositions. Science & Justice, v. 40, n. 1, [31] FRENCH, J. Peter et al.. The UK position statement on forensic
2000, p. 3-10. speaker comparison: a rejoinder to Rose and Morrison. The
[8] BRASIL. Cdigo de Processo Penal, decreto-lei n 3.689 de 3 International Journal of Speech, Language and the Law, v. 17,
de outubro de 1941. Disponvel em: n. 1, 2010, p. 143-152.
<http://www.planalto.gov.br/ccivil_03/decreto- [32] GOLD, Erica; FRENCH, Peter. International practices in
lei/del3689.htm>. Acesso em: 01.ago.2012. forensic speaker comparison. The International Journal of
[9] MORRISON, Geoffrey Stewart. Forensic voice comparison and Speech, Language and the Law, v. 18, n. 2, 2011, p. 293-307.
the paradigm shift. , v. 49, 2009, p. 298-308. [33] BONASTRE, Jean-Franois et al.. Person authentication by
[10] SAKS, Michael J., KOEHLER, Jonathan J.. The coming voice: a need for caution. Proceedings of Eurospeech 2003,
paradigm shift in forensic science. Science, v. 309, 2005, p. 892- Genebra, Sua, , 2003, p. 33-36.
895. [34] AITKEN, Colin G. G.. Populations and samples. In: AITKEN,
[11] SAKS, Michael J., KOEHLER, Jonathan J.. The C. G. G.; STONEY, D. A.. The use of statistics in forensic
individualization fallacy in forensic science evidence. science. : Taylor & Francis e-Library, 2002, 1991, p. 51-82.
Vanderbilt Law Review, v. 61, n. 1, 2008, p. 199-219. ISBN: 0-13-933748-2 (Print Edition)
[12] MLODINOW, Leonard. The drunkard's walk: how randomness [35] BONASTRE, Jean-Franois et al.. ALIZE/SpkDet: a state-of-
rules our lives. 1. ed. USA: Vintage, 2009. ISBN 978- the-art open source software for speaker recognition. Odyssey
0307275172. 2008: The Speaker and Language Recognition Workshop,
[13] STONEY, David A.. What made us ever think we could Stellenbosch, frica do Sul, , jan.2008, p. .
individualize using statistics?. Journal of the Forensic Science [36] DONNELLY, Peter. Appealing statistics. Significance, v. 2, n. 1,
Society, v. 31, n. 2, 1991, p. 197-199. 2005, p. 46-48.
[14] MALLMITH, Dcio de Moura. A respeito do nmero de pontos [37] BRAID, Antonio Csar Morant. Fontica forense. 1. ed. Porto
caractersticos necessrios afirmativa de identidade. Revista Alegre, RS: Sagra Luzzatto, 1999. ISBN 85-241-0606-9.
do IGP/RS, n. 4, jan.2011, p. 27-29.Disponvel em: [38] BRAID, Antonio Csar Morant. Fontica forense. 2. ed.
<http://www.igp.rs.gov.br/revistas/revista4.pdf>. Acesso em: Campinas, SP: Millennium, 2003. ISBN 85-86833-91-6.
01.ago.2012 [39] FRANCIS, Nolan. The phonetic bases of speaker recognition. 1.
[15] KUHN, Thomas S.. The function of dogma in scientific ed. : Cambridge University Press, 1983. ISBN: 978-
research. In: CROMBIE, A. C. (Ed.). Scientific change:. New 0521108270.
York, USA: Basic Books, 1963, p. 347-369. [40] CAMPBELL, Jr., Joseph P.. Speaker recognition: a tutorial.
[16] KUHN, T. S.. A funo do dogma na investigao cientfica. In: Proceedings of the IEEE, v. 85, n. 9, 1997, p. 1437-1462.

26
[41] USA Department of Justice. A review of the FBI's handling of
the Brandon Mayfield case. Disponvel em:
<http://www.justice.gov/oig/special/s0601/PDF_list.htm>.
Acesso em: 01.ago.2012.

27
Ar
tigos
Aplicao de Engenharia Reversa em Exames de
Verificao de Edies de Vdeos Digitais
Bruno Gomes de Andrade
Instituto Nacional de Criminalstica, Polcia Federal, Brasil
SPO Lote 7 Setores Complementares 70.610-902, Braslia/DF - Brasil
andrade.bga@dpf.gov.br

RESUMO Nos exames de verificao de edies, um dos dos arquivos de vdeo digitais questionados
grandes desafios encarados pelos Peritos Criminais a bus-
ca por elementos materiais que garantam, de forma objeti- que se tornaram importantes indcios de ausn-
va, a continuidade do registro sob anlise. Em se tratando cia de edio do material questionado.
de vdeo digital, os dispositivos modernos que efetuam a
captura do registro original geralmente adicionam nos ca- 2. MATERIAL QUESTIONADO
bealhos dos arquivos dados de controle como abertura do
diafragma, distncia focal, data/hora etc., que geralmente
no so disponibilizados de forma direta ao usurio. Neste Os arquivos objeto da anlise continham re-
artigo ser discutido estudo de caso em que foi possvel, gistros de udio e vdeo com extenso mpg. To-
atravs de engenharia reversa, a exposio de parte da for-
matao do cabealho do arquivo digital e a consequente dos esses vdeos estavam codificados com co-
extrao de elementos de data/hora codificados que se mos- dec MPEG-2 (MPEG2) e possuam imagens
traram relevantes indcios de ausncia de edio no vdeo. com resoluo de 720 pixels de largura por 480
pixels de altura, entrelaada, em cores, padro
1. INTRODUO
NTSC, com sistema 4:2:0 de sub-amostragem
O exame de verificao de edies visa a de cor. A taxa de quadros por segundo era, em
procurar elementos materiais indicativos de todos os vdeos, de 29,970 quadros por segun-
edio ou montagem que alterem o contedo do. O udio utilizava codec Audio Coding 3
original da gravao de modo a apresentar, de (AC-3), com taxa de amostragem de 48kHz,
forma propositadamente de difcil ou imposs- resoluo de 16 bits por amostra, estreo e taxa
vel percepo ao observador comum, fatos ou de bits total constante de 256Kbps.
eventos de modo distinto daquele em que ocor-
reram na realidade. As edies podem consistir 3. EXAMES
em insero, supresso, superposio ou subs-
tituio de registros de udio/vdeo. 3.1. ANLISE DO FLUXO DE DADOS

As tcnicas empregadas no exame variam A anlise com editor hexadecimal e analisa-


conforme a natureza do material questionado. dor de streams (fluxo de dados) MPEG dos ar-
Via de regra, sempre so realizadas anlises quivos questionados mostrou que eles obede-
perceptivas e de coerncia contextual sobre o cem estrutura de dados do padro MPEG-2
contedo da gravao. Alm disso, vrios tipos [1].
de verificaes podem ser realizadas enfocan- O GOP (Group of Pictures, Grupo de Ima-
do aspectos como: o suporte fsico da grava- gens), que se repete sucessivamente no stream
o; os sinais de udio e vdeo nela presentes; a de vdeo, corresponde ao intervalo de tempo de
coerncia entre a gravao questionada e o su- aproximadamente 0,5 s, e constitudo de 15
posto equipamento utilizado para sua obteno; quadros ou imagens, com a estrutura
e tambm a estrutura dos arquivos no caso de IBBPBBPBBPBBPBB, sendo que I repre-
gravaes digitais. senta os I-frame ou key frame (Intra-coded
Neste artigo ser discutido estudo de caso picture), P os P-frame (Predicted picture) e
em que a anlise detalhada da estrutura de ar- B os B-frame (Bi-predictive picture).
quivos revelou dados codificados no cabealho

29
3.2. PRIVATE STREAMS
Em todos os vdeos examinados verificou-se
a presena, em vrios trechos dos arquivos, de
streams MPEG (PES, Packetized Elementary
Stream) do tipo private (privado), com cabea-
lho trazendo o identificador (stream ID) 0xBD
(o prefixo 0x indica que o valor que o sucede
est representado em formato hexadecimal).
Streams do tipo private so uma maneira de
introduzir nas transmisses e arquivos MPEG- Figura 2: Cmera de teste Sony DCR-SR68
2 metadados e mesmo informaes de udio e
vdeo no especificados no padro MPEG-2.
exatamente nesses streams em que os fabrican-
tes de equipamentos audiovisual podem intro-
duzir todo tipo de informao adicional que de-
sejarem, como marca e modelo do equipamen-
to gravador, data/hora do registro de vdeo, in-
formaes tcnicas como abertura do diafrag-
ma e distncia focal, dentre outras.

3.3. EQUIPAMENTO DE GRAVAO


Em cada arquivo questionado, alguns dos
private streams traziam sequncias de bytes
Figura 3: Detalhe da Cmera Sony DCR-SR68
com, dentre outros, os caracteres em ASCII
SONY e DCR-SR68, sugerindo que essas ment), tambm em hexadecimal; e a parte da
eram, respectivamente, a marca e modelo da direita mostra caracteres ASCII corresponden-
filmadora utilizada. A figura 1 traz, a ttulo de tes a cada byte (quando houver um caractere
exemplo, o trecho inicial de um dos arquivos correspondente).
questionados, analisado em editor de arquivos
hexadecimal, destacando essa sequncia Conforme manual do fabricante [3], a filma-
ASCII. dora DCR-SR68 utiliza o sistema de gravao
NTSC (colorido), formato de vdeo MPEG-PS
Na figura 1, a parte central mostra os bytes e udio DOLBY DIGITAL (outro nome para o
do arquivo em hexadecimal (20 bytes por linha, formato AC3). Essas caractersticas se mostra-
agrupados de 4 em 4 bytes); a parte da esquer- ram compatveis com as presentes nos arquivos
da mostra o endereo do byte inicial da linha analisados.
em relao ao incio do arquivo (displace-

Figura 1: Sequncia ASCII no incio do arquivo questionado sugestiva da marca e modelo da filmadora utilizada (destacada em vermelho).
Em verde, encontra-se destacada a sequncia de trs bytes que indica incio de PES, 0x000001, seguida do stream ID 0xBD (private stream).

30
Para fins de comparao, foram realizadas, lizao do programa sem a devida comprova-
durante os exames, gravaes de teste utilizan- o dos processos envolvidos na extrao dos
do uma cmera dessa marca e modelo. Essa c- dados se mostrou temerria.
mera de teste mostrada nas figuras 2 e 3.
Dessa forma, com a finalidade de comprovar
Nas gravaes de teste, verificou-se que a fil- a idoneidade dos dados fornecida pelo progra-
madora Sony DCR-SR68 registra continua- ma e tambm de adquirir a informao sobre a
mente no arquivo da filmagem a data e hora formatao e codificao dos dados nos
em que ela se realiza, tendo como referncia a private streams dos arquivos sob anlise proce-
data/hora inicialmente ajustada na cmera. deu-se a anlise do cdigo do programa in-
Essa informao podia ser exibida no dis- fompg.exe. A figura 4, mostra a tela do mencio-
play da filmadora, na forma de caracteres so- nado programa.
brepostos em uma lateral das imagens, quando A anlise do cdigo binrio do programa foi
o arquivo era nela reproduzido. Porm, essa in- realizada atravs de tcnicas de engenharia re-
formao no era visvel quando o mesmo ar- versa utilizando-se o programa OllyDbg [2]
quivo era reproduzido em programas do tipo que um analisador de linguagem assembler
media player convencionais. (debugger) para famlia de processadores x86.
A anlise das gravaes de teste mostrou que 3.4.2. DETALHES DA CODIFICAO DOS PRIVATE STREAMS
essa informao de data/hora somente poderia O estudo dos cabealhos dos arquivos ques-
estar registrada em posio e formato especfi- tionados mostrou que eles tambm embutiam,
cos, dentro de um pacote PES de stream do na mesma posio e formato, dados que sugeri-
tipo private, localizado antes de cada I-frame. am, pelos seus valores, consistir em rtulos de
Entretanto esses dados se mostraram codifica- data/hora.
dos de forma que a anlise direta dos streams
em programa editor hexadecimal no foi sufici- A ttulo de exemplo, a figura 5 mostra a po-
ente para revelar a informao de data/hora. sio e os valores referentes ao primeiro rtulo
de data/hora, que traz os dados 12/05/2011
3.4. VERIFICAO E EXTRAO DOS RTULOS DE DATA/HORA (dia/ms/ano) e 06:47:21 (h:min:s), contidos na
DOS ARQUIVOS DE VDEO DIGITAIS sequncia de cinco bytes 0x1F 6D 58 6B D5.
3.4.1. ENGENHARIA REVERSA DO PROGRAMA INFOMPG.EXE
Com a informao de que os dados de
data/hora estariam codificados dentro dos
private streams dos arquivos sob anlise, inici-
ou-se a busca por informaes sobre a formata-
o das informaes tcnicas presentes no ca-
bealho dos arquivos questionados.
A busca por documentao sobre o contedo
dos private streams da cmera em questo se
mostrou infrutfera. Entretanto, um programa
intitulado infompg.exe encontrado na internet
prometia a obteno de diversas informaes
tcnicas de arquivos MPEG-2 registradas pelo
equipamento de gravao. A idoneidade do ar-
quivo no pode ser comprovada, sendo certo
que no se tratava de programa comercial pro-
veniente do fabricante.
Os dados extrados pela utilizao do pro-
Figura 4: Tela do programa INFOMPG.EXE
grama se mostraram coerentes, entretanto a uti-

31
O cabealho do pacote PES destacado em os 4 bits seguintes, o ms;
verde na figura, e contm, como j visto na dis- os 5 bits seguintes, o dia;
cusso da figura 1, o start code (sequncia de os 5 bits seguintes, a hora;
incio) 0x000001 e o stream ID 0xBD. Em se- os 6 bits seguintes, os minutos;
guida, ainda fazendo parte do cabealho, h dois e os 6 bits restantes, os segundos.
bytes que do o tamanho, em bytes, do restante
do pacote PES. No exemplo, o tamanho do res- Para o exemplo mostrado na figura 5, a ob-
tante do pacote PES do tipo private de teno dos valores de data/hora a partir dos
0x07EC, ou seja, 2.028 bytes. cinco bytes destacados em vermelho detalha-
do na tabela 1. A ltima linha da tabela traz, em
A anlise do cdigo revelou que o programa decimal, o correspondente aos valores em bin-
infompg.exe realiza uma busca por todo arqui- rio de cada campo da linha anterior.
vo de vdeo em busca do start code 0x000001
seguido pelo stream ID 0xBD. Ao encontrar o
identificador do private stream, o programa lo-
caliza o byte de nmero 167 do payload do pri-
vate stream.
Os cinco bytes destacados em vermelho tm
incio na 167a posio aps o cabealho do paco-
te PES. Nessa posio, em todos os pacotes PES
private que antecedem imediatamente cada
I-frame de todos os arquivos analisados, tanto os
questionados quanto os de teste, encontravam-se
os respectivos rtulos de data/hora. Figura 6: Exemplo de vdeo com legenda data/hora embutida

Na sequncia de cinco bytes, foi verificado Por fim extraram-se dos arquivos de vdeo
que: questionados esses rtulos de data/hora e a par-
tir dessas informaes geraram-se novos arqui-
os 14 primeiros bits representam o ano; vos em que essa informao aparece explicita-

Figura 5: Primeiro rtulo de data/hora do arquivo questionado M2U00354.MPG, destacado em vermelho.


Em verde encontra-se destacado o cabealho do pacote PES do private stream.

TABELA 1
VALORES DE DATA/HORA PARA O EXEMPLO DA FIGURA 4
Bytes 0x1F 0x6D 0x58 0x6B 0xD5
Bits 0 0 0 1 1 1 1 1 0 1 1 0 1 1 0 1 0 1 0 1 1 0 0 0 0 1 1 0 1 0 1 1 1 1 0 1 0 1 0 1
Campo ano ms dia hora minuto segundo
Valores no 2011 5 12 6 47 21
exemplo

32
mente nas imagens (figura 6), na forma de le-
gendas de contagem de tempo.
No caso em questo constatou-se que as in-
formaes de data/hora extradas dos arquivos
evoluam de forma linear e contnua no apre-
sentando incoerncias como repetio, inter-
rupo ou qualquer outra descontinuidade.
Conforme j explanado, importante ressal-
tar que, na filmadora, a fonte dessa informao
de tempo dependente da data/hora inicial-
mente ajustada no equipamento. Alm do mais,
trata-se de informao que pode ser escrita di-
retamente nos arquivos por quem conhea a es-
trutura de dados exposta.

4. CONCLUSO
A utilizao da tcnica de engenharia reversa
foi demonstrada para a extrao e validao de
dados de data/hora em arquivos digitais de v-
deo para auxiliar nos Exames de Verificao de
Edio.
Apesar de a situao apresentada ser o me-
lhor caso possvel, pois havia disponvel tanto
o equipamento gravador quanto um programa
para a localizao dos dados de data/hora no
cabealho, a ideia principal da metodologia
possibilitar o estudo e catalogao da formata-
o dos cabealhos utilizadas pelos diversos fa-
bricantes para que, em uma situao no ideal,
onde no se tenha acesso ao equipamento gra-
vador, seja possvel acessar os rtulos de
data/hora registrados pelo equipamento grava-
dor.

REFERNCIAS
[1] J. Keith, MPEG 2, in Video demystified: a handbook for the
digital engineer, 3rd ed. 1995.

[2] OllyDbg. (2011) Disponvel em: http://www.ollydbg.de.

[3] Sony Corporation, DCR-SR68 Handycam Handbook, 2010.

33
Identificao de origem e verificao de edies
em filmes fotogrficos: Anlise de um caso real.
Rodrigo Gurgel Fernandes Tvora, Lucas de Melo Jorge Barbosa
Departamento de Polcia Federal, Brasil

tavora.rgft@dpf.gov.br, lucas.lmjb@dpf.gov.br

RESUMO Este trabalho contesta a noo de originalidade converso A/D por sensor CCD (charge-
comumente atribuda a mdias analgicas, na medida em
que apresenta um caso real de disputa de propriedade coupled device) e D/A com raios catdicos. Na
intelectual de imagem comercial, envolvendo filmes converso por exposio, h inclusive
fotogrficos negativos e diapositivos, alm de uma cmera, disponibilidade de filmes especficos para esta
encaminhados pelas partes litigantes. A identificao da
compatibilidade entre a imagem comercial e os filmes, bem
finalidade, com ou sem reverso de cores, para
como a identificao de origem das imagens, foram a gerao de cpias de segurana de negativos.
realizadas com base na anlise de distores e
desenquadramento causados pelo emprego de lentes, alm O presente artigo contesta esta noo de
da anlise de padres fixos nas bordas dos filmes, causados originalidade, na medida em que apresenta um
por imperfeies da moldura de exposio da cmera
empregada no registro.
caso real ocorrido em 2011 de disputa de
propriedade intelectual de imagem usada em
1. INTRODUO um carto postal, onde foram realizados
exames de identificao de origem e de
Apesar dos recentes esforos, ainda sem
verificao de edies em imagens gravadas
sucesso, para desenvolver um sistema de
em filmes fotogrficos e em papel impresso.
verificao de autenticidade e origem de
imagens, por fabricantes como Nikon e 2. MATERIAL E QUESITOS APRESENTADOS
Cannon [1], a incerteza de autenticidade ainda PELAS PARTES
inerente a imagens digitais, o que decorre da
facilidade de edio. Por outro lado, negativos Foram encaminhados pela Parte A, autora da
e slides consistem em um tipo de mdia ao, cinco filmes diapositivos de 35mm, com
analgica tipicamente empregada como mdia indicaes de posies 10, 13, 14, 16 e 17, e
original, no primeiro registro da imagem, pelo pela Parte B um filme negativo de 35mm,
fato de a gravao da imagem depender da como mostra o diagrama na figura 1, que lista
exposio luz. Por esses motivos, apesar da ainda as mquinas fotogrficas e os quesitos
obsolescncia dos filmes fotogrficos, at encaminhados. No primeiro momento no
pouco tempo apenas mdias analgicas eram foram fornecidas pelas partes a cmera
aceitas como provas vlidas em algumas cortes empregada no registro da imagem, que foi
e protocolos de servios de percias, como no ento solicitada para permitir uma anlise
Instituto Nacional de Pesquisa e Polcia conclusiva de identificao de origem das
Cientfica do Japo-NRIPS. Entretanto, este imagens. A Parte B enviou uma cmera
entendimento no correto. O processo de MINOLTA, modelo MAXXUM 300si, e a
duplicao de filmes possvel e pode ser tanto Parte A informou ser impossvel encaminhar a
analgico, por exposio do filme, usando uma cmera, pois esta fora vendida.
montagem com cmera escura ou cmera,
quanto digital, usando um esquema hbrido de

34
Figura 1: Diagrama com descrio das mdias encaminhadas (acima),da cmera (ao centro), e dos quesitos formulados (abaixo) pelas partes.

Os quesitos formulados pela parte A, a presena de medidas ou distncias de


tentavam claramente sugerir uma metodologia referncia, o que no ocorre na imagem. Alm
de anlise, questionando a idade dos filmes e a disso, a anlise de profundidade de campo no
compatibilidade dos elementos da imagem com conclusiva, j que o efeito observado na
os parmetros pticos da cmera da parte B. imagem pode ser obtido de distintas formas e
no especfico de uma configurao especial
3. METODOLOGIA APLICADA de lente.
Preliminarmente descrio das anlises A metodologia aplicada foi dividida em
realizadas, cabe ressaltar que as anlises diversas anlises. Todo o material foi
sugeridas pela Parte A no so conclusivas. digitalizado com resoluo de 4800dpi e
Foram observadas manchas no negativo gravado em formato TIFF sem compresso.
questionado, mas estas no eram caractersticas Primeiramente foi realizada a anlise de
do efeito da Sndrome do Vinagre, podendo compatibilidade de forma e pertinncia das
ser atribudas ao atrito do suporte, ou ao de supostas mdias originais e a imagem
fungos. Mesmo com uma anlise qumica no questionada, onde se observou uma
seria possvel estimar precisamente a idade do incompatibilidade do negativo com o carto
negativo, pois a velocidade do processo de postal, como descrito no subitem 3.1. Em
hidrlise depende das condies de seguida foram analisados vestgios de edio
armazenamento, que no so conhecidas. do negativo, descritos no subitem 3.2, e os
Ademais, a incompatibilidade do emprego de vestgios de edio do carto postal, descritos
uma cmera MINOLTA com a lente 70- no subitem 3.3. Por fim, no subitem 3.4, feita
210mm com a obteno imagem do carto uma anlise de compatibilidade de origem dos
postal no pode ser confirmada, pois para uma slides, com base nas mincias observadas nas
estimativa do ngulo de viso seria necessria bordas da imagem.

35
3.1. COMPATIBILIDADE DE FORMA E A Figura 4 mostra a no pertinncia da
PERTINNCIA DAS IMAGENS imagem do carto postal na imagem do
A imagem do negativo, mostrada na Figura negativo, j que parte das bordas da imagem
2, foi analisada e comparada imagem do esto fora do limites da imagem do negativo.
carto postal. Para permitir a comparao, a Portanto, descarta-se totalmente a hiptese do
imagem do negativo foi sobreposta imagem negativo ser a imagem original usada na
do carto postal, aps a aplicao de deteco elaborao do carto postal.
de bordas, limiarizao e inverso horizontal,
vide Figura 3. A imagem foi escalada e 3.2. VESTGIOS DE EDIO DO NEGATIVO
rotacionada na tentativa de sobrepor os O emprego de algoritmos automticos
elementos convergentes, entretanto no se especficos para imagem digital [2], pela
conseguiu um acoplamento perfeito dos anlise estatstica do padro de rudo, do
elementos das imagens. Com o alinhamento mtodo de interpolao para deteco de
dos elementos esquerda, os elementos reamostragem ou dupla-compresso JPEG, ou
direita e ao centro ficaram desalinhados, vide mesmo de deteco de rplicas parciais dentro
Figura 4. da imagem, no se aplicam para a imagem dos
filmes fotogrficos, por se tratar de registro
analgico. Mesmo que o registro original
corresponda a uma imagem digital, em uma
converso para mdia analgica, a relao entre
os pixels e sua distribuio estatstica
mascarada pelo rudo intrnseco converso.
Dessa forma, na verificao de edies do
negativo empregou-se a anlise perceptiva dos
elementos da imagem, buscando a
Figura 2: Imagem do negativo. identificao de texturas repetidas ou de
elementos incoerentes.
A anlise perceptiva revela que as imagens
do negativo e do carto postal registram uma
mesma cena, desconsiderando-se a insero
das imagens dos livros de cordel. A natureza
efmera dos elementos observados, como
ondas e homens empurrando uma jangada,
descarta a hiptese de as imagens terem sido
Figura 3: Resultado da deteco de bordas, limiarizao e inverso capturadas em momentos distintos, ou seja,
horizontal da imagem da figura anterior. indica que o negativo e o carto postal foram
obtidos a partir de outra imagem original. O
descasamento observado nos contornos dos
elementos das imagens sobrepostas indica
ainda que uma das imagens sofreu distoro de
sua forma. A imagem do negativo apresenta
uma expanso das bordas da imagem, em
relao imagem do carto postal, distoro
semelhante ao efeito gerado em fotografia pelo
emprego de lentes, como ilustrado na Figura 5,
com um reticulado distorcido pela lente.

Figura 4: Tentativa de acoplamento do negativo ao carto postal, com


elementos esquerda alinhados e os demais desalinhados.

36
Figura 5: Distoro radial tipo pincushion (travesseiro).

Esta observao levanta a hiptese de o


negativo ter sido obtido atravs do registro Figura 6: Exame de incoerncias nas bordas da imagem do negativo.
fotogrfico, com emprego de lentes, da
imagem de fundo do carto postal (sem as
inseres das imagens dos livros de cordel).
Pelo exame das bordas do filme negativo, vide
Figura 6, possvel observar, indicadas em
verde e ampliadas, faixas brancas em forma de
cunha no canto inferior esquerdo, na vertical, e
no canto inferior direito, na horizontal,
incompatveis com o cenrio natural da
imagem, ou com efeitos tpicos de fotografia, o
que refora a suspeita quanto autenticidade
da imagem. A presena dessas cunhas com Figura 7: Ilustrao de hiptese de desenquadramento de fotografia da
ngulo no mesmo sentido sugere que o imagem para gerar o negativo como causa das cunhas observadas.

negativo foi gerado fotografando-se uma


3.3. VESTGIOS DE EDIO DO CARTO POSTAL
imagem impressa em papel branco, ou
posicionada sobre fundo branco, com o Pela mesma razo anteriormente exposta,
enquadramento da cmera desalinhado com os algoritmos automticos no so aplicveis na
eixos da imagem, como exemplificado na verificao de edies do carto postal. Assim,
Figura 7. na comparao do carto postal com o slide 13,
A imagem parcial da posio seguinte do que contm imagem semelhante, empregou-se
filme, indicada em vermelho na Figura 6, onde a anlise perceptiva. Para facilitar a
tambm h uma faixa branca, sugere que com comparao, a imagem do carto postal foi
o mesmo filme foi tirada mais de uma realada com deteco de bordas, limiarizao
fotografia da imagem da paisagem do carto e inverso horizontal, vide Figura 8, a qual foi
postal com fundo branco, na tentativa de sobreposta, aps os ajustes de rotao e escala,
converter a imagem para o filme fotogrfico. imagem do slide 13, vide Figura 9. Pode-se
Isto corroborado tambm pela observar a pertinncia de quase toda imagem
compatibilidade das faixas verticais, indicadas do carto postal na imagem do slide 13, com
em amarelo, situadas no canto esquerdo das exceo de uma estreita faixa com tonalidade
duas posies consecutivas do filme, ambas constante na parte superior. Tambm se
apresentando variao da tonalidade na escala observa o acoplamento perfeito dos elementos
de azul. presentes nas duas imagens, com exceo da
presena, na imagem do carto postal, de livros
de cordel, notadamente gerados a partir de uma
editorao de arte grfica, e da ausncia de
alguns elementos originalmente presentes na
imagem do slide 13, destacados em vermelho
na Figura 9.

37
Figura 9: Sobreposio da imagem processada do carto postal
Figura 8: Resultado da deteco de bordas, limiarizao e inverso imagem do slide 13, aps ajustes de escala e rotao
horizontal da imagem do carto postal.

Figura 10: Detalhe da parte inferior da imagem do carto postal, sobreposta de partes da imagem do slide 13 com indicao dos vestgios de edio da
imagem.
.
da paisagem, aparentemente sem fins
A ausncia desses elementos no fraudulentos. A estreita faixa de tonalidade
configura uma divergncia na origem das constante na parte superior do carto postal,
imagens, pois uma anlise minuciosa do carto fora das margens do slide 13, pode ter sido
postal revela vestgios destes elementos ainda gerada pela ampliao da rea da imagem por
remanescentes na imagem do carto postal, colagem de uma faixa de cu, possivelmente
vide Figura 10, como 1) a rplica de textura objetivando o ajuste esttico da imagem para a
indicando cpia e colagem de imagem de uma incluso dos elementos de cordel. Dessa forma,
marola para substituio da imagem removida pode-se concluir que h compatibilidade entre
de um pescador; 2) a imagem remanescente do a imagem do slide 13 e a imagem empregada
reflexo na areia molhada, com cores vermelha na produo do carto postal.
e azul, do calo do pescador, cuja imagem
estava presente na imagem do slide 13; 3) o A natureza efmera dos elementos da
resqucio de parte da imagem do bon do imagem, como ondas e a presena de homens
pescador, cuja imagem estava presente na empurrando uma jangada, e a compatibilidade
imagem do slide 13, mas foi superposta por das imagens descartam a hiptese de as
imagem do mar no carto postal, e 4) a imagem imagens terem sido capturadas em momentos
de banhista, borrada, mas ainda identificvel, distintos, e reforam a hiptese de o carto
que no slide 13 aparecia de forma mais ntida. postal ter sido gerado a partir do slide 13.

O tipo de edio observada no carto


postal denota uma inteno de ajuste esttico

38
3.4. COMPATIBILIDADE DE ORIGEM DOS SLIDES

A identificao da cmera fotogrfica


analgica fonte pela imagem do filme
possvel atravs do mtodo proposto em [3], de
anlise de um padro fixo de mincias
presentes nas bordas da imagem dos filmes
usados na mesma cmera, conseqncia de
imperfeies na moldura plstica da abertura
de exposio nas mquinas fotogrficas. Estas
irregularidades, decorrentes do processo de
fabricao, apresentam aleatoriedade na forma
e na posio, e podem, portanto, ser Figura 12: Detalhe da borda esquerda dos slides, com mincias
equivalentes.
empregadas como uma assinatura para cada
cmera. A verificao de edio nos slides 10, 14, 16
e 17 foi feita atravs da anlise perceptiva,
Como a cmera da Parte A no foi pelos mesmos motivos anteriormente expostos,
encaminhada para anlise, e como constatou-se e nenhuma edio foi observada. Tambm no
que a mquina da Parte B estava inoperante, foram observados elementos sugestivos de
no foi possvel realizar uma identificao de duplicao analgica, como erros de
origem conclusiva. A anlise das enquadramento nas bordas. Alm disso, a
irregularidades das bordas ficou restrita presena de elementos semelhantes, como
verificao de compatibilidade de origem dos pescadores e a mesma jangada, e a numerao
slides encaminhados. seqencial dos slides sugerem que as imagens
foram capturadas em um intervalo curto de
Por esta anlise, observou-se que as bordas
tempo.
inferior, direita, esquerda e superior de todos
os slides apresentavam mincias convergentes 4. CONCLUSO
indicadas por setas vermelhas, decorrentes do
efeito de obstruo e difrao da luz em torno A anlise apresentada permitiu, observando
das irregularidades da moldura, mesmo com os efeitos de distores da imagem do negativo
variao de enquadramento das imagens. A e o desenquadramento das bordas da imagem
Figura 11 e a Figura 12, mostram as bordas sob fundo branco, indicar que o negativo foi
inferior e esquerda dos slides. Dessa forma, forjado como mdia original, possivelmente
pode-se concluir que os slides foram empregando uma montagem de exposio com
registrados com o emprego de uma mesma lentes. Apesar da ausncia da cmera
cmera. fotogrfica, que viabilizaria uma anlise
conclusiva, a posse dos cinco slides registrados
de uma mesma cmera e sem sinais de edio
reforam a hiptese de que o slide 3 da Parte
A, que pelas anlises mostrou-se compatvel
com a imagem do carto postal, corresponda
imagem original usada na confeco desta.

REFERNCIAS
[1] http://www.canon.com.au/Support-Services/Support-
News/OSK-DVK-Phenomenon
[2] P. Popescu, H. Farid. Statistical Tools for Digital Forensics, In
6th International Workshop on Information Hiding, 2004.
[3] Shirase, Yonemura. Identification of camera using film images,
Jasti Abstracts, p.162, 2001

Figura 11: Detalhe da borda inferior dos slides, com mincias


equivalentes.

39
Deteco de Nudez Utilizando
Redes Neurais Articiais
Pedro S. Franco, Daniel A. M. Sandoval, Alexandre Zaghetto, Clia Ghedini Ralha

ResumoO presente artigo prope um mtodo baseado em HashSetAgent, TimeLineAgent, FileSignatureAgent,


redes neurais articiais para deteco de nudez em imagens FilePathAgent e KeywordAgent. Os agentes especialistas
digitais a ser incorporado ao MADIK (Multi-agent Digital interagem durante o processo investigatrio, correlacionando
Investigation ToolKit) em um agente de processamento de
imagens. O objetivo utiliz-lo como ferramenta de auxlio a achados sobre os arquivos em anlise atravs do uso de
peritos em investigaes que envolvem crimes como a pedolia. O um blackboard colaborativo, o qual permite uma avaliao
mtodo proposto pode ser dividido em 5 etapas: (a) segmentao mais detalhada de cada arquivo sob investigao.
por cor de pele; (b) realizao de operaes morfolgicas; (c) Tendo em vista a importncia de vestgios elucitatrios em
rotulao e contagem de elementos conectados; (d) medio da contedos digitais de imagens, este trabalho visa a extenso
rea do maior elemento conectado; (e) classicao por meio
de uma rede neural articial do tipo feedforward, treinada do MADIK com o desenvolvimento do agente especialista
a partir do algoritmo Levenberg-Marquardt. Nosso conjunto em processamento de imagens de alta resoluo, denominado
de testes formado por 1000 imagens, 500 contendo nudez ImageAgent. De forma geral, o ImageAgent deve ser capaz
e 500 no. Em nossos experimentos, foram treinadas 10 vezes de analisar o contedo de arquivos de tipos diversos de
cada uma das redes neurais com 1 a 15 neurnios na camada imagens, para permitir a identicao, extrao e classicao
escondida, totalizando 150 redes. So calculadas as taxas de
verdadeiros e falsos positivos e negativos e a F-measure utilizada de caractersticas de interesse de uma investigao criminal,
como mtrica para seleo da rede que apresenta o melhor sendo que o mtodo proposto est mais especicamente ligado
desempenho. A F-measure observada no melhor caso foi de deteco de imagens de nudez, com a nalidade de auxiliar
0.7967, para uma rede com 5 neurnios na camada escondida. no combate a pedolia.
Index TermsPedolia, Deteco de nudez, Redes Neurais
Articiais, Multi-Agent Digital Investigation ToolKit, Investigao II. M TODO P ROPOSTO
forense.
O mtodo proposto pode ser dividido em cinco etapas: (i)
segmentao por cor de pele; (ii) realizao de operaes
I. I NTRODUO morfolgicas; (iii) rotulao e contagem de elementos
Com o avano tecnolgico e a popularizao de mquinas conectados; (iv) medio da rea do maior elemento
fotogrcas digitais e dispositivos de armazenamento, vastas conectado; e (v) classicao por meio de uma rede neural
bibliotecas digitais de imagens digitais tornaram-se comuns. articial [4] do tipo feedforward, treinada a partir do algoritmo
No combate a crimes como a pedolia, a inspeo humana Levenberg-Marquardt [5]. Cada uma dessas estapas ser
dessas vastas bibliotecas torna-se muito difcil, desgastante e detalha a seguir.
por vezes invivel.
O processo investigativo de sistemas computacionais A. Segmentao por Cor de Pele
resulta em uma tarefa complexa, envolvendo a participao Dentre os espaos de cores com os quais se pode operar,
e cooperao de diversos especialistas forenses. No entanto, o HSV (Hue, Saturation, V alue) indicado pela literatura
a excelncia do processo pode ser limitada devido falta de como um dos mais adequados para efeito de segmentao por
recursos, sejam eles tcnicos, cientcos ou computacionais. cor de pele [6], [7], sendo o plano determinado por H e S
Visando uma maior agilidade e ecincia dos processos utilizado para tal nalidade. Uma vez que a componente V
investigativos foi desenvolvido o MADIK (Multi-Agent no levada em considerao, a interferncia da luminncia
Digital Investigation ToolKit) [1], [2]. Trata-se de uma no processo de identicao das regies de interesse
ferramenta baseada na abordagem de sistema multiagente minimizada [8].
distribudo, o qual se revelou apropriado, principalmente As cores tpicas para pele humana foram primeiro estudadas
devido capacidade de cooperao de agentes autnomos por Felix Ritter Von Luschan [9], que desenvolveu uma
especializados [3]. No MADIK foram implementados escala de classicao denominada Escala de Von Luschan.
diferentes agentes, cada qual baseado em uma rea especca A Figura 1 mostra um instrumento antropomtrico que utiliza
de conhecimento tcnico utilizando uma arquitetura composta a classicao proposta por Von Luschan [10]. Em um
de quatro camadas, tal como uma metfora hierarquia das cenrio mais realista uma imagem composta por segmentos
organizaes: estratgica, ttica e operacional. Na camada de fotograas digitais de pele humana por ser utilizada
operacional foram denidos cinco agentes especialistas: como referncia na avaliao da escala proposta por Von
E-mail: {pedro, daniel}@loopec.com.br, {alexandre, ghedini}@cic.unb.br. Luschan. Um exemplo de imagem, bem como o plano H S
Departamento de Cincia da Computao, Universidade de Braslia correspontente, so mostrados na Figura 2. A partir da anlise
40
Fig. 1. Instrumento antropomtrico construdo a partir da Escala de Von
Luschan1 .

(a)

(a)

(b) (c)

Fig. 3. Binarizao e operaes morfolgicas: exemplo de imagem original


(a), e suas verses binarizadas antes (b) e depois (c) do processamento
sugerido.

ventura tenham sido desconectadas pela binarizao. A


Figura 3 mostra um exemplo de imagem original (a), e suas
verses binarizadas antes (b) e depois (c) do processamento
morfolgico sugerido.

C. Rotulao e Contagem de Elementos Conectados


Considerando que as imagens binrias so representadas
pelos bits 1 (branco) e 0 (preto), a metodologia adotada para se
(b) rotular os elementos de interesse est resumida no algoritmo
ROT U LA, onde M a imagem binria e R a matriz de
Fig. 2. (a) Recortes de fotograas de pele; e (b) localizao das cores no
plano H S.
rtulos.

ROTULA(M )
de grcos dessa natureza, pode-se estabelecer os intervalos de 1 R(i, j) 0
interesse Hi = [0 0.11] e Si = [0.2 0.7] para as componentes 2 for each M (i, j) = 0 do
H e S, respectivamente [11]. Pixels cujos valores de H e 3 if M (i, j 1) = 1 and M (i 1, j) = 1
S etiverem contidos nesses intervalos so marcados em uma 4 then Indice = Indice + 1;
mscara binria com o valor 1. Os demais so marcados com 5 R(i, j) Indice;
0. Trata-se de um mtodo de classicao trivial que pode em 6 elseif M (i, j 1) = 0 and M (i 1, j) = 1
trabalhos futuros ser substitudo por mtodos mais robustos. 7 then R(i, j) R(i, j 1);
Por m, dado que a complexidade computacional um 8 else R(i, j) R(i 1, j);
problema a ser considerado, a mscara binria resultante 9 return R
subamostrada por um fator de 0.5 antes de ser submetida s Em uma seguda passagem, estabelece-se a equivalncia
etapas seguintes de processamento. entre rtulos, quando regies vizinhas possuem rtulos
diferentes. Aps essa etapa, tem-se a informao de quantos
B. Realizao de Operaes Morfolgicas elementos conectados h na imagem. A Figura 4 ilustra o
Aps a binarizao e a subamostragem descritas na etapa resultado do processo de rotulao. Nesse exemplo foram
anterior, a imagem passa pelos processamentos mosfolgicos rotuladas 4 regies: o fundo (preto) mais trs regies de cor
de abertura e fechamento [12]. O objetivo diminuir a de pele (demais tons de cinza).
quantidade de regies que erroneamente foram classicadas
como regies de interesse e conectar outras que por D. Medio da rea do Maior Elemento Conectado
1 Museo di Storia Naturale, Universit degli Studi di Firenze - Nessa etapa, calcula-se a rea em pixels para cada elemento
http://www.msn.uni.it/CMpro-v-p-69.html. conectado identicado na etapa anterior e, em seguida,
41
Fig. 4. Exemplo de rotulao: foram rotuladas 4 regies: o fundo mais trs Fig. 5. Destaque do elemento conectado de maior rea: aproximadamente
regies de cor de pele. 23% da rea total da imagem.

procura-se pelo maior valor observado. importante ressaltar


que so considerados como candidatos nessa etapa apenas
tp tp
os elementos conectados que encontram-se em sua maioria precision = e recall = ,
dentro da rea classicada como cor de pele na etapa de (tp + f p) (tp + f n)
segmentao. Dessa forma, evita-se contar o fundo como e tp, f p e f n so as taxas de verdadeiros positivos (true
um possvel elemento conectado. Por m, calcula-se a razo positive), falsos positivos (false positive) e falsos negativos
entre a rea do maior elemento conectado e a rea total da (false negative), respectivamente. De uma maneira geral, a
imagem. A Figura 5 destaca a regio de maior rea para o medida precision de um sistema de reconhecimento de padres
exemplo em questo. Esse elemento conectado correponde a representa a relao entre a quantidade de classicaes
aproximadamente 23% da rea total da imagem. verdadeiramente positivas (tp) retornadas pelo sistema e a
quantidade total de classicaes retornadas como positivas
E. Classicao Utilizando Redes Neurais Articiais (tp + f p). Em outras palavras, representa a probabilidade
de uma classicao retornada pelo sistema como positiva
O objetivo do classicador proposto identicar imagens
ser uma ocorrncia verdadeiramente positiva. J a medida
cantidatas a conterem nudez. Optou-se por utilizar uma rede
recall representa a relao entre a quantidade de classicaes
neural articial [4] do tipo feedforward, treinada a partir
verdadeiramente positivas retornadas pelo sistema (tp) e a
do algoritmo Levenberg-Marquardt [5]. Foi proposta uma
quantidade de classicaes que deveriam ter sido retornadas
arquitetura de 3 camadas: entrada, sada e oculta. Na camada
como positivas (tp + f n). Ou seja, representa a probabilidade
de entrada os neurnios no realizam qualquer computao.
de uma ocorrncia verdadeiramente positiva ser classicada
J nas camadas de sada e oculta, a funo de ativao
como tal pelo sistema. A F -measure , dessa forma, a mdia
tangente hiperblica empregada. Um nico neurnio compe
harmonica entre precision e recall.
a camada de sada, enquanto o nmero de neurnios na camada
oculta variou de 1 a 15 durante o treinamento.
O vetor de entrada P para o classicador composto III. R ESULTADOS
por dois parmetros: (i) o nmero de elementos conectados Nossa base de testes formada por 1000 imagens baixadas
encontrados na imagem; e (ii) a rea relativa do maior da Internet, 500 contendo nudez e 500 no. A Figura 6
elementado conecatado. Esses dois valores so extrados nas mostra a distribuio dos vetores de entrada P , denididos
etapas descritas nas Subsees II-C e II-D, respectivamente. a partir dessas imagens. O eixo vertical representa o nmero
A rede treinada para responder com o valor T = 1, se de elementos conectado e o eixo horizontal representa a rea
o vetor de entrada P correponde a uma imagem candidata relativa do maior elemento conectado. Para o treinamento
a conter nudez, e com T = 1, caso contrrio. importante da rede, as duas classes de imagens, nudez e no-nudez,
ressaltar que na operao os neurnios de sada no respondem so divididas em trs subconjuntos: treinamento, validao
exatamente com 1s ou ou -1s, mas apenas com valores e teste, cada qual contendo aproximadamente 1/3 das
aproximados. Por isso, necessrio incluir uma etapa de imagens. O conjunto de treinamento utilizado para se
limiarizao. Caso a resposta do neurnio de sada seja maior computar o gradiente e atualizar os pesos e bias da rede.
que 0, a imagem marcada como contendo nudez. Por outro O conjunto de validao utilizado para interromper o
lado, se a resposta for menor ou igual 0, a imagem no tida processo de aprendizando assim que a rede comea a
como suspeita. apresentar super-aprendizado (overtting). O conjunto de teste
A mtrica de desempenho utilizada foi a F -measure [13], utilizando na avaliao do desempenho nal da rede.
denida pela Equ. 1, Durante o treinamento, variou-se a quantidade de neurnios
na camada escondida de 1 a 15 e cada rede foi treinada
precision recall
F -measure = 2 , (1) 10 vezes, com seus pesos iniciados aleatoriamente a cada
precision + recall treinamento. O melhor desempenho obervado (F -measure =
onde precision e recall so denidas por, 0.7967) foi obtido com 5 neurnios da camada escondida. As
42
50 IV. C ONCLUSES
Nudez
Foi apresentado um mtodo baseado em redes neurais
Nmero de Elementos Conectados

Nonudez
40 articias para deteco de nudez em imagens digitais.
Pretende-se, com isso, auxiliar na investigao de crimes de
30
pedola. Os resultados mostraram a viabilidade do mtodo
proposto, no entanto sugerem a necessidade de se incluir
descritores de imagem mais adequados, em substituio ou
20
alm daqueles que foram utilizados no presente trabalho,
que so: o nmero de elementos conectados e a rea do
10
maior elemento conectado. Em trabalhos futuros pretende-se,
ainda, incluir detectores de face, de formas corporais e
0
0 20 40 60 80 100
rgos genitais. A verso nal do mtodo ser incorporada
% do Maior ferramenta de investigao forense MADIK em um agende
de processamento de imagens.
Fig. 6. Distribuio dos vetores de entrada P , denididos a partir das imagens
da base de teste. O eixo vertical representa o nmero de elementos conectados
e o eixo horizontal representa a rea relativa do maior elemento conectado. R EFERNCIAS
[1] Bruno W. P. Hoelz, Clia Ghedini Ralha, Rajiv Geeverghese, and
Hugo C. Junior, A cooperative multi-agent approach to computer
forensics, in Proceedings of the 2008 IEEE/WIC/ACM International
Conference on Intelligent Agent Technology, Sydney, NSW, Australia,
50 December 9-12, 2008. 2008, pp. 477483, IEEE Computer Society.
Verdadeiros positivos: 78.62% [2] Bruno W. P. Hoelz, Clia Ghedini Ralha, Rajiv Geeverghese, and
Nmero de Elementos Conectados

Verdadeiros negativos: 81.6% Hugo C. Junior, Madik: A collaborative multi-agent toolkit to computer
40 forensics, in On the Move to Meaningful Internet Systems: OTM 2008
Workshops, OTM Confederated International Workshops and Posters,
ADI, AWeSoMe, COMBEK, EI2N, IWSSA, MONET, OnToContent + QSI,
30 ORM, PerSys, RDDS, SEMELS, and SWWS 2008, Monterrey, Mexico,
November 9-14, 2008. Proceedings. 2008, vol. 5333 of Lecture Notes
in Computer Science, pp. 2021, Springer-Verlag.
20 [3] Bruno W. P. Hoelz, Clia Ghedini Ralha, and Rajiv Geeverghese,
Articial intelligence applied to computer forensics, in Proceedings
of the 2009 ACM Symposium on Applied Computing (SAC), Honolulu,
10
Hawaii, USA, March 9-12, 2009. 2009, pp. 883888, ACM.
[4] Simon Haykin, Neural Networks: A Comprehensive Foundation (2nd
Edition), Prentice Hall, 2 edition, July 1998.
0
0 20 40 60 80 100 [5] M. T. Hagan and M. Menhaj, Training feedforward networks with the
% do Maior marquardt algorithm, IEEE Transactions on Neural Networks, vol. 5,
pp. 989993, 1994.
(a)
[6] Benjamin D. Zarit, Boaz J. Super, and Francis K. H. Quek, Comparison
of ve color models in skin pixel classication, in In ICCV 99 Int.
50 Workshop on, 1999, pp. 5863.
Falsos negativos: 21.38% [7] Juwei Lu, Qian Gu, K. N. Plataniotis, and Jie Wang, A comparative
Nmero de Elementos Conectados

Falsos positivos: 18.4% study of skin-color models, in Proceedings of the Second international
40 conference on Image Analysis and Recognition, 2005, ICIAR05, pp.
729736.
[8] Vladimir Vezhnevets, Vassili Sazonov, and Alla Andreeva, A survey
30 on pixel-based skin color detection techniques, in IN PROC.
GRAPHICON-2003, 2003, pp. 8592.
[9] F. von Luschan, Vlker, Rassen, Sprachen : Anthropologische
20 Betrachtungen, Deutsche Buchgemeinshaft, Berlin, 1927.
[10] Universit degli Studi di Firenze, Strumenti antropometrici, 2011.
[11] Anjali A. Shejul and Umesh L. Kulkarni, A Secure Skin Tone based
10 Steganography Using Wavelet Transform, International Journal of
Computer Theory and Engineering, vol. 3, no. 1, pp. 1622, February
2011.
0 [12] R. C. Gonzalez and R. E. Woods, Digital Image Processing,
0 20 40 60 80 100
% do Maior Prentice-Hall, EUA, 2nd edition, 2002.
[13] C. J. van Rijsbergen, Information Retrieval), Butterworth-Heinemann,
(b) 2 edition, Mar. 1979.

Fig. 7. (a) Verdadeiros positivos e negativos; e (b) Falsos positivos e


negativos. F -measure = 0.7967.

Figuras 7 (a) e (b) mostram a distribuio de verdadeiros


positivos e negativos; e falsos positivos e negativos,
respectivamente.
43
Metodo para Compatibilidade entre
Impressoes Digitais com e sem Contato
Alexandre Zaghetto1 , Pedro Salum Franco1 e Daniel Assad Maia Sandoval1

ResumoSolucoes em biometria por impressoes digitais sem


contato tem sido propostas com o objetivo de se superar os
problemas intrnsecos relacionados a tecnologias que exigem
o contato. Para desfrutarmos das vantagens operacionais de
dispositivos sem contato, as imagens resultantes desse tipo de
captura precisam ser processadas para que se tornem similares
aquelas obtidas nos digitalizadores convencionais. O presente
artigo propoe uma solucao em duas etapas para esse problema:
a primeira procura reproduzir a textura de impressoes digitais
tradicionais; a segunda procura fazer reetir o processo de
rolagem unha-a-unha. Dois experimentos foram propostos, um
para avaliar a qualidade das imagens processadas, e outro para
estabelecer a EER(equal error rate) para um conjunto de 200
impressoes digitais (100 dedos, 2 imagens por dedo). Observou-
se que 90% das imagens apresentaram ndices bom, muito bom
ou excelente, e a EER cou em 4%, demonstrando a viabilidade
do metodo proposto.
Fig. 1. Ilustracao esquematica de um sistema de biometria por impressao
digital multivista sem contato.
I. I NTRODUC AO
A autenticacao biometrica, ou simplesmente biometria, pode
ser denida como a vericacao ou o reconhecimento au- atuais tecnologias que lidam com impressoes digitais e baseada
tomatico da identidade de um indivdio a partir de carac- em contato, ou seja, requerem que o usuario pressione os dedos
tersticas siologicas ou comportamentais [1]. Impressoes dig- contra uma superfcie de aquisicao. O maior problema advindo
itais, geometria da mao, voz, ris, face, caligraa e dinamica de dessa tecnologia sao as distorcoes e inconsistencias que podem
digitacao sao exemplos dessas caractersticas. Em geral, difer- ser introduzidas devido a elasticidade da pele. A qualidade das
entes sistemas biometricos requerem tecnologia especca, impressoes digitais pode tambem ser seriamente afetada pelo
dependendo da caracterstica siologica/comportamental con- contato nao ideal causado por sujeira, suor, oleosidade, excesso
diderada. No entanto, independentemente das especicidades de secura ou humidade, temperatura e impressoes latentes.
dos diversos sistemas biometricos, ha problemas que precisam Alem disso, partes diferentes do mesmo dedo podem ser
ser tratados pela maioria deles. Como exemplo pode-se citar a capturadas a cada vez que o mesmo e apresentado ao sensor,
interoperabilidade entre os dispositivos que operam a partir resultando em amostras irreprodutveis. Em alguns cenarios,
de uma determinada biometria. O presente artigo trata da tais desvantagens podem impor a necessidade de um operador
interoperabilidade entre dispositivos biometricos baseados em qualicado durante a fase de registro e, em muitos casos,
impressoes digitais adquiridas com e sem contato. multiplas tentativas sao efetuadas por dedo ate que sejam
produzidas amostras com qualidade suciente. Em aplicacoes
A. Impressoes Digitais com Contato governamentais como, por exemplo, o uso de biometria nas
urnas eletronicas empregadas pelo sistema eleitoral brasileiro1 ,
Nao e tarefa facil determinar qual caracterstica biometrica o processo de registro da populacao votante pode revelar-se
e a mais adequada, considerando a diversidade de aplicacoes extremamente lento. Nesse exemplo especco, a expectativa
e condicoes de operacao. No entanto, em aplicacoes foreses, do Tribunal Superior Eleitoral (TSE) e de que ate 2018 todos
civis e comerciais [2], impressoes digitais tem se tornado os eleitores possam votar utilizando-se desse recurso2 . Apesar
largamente utilizadas. A entrada de um sistema de autenticacao de nos ultimos anos alguns algoritmos terem sido propostos
por impressoes digitais e uma imagem digital que representa com o objetivo de se compensar as limitacoes dos dispositivos
a estrutura de vales e franjas de um dedo real. Isso torna o com contato, esse paradigma de captura pode representar
processo de aquisicao uma etapa crtica, que afeta signicati- um gargalo no que tange o apromiramento da qualidade de
vamente o desempenho geral do sistema. A maior parte das imagens de impressoes digitais.
1 Departamento de Ciencia da Computacao, Universidade de Braslia, e-
mail: zaghetto@image.unb.br, pedro@loopec.com.br, daniel@loopec.com.br.
1 http://www.tse.jus.br/eleicoes/biometria-e-urna-eletronica
2 https://www.youtube.com/watch?v=A ITOLoRtL4

44
(a) Vista 0 (b) Vista 1 (c) Vista 2

Fig. 2. Exemples de vistas (1024 1280 pixels, 8 bits/pixels) adquiridas por meio de um dispositivo sem contato multivista.

B. Impressoes Digitais sem Contato


Solucoes em biometria por impressoes digitais sem contato
tem sido propostas [3], [4], [5] com o objetivo de se superar os
problemas intrinsecamente relacionados a tecnologias que ex-
igem o contato. Tais solucoes procuram atacar o problema da
qualidade da impressao digital em seu nvel mais fundamental.
Uma vez que sistemas sem contato nao obrigam o usuario
a pressionar os dedos em uma superfcie, tais sistemas nao
requerem, por exemplo, algoritmos que procuram compensar
os artefatos decorrentes das propriedades elasticas da pele.
Dentre as propostas de solucoes sem contato, os dispos- (a) (b)
itivos desenvolvidos pela empresa Touchless Biometric Sys-
tems (TBS)3 utilizam uma abordagem bastante interessante e Fig. 3. Comparacao entre: (a) imagem adquirida com contato; e (b) imagem
promissora [6]. Esses dispositivos combinam o imageamento adquirida sem contato (vista 0).
baseado em reexao com um sistema multivista construdo a
partir de tres cameras. Uma camera e posicionada de maneira
a capturar a parte do dedo em que normalmente nucleo e
deltas estao localizados e, tomando-se essa camera central
como referencia, as outras duas sao posicionadas a 45 graus,
uma no sentido horario e a outra no sentido antihorario. Se
a sobreposicao dos seus campos de visao e garantida, pode- (a) (b) (c)
se nao apenas registrar fotogracamente uma area ampliada,
como tambem gerar, por meio de algoritmos de costura [7],
Fig. 4. Equalizacao local de histograma e transformacao gama: (a) imagem
uma impressao digital equivalente a uma obtida por processo original, I (712 560 pixels, 256 nveis de cinza); (b) image equalizada, Ih ;
de rolagem (unha-a-unha). As Figuras 1 e 2 mostram uma e (c) resulado da transformacao gama, Ih .
ilustracao esquematica de um dispositivo de captura sem
contato multivista, bem como exemplos de vistas capturadas,
respectivamente. obtidas nos digitalizadores convencionais. O presente artigo
propoe uma solucao para esse problema.
C. Compatibilidade
II. M ETODO P ROPOSTO
As imagens capturadas por meio da tecnologia sem contato
em geral nao sao compatveis com as imagens obtidas em Inicialmente realizamos uma equalizacao local de his-
digitalizadores opticos, principalmente aqueles em que as tograma [8] a partir de blocos de 8 8 pixels. A Figura 4
impressoes digitais, para serem obtidas, requerem a rolagem mostra: (a) uma imagem original I, obtida por meio do
do dedo sobre uma superfcie plana, transparente e retro- dispositivo de captura sem contato aqui estudado4 ; e (b) o
iluminada. A Figura 3 mostra um exemplo. resultado da equalizacao local de histograma, Ih . E importante
Para desfrutarmos das vantagens operacionais dos disposi- ressaltar que a imagem da Figura 4(a) e uma imagem obtida
tivos sem contato, as imagens resultantes desse tipo de captura a partir da costura das tres vistas fornecidas pelo dispositivo,
precisam ser processadas para que se tornem similares aquelas ou seja, representa uma captura unha-a-unha.
3 http://www.tbsinc.com/ 4 TBSGuard 3D.

45
(a) (b) (c) (d)

(e) (f) (g) (h)

Fig. 5. Imagens If i resultantes do processo de ltragem: (a) a (d). Imagens Ibi resultantes do processo binarizacao: (e) a (h). Na ltragem foram utilizados
ltros gaussianos de tamanho hi = [3 5 7 9] e respectivos desvios padroes dados pela Equacao 2. A binarizacao foi realizada utilizando-se o software
mindtct.

O segundo estagio do algoritmo proposto consiste em sub- processamento cujo resultado e o alargamento da parte supe-
meter a imagem Ih a uma transformacao gama [8], denida rior da impressao digital. O algoritmo proposto procura estimar
pela equacao: por meio de uma regressao polinimial qual seria a funcao que
aproxima as bordas direta e esquerda da impressao digital.
Ih = c Ih (1) Estamos assumindo que a distorcao observada e simetrica.
Uma vez encontrado o polinomio p1 (x) que descreve a borda
onde c e sao constantes positivas. No presente artigo consid- esquerda, por exemplo, assumimos que esse mesmo polinomio
eramos c = 1 e = 1.5. O resultado da transformacao em pode ser utilizado como referencia para compensar tambem a
nveis de cinza sugerida pode ser visualizado na Figura 4(c). borda direita, a partir de um polinomio simetrico p2 (x). A
O passo seguinte consiste em se ltrar a imagem Ih com correcao geometrica proposta nada mais faz do que interpolar
4 ltros gaussianos de tamanhos hi = [3 5 7 9]. Considerando cada linha da impressao digital nas direcoes indicadas pela
que esses tamanhos de ltro representam as larguras a meia ilustracao da Figura 7 (a). Os eixos foram rotacionados para
altura (full width at half maximum ou FWHM) de Gaus- acompanharem a orientacao de captura da imagem. A Figura 7
sianas [9], os respectivos desvios padroes i sao denidos a (b) mostra a imagem ID resultante da correcao geometrica.
partir da equacao, Utilizaram-se polinomios de grau 5.
4
hi 1
i = . (2) IM = Ibi (3)
2 2 ln 2 4 i=1
As 4 novas imagens, If i , i = 1..4, resultantes do processo
de ltragem anteriormente citado, sao entao binarizadas por
meio do software mindtct oferecido pelo NIST(National In-
stitute of Standards and Technology) no pacote NIST Biometric
Image Software (NBIS) [10]. O resultado sao as imagens
binarias Ibi , i = 1..4. A imagens ltradas e binarizadas podem
ser visualizadas na Figura 5.
Gera-se, entao, uma imagem IM a partir da media das
imagens Ibi , conforme a Equacao 3, e realca-se um recorte
exatamente nos limites da impressao digital. O resultado pode
ser visualizado na Figura 6. Pode-se observar que o aspecto de
IM comeca a se aproximar ao de uma imagem adquirida por Fig. 6. Imagem IM , gerada a partir da media das imagens Ibi .
meio de um dispositivo com contato. No entanto, a imagem
apresenta-se afunilada em sua parte superior. Geralmente, A penultima etapa de processamento consiste em se aplicar
em imagens adquiridas por meio de rolagem unha-a-unha, a uma textura sobre e imagem ID . Para isso, projetam-se sinteti-
diferenca entre a largura da parte superior e a largura da parte camente [11] elipses sobre ID com diaginais maiores (entre
inferior nao e tao acentuada. Por isso, faz-se necessario um 1 e 5 pixels), diagonais menores (entre 1 e 3 pixels), angulos
46
proposto por Tabassi e colaboradores [12]. Porem, de uma
maneira geral, o estimador baseia-se em: (a) um mapa de
qualidade onde sao integradas informacoes de baixo contrates,
baixo uxo de franjas, alta curvatura; (b) area da impressao
digital; (c) no numero total de minucias; (d) numero de
minucias com qualidades superiores a 0.5, 0.6, 0.75, 0.8 e
0.9. A qualidade de uma minucia e calculada a partir de dois
(a) (b) fatores: (1) sua posicao no mapa de qualidade; e (2) media
e desvio padrao dos pixels que constituem sua vizinhanca
Fig. 7. Correcao geometrica proposta: (a) cada linha da impressao digital
e interpolada nas direcoes indicadas. O polinomio p1 (x) e obtido a partir
imediata.
de regressao polinomial e descreve a borda esquerda da impressao digital. O A Figura 9 (a) mostra os resultados gerados pelo NFIQ para
polinomio p2 (x) e obtido a partir da reexao e deslocamento de p1 (x); e (b) o conjunto de testes considerado nesse trabalho. Aproximada-
resultado da correcao geometrica aplicada a imagem da Figura 6. Utilizaram-
se polinomios de grau 5.
mente 90% das imagens receberam ndices bom, muito bom
ou excelente.
Em um segundo experimento, submetemos as impressoes
(entre 0 e 180 ) e nveis de cinza (entre 0 e 255) gerados digitais processadas ao software de casamento bozorth3 [10],
aleatoriamente. O resultado e o observado na Figura 8 (a). com o objetivo de determinarmos a equal error rate (EER).
Com o objetivo de se descartar as margens da impressao digital Para avaliaramos a taxa de falsa rejeicao, casamos uma das
por aprensentarem rudos causados pela baixa frequencia de impressoes digitais de cada dedo com a outra impressao
franjas, realiza-se um esmaecimento nas bordas da imagem. A do mesmo dedo. A taxa de falsa aceitacao foi computada
Figura 8 (b) mostra o resultado do esmaecimento que, tambem, casando-se as duas impressoes digitais de cada dedo com todas
representa o passo nal do metodo proposto. as impressoes digitais dos demais dedos. Ou seja, as duas
impressoes digitais do dedo 1 foram casadas com todas as
impressoes digitais dos dedos 2 a 100 (396 casamentos). As
duas impressoes digitais do dedo 2 foram casadas com todas
as impressoes digitais dos dedos 3 a 100 (392 casamentos). E
assim por diante, ate que as duas impressoes digitais do dedo
99 foram casadas com todas as impressoes digitais do dedo
100 (4 casamentos). Foram no total 100 casamentos para se
determinar a taxa de falsa rejeicao e 19800 casamentos para se
determinar a taxa de falsa aceitacao. A denicao dessas taxas
(a) (b) depende tambem de um limiar estabelecido para o ndice de
Fig. 8. Aplicacao de textura (a) e esmaecimento das bordas (b). similaridade retornado pelo bozorth3. A Figura 9 (b) mostra
as curvas de falsa aceitacao e falsa rejeicao para limiares entre
0 e 150. A EER cou por volta de 4% para o limiar 14.
III. R ESULTADOS E XPERIMENTAIS
Nosso conjunto de testes e formado por 200 imagens IV. C ONCLUS OES
adquiridas a partir de um dispositivo sem contato multivista. Foi proposto um metodo para processamento de impressoes
As impressoes digitais foram capturadas da forma mais natural digitais adquiridas com dispositivos de captura multivista sem
possvel, simulando um processo de aquisicao real. Em outras contato, com o objetivo de torna-las semelhantes as adquiridas
palavras, procurou-se minimizar ao maximo a inuencia de um com dispositivos onde o contato e necessario. Com isso,
operador. O procedimento de captura foi descrito ao usuario procurou-se compatibilizar as duas tecnologias.
e o operador apenas intereferiu indicando ao usuario o mo- As 200 imagens adquiridas por meio de um dispositivo
mento em que o dedo deveria ser posicionado no dispositivo. que dispensa o contato passaram por duas etapas principais
Alem disso, nao foram descartadas quaisquer imagens, mesmo de processamento. A primeira procura reproduzir a textura
aquelas que pudessem ser classicadas como sendo de baixa de impressoes digitais tradicionais, e a segunda procura fazer
qualidade a partir de uma avaliacao previa do operador. As reetir o processo de rolagem unha-a-unha. Dois experimentos
imagens representam 100 dedos diferentes, capturados duas foram propostos, um para avaliar a qualidade das imagens
vezes cada um. Todas as impressoes digitais foram processadas processadas, e outro para estabelecer a EER. Observou-se que
pelo algoritmo descrito na Secao II. Em seguida, computou-se 90% das impressoes digitais apresentaram ndices bom, muito
para cada impressao digital um ndice de qualidade a partir do bom ou excelente, e a ERR cou em 4%, demonstrando a
software NFIQ (NIST Fingerprint Image Quality) [12]. Trata- viabilidade do metodo proposto.
se de um software baseado em redes neurais articiais [13] que
retorna um dos sequintes ndices de qualidade: (1) Excelente;
(2) Muito bom; (3) Bom; (4) Regular; e (5) Ruim. Detalhes R EFERENCES
a respeito de como o NFIQ estima a qualidade de imagens [1] J. Wayman, A denition of biometrics, in National Biometric Test
de impressoes digitais podem ser consultados no documento Center Colected Works 1997-2000. San Jose State University, 2000.

47
[7] D.L. Milgram, Computer methods for creating photomosaics, IEEE
90 Transactions on Computers, vol. C-24, no. 11, pp. 11131119, Nov.
1975.
80 [8] Rafael C. Gonzalez and Richard E. Woods, Digital Image Processing,
Prentice Hall.
70
[9] Eric W. Weisstein, Gaussian Function,
No de ocorrncias

60 http://mathworld.wolfram.com/GaussianFunction.html, [Online;
Acessado em 21-Junho-2012].
50 [10] C. Watson, M. Garris, E. Tabassi, C. Wilson, R. M. McCabe amd
S. Janet, and K. Ko, Users Guide to NIST Biometric Image Software,
40 NIST, 2008.
[11] R. Cappelli, A. Erol, D. Maio, and D. Maltoni, Synthetic ngerprint-
30 image generation, in Pattern Recognition, 2000. Proceedings. 15th
International Conference on, 2000, vol. 3, pp. 471474 vol.3.
20 [12] E. Tabassi, C. L. Wilson, and C. I. Watson, Fingerprint Image Quality,
NIST, 2004.
10 [13] Simon Haykin, Redes Neurais, Princpios e Pratica, Pearson Education,
second edition, 1999.
0 Excelente Muito bom Bom Regular Ruim
ndice de qualidade

(a)

0.9

0.8

0.7
Taxa de erro (%)

0.6

0.5
Falsa aceitao
0.4 Falsa rejeio
0.3

0.2

0.1

0
0 20 40 60 80 100 120 140 160
Limiar

(b)

Fig. 9. (a) Indices de qualidade gerados pelo NFIQ para as 200 imagens
do conjunto de testes: 90% das imagens receberam ndices bom, muito bom
ou excelente; (b) taxas de falsa aceitacao e falsa rejeicao geradas a partir do
software de casamento de impressoes digitais bozorth3: a equal error rate
cou em 4%.

[2] R. Allen, P. Sankar, and S. Prabhakar, Fingerprint identication


technology, in Biometric Systems: Technology, Design and Performance
Evaluation, J. Wayman, A. Jain, D. Maltoni, and D. Maio, Eds.,
chapter 2. Springer, London, 2005.
[3] R.D. Labati, V. Piuri, and F. Scotti, Neural-based quality measurement
of ngerprint images in contactless biometric systems, in Neural
Networks (IJCNN), The 2010 International Joint Conference on, july
2010, pp. 1 8.
[4] Ruggero Donida Labati, Vincenzo Piuri, and Fabio Scotti, A neural-
based minutiae pair identication method for touch-less ngerprint
images, in Computational Intelligence in Biometrics and Identity
Management (CIBIM), 2011 IEEE Workshop on, april 2011, pp. 96
102.
[5] V. Piuri and F. Scotti, Fingerprint biometrics via low-cost sensors and
webcams, in Biometrics: Theory, Applications and Systems, 2008. BTAS
2008. 2nd IEEE International Conference on, 29 2008-oct. 1 2008, pp.
1 6.
[6] G. Parziale, Touchless ngerprinting technology, in Advances in
Biometrics: Sensors, Algorithms and Systems, Nalini K. Ratha and Venu
Govindaraju, Eds., chapter 2. Springer, London, 2008.

48
Estudo de Performance de algoritmos de
Verificao de Impresses Digitais Aplicveis a
Smart-Card
Ramyss de Macedo Rodrigues1, Rafael Oliveira Ribeiro2
1
Departamento de Polcia Federal, Setor Tcnico-Cientfico da Superintendncia Regional do DPF no Piau
Teresina/Piau, Brasil
2
Departamento de Polcia Federal, Instituto Nacional de Criminalstica,
Braslia/Distrito Federal, Brasil
ramyses.rmr@dpf.gov.br, rafael.ror@dpf.gov.br

RESUMO Este artigo apresenta um estudo comparativo de individualizao de uma pessoa (universalidade,
algoritmos de verificao de impresses digitais propostos na
literatura e aplicveis a sistemas Match-on-Card (MOC).
unicidade, permanncia).
Sero avaliadas as contribuies relativas de dois desses
algoritmos ante diferentes combinaes de descritores e TABELA 1
PROPRIEDADES DE IDENTIFICADORES BIOMTRICOS
formatos de templates conforme as definies da ISO 19.749-
2, no formato compacto e normal, propostas na literatura,
selecionados levando-se em considerao a sua utilizao em Identificador
1 2 3 4 5 6 7
dispositivos de memria e capacidade de processamento Biomtrico
limitados. Os resultados demonstram que recomendvel
manter os descritores padro no formato compacto DNA H H H L H L L
especificados pela ISO/IEC 19.749-2, mesmo no se Iris H H H M H L L
utilizando todos os seus elementos. Retina H H M L H L L
Orelha M M H M M H M
1. INTRODUO Face H L M H L H H
Impresso digital M H H M H M M
A necessidade de se implementar formas Geometria da mo M M M H M M M
seguras de identificao de pessoas faz o Escrita L L L H L H H
reconhecimento automtico de caractersticas Voz M L L M L H H
biomtricas ser objeto de constantes estudos. As 1: Universalidade; 2: Unicidade; 3: Permanncia; 4: Colectabilidade; 5:
impresses digitais, nesse contexto, so as mais Desempenho; 6: Aceitabilidade; 7: Suscetibilidade; L: Baixo (Low); M:
Mdio (medium); H: Alto (high)
utilizadas, tendo em vista sua facilidade de
aquisio e processamento quando comparada a O aumento da capacidade de processamento e
outros identificadores, como ris ou DNA [1]. de armazenamento de chips que podem ser
embarcados em cartes de identificao, tokens
As impresses digitais j so, h muito,
USB, passaportes eletrnicos, entre outros, torna
utilizadas para identificao de pessoas [1]. Em
possvel que a comparao biomtrica seja
grandes bases de dados, como cadastros de
realizada dentro do prprio smart-card.
identidade civil, elas so o elemento chave na
individualizao de um registro. A principal vantagem desta abordagem diz
respeito ao aumento da segurana dos dados
A Tabela 1, extrada de [1], relaciona de forma
biomtricos e da privacidade do usurio, uma
resumida as propriedades de diversos
vez que a biometria de referncia, armazenada
identificadores biomtricos, com destaque para a
no chip, no acessada por sistemas externos,
impresso digital.
sendo necessrio apenas que o smart-card
Pode-se verificar que esse identificador fornea uma resposta do tipo positivo/negativo
biomtrico oferece mdia facilidade de aquisio ou um grau de similaridade entre a biometria de
(coletabilidade) com alta confiabilidade na referncia e aquela submetida comparao.

49
O contedo deste artigo organizado da pelo vetor bsico, ou template, [1] e [6] [x, y,
seguinte forma: na seo 2 sero discutidos os ngulo, tipo]i, sendo 1 i N. Uma imagem de
conceitos e estrutura dos sistemas de verificao impresso digital plana de boa qualidade
Match-on-Card. Na seo 3 sero demonstrados geralmente possui entre 40 e 80 mincias [1].
os formatos de armazenamento de mincias de
acordo com a norma ISO/IEC 19749-2. Na seo
4 sero descritos algoritmos comparadores
compatveis com esses sistemas e encontrados na
literatura. Na seo 5 sero demonstrados os
resultados de testes realizados com dois
comparadores com diferentes descritores e
formatos de templates. Finalmente, nas sees 6 (a) (b)
e 7 sero expostas as concluses e trabalhos
Figura 2: Mincias e ngulos: (a) Terminaes (b) Bifurcaes.
futuros.
O uso desses descritores, no entanto, no
2. SISTEMAS MATCH-ON-CARD DE permite uma comparao direta, ponto a ponto,
VERIFICAO BIOMTRICA entre dois distintos templates, tendo em vista as
De acordo com [1] e [2], um sistema de inevitveis distores introduzidas no processo
verificao de impresses digitais convencional de aquisio, como rotaes, translaes e outras
pode ser descrito pelo diagrama em blocos distores no lineares.
apresentado na Figura 1. Por isso, diversos algoritmos de verificao de
impresses digitais transformam a representao
bsica em outra que seja imune rotao e ao
deslocamento, gerando um vetor caracterstico
[1] [3], [5] [8], [9], [14] [15]. Isso pode ser
feito definindo-se referncias no conjunto
template, em relao s quais todas as mincias
sero representadas.
Os algoritmos de comparao respondero
solicitao de verificao de dois templates
Figura 1: Sistema de verificao de impresses digitais. atravs de um grau de similaridade, geralmente
A impresso digital introduzida no sistema variando no intervalo [0,1], o qual est
atravs dispositivos pticos. Em seguida, ela relacionado com a probabilidade dessas duas
realada para ter extrados os seus elementos impresses digitais serem provenientes de um
individualizadores, sendo as mincias (Figura 2) mesmo dedo [1], [10].
e os pontos singulares os elementos mais Para plataformas computacionais baseadas em
comuns [1] [3] e [6]. As primeiras podem ser PC, o tamanho dessa representao no uma
divididas, para fins prticos, em terminaes e preocupao imediata do projetista, tendo em
bifurcaes. J os pontos singulares, em ncleo e vista a disponibilidade de recursos de memria e
delta. processamento.
As mincias so descritas basicamente por Nos sistemas Match-on-Card (MOC), por
quatro elementos: coordenadas x e y (em relao outro lado, todo o processo de verificao
aos eixos coordenados da imagem), direo (em realizado no interior do chip, instalado, em geral,
relao ao eixo horizontal) e tipo (terminao ou no corpo de um carto plstico [7], [9] e [11]. O
bifurcao). O conjunto de N mincias template que representa a impresso digital do
detectadas na impresso digital ser representado proprietrio do carto de identidade

50
armazenado em regies de memria protegidas prprio cabealho, os descritores das mincias
contra acessos no autorizados. O template do (tipo, coordenadas, ngulo e qualidade), alm de
portador do carto extrado da imagem outros dados em um bloco denominado extended
adquirida por sensores em geral pticos ou data [5], como coordenadas do ncleo e delta,
capacitivos. Um sistema de autenticao quantidade de linhas entre mincias, etc. So
biomtrico baseado nesse conceito tem a tambm definidos dois formatos de
estrutura mostrada na Figura 3. armazenamento: normal e compacto.
Para o formato normal, as informaes
relativas a cada mincia so armazenadas em
blocos de 6 bytes, com o alinhamento mostrado
na Figura 4.
   
    
   
Figura 4: Formato das mincias representadas no modo normal [15].

Figura 3: Sistema Match on Card de verificao de impresses O formato compacto, por outro lado, utiliza
digitais. apenas 3 bytes por mincia, com alinhamento
A aquisio, extrao e gerao de templates mostrado na Figura 5.
so implementadas em dispositivos de hardware   
de maior poder de processamento do que os    
chips usualmente empregados nos smart-cards
Figura 5: Formato das mincias representadas no modo compacto
[4], [7], [12] e [13]. [15].

O desempenho dos algoritmos de comparao O formato normal representa uma coordenada


aplicveis a sistemas MOC tem melhorado espacial utilizando 14 bits (214 nveis de
medida que os smart-cards tm aumentado sua quantizao) e ngulos com passos de 360 / 28
capacidade de processamento e memria, graus. Se uma impresso digital tiver 40
assemelhando-se queles projetados para mincias, sero necessrios 40 * 6 = 240 bytes
arquiteturas baseadas em PC [14]. de memria apenas para armazenar as mincias.
3. ISO/IEC 19.749-2 FORMATO PADRO DE No modo compacto, as coordenadas sero
INTERCMBIO DE INFORMAES representadas em 28 = 256 nveis. Os ngulos em
BIOMTRICAS: IMPRESSES DIGITAIS passos de 360 / 26 graus. Em termos de
utilizao de memria, o espao ocupado pelas
A norma ISO/IEC 19.749 define o formato de
mesmas 40 mincias ser reduzido para 40 * 3 =
armazenamento de diversas caractersticas
120 bytes. Um ganho considervel se
biomtricas de modo a permitir a
observarmos que trabalhamos com limitaes de
interoperabilidade de sistemas baseados em
memria.
biometria. A parte 2 dessa norma especializada
em impresses digitais [6], estabelecendo, entre A desvantagem bvia da utilizao do modo
outros aspectos, o formato de armazenamento de compacto a perda de resoluo dos descritores
suas mincias. da mincia.
O formato composto por um cabealho geral O MINEXII (Minutiae Exchange
(Record Header com 24 bytes) e um bloco de Interoperability Test) [13] comparou algoritmos
informaes Single Finger Record para cada de verificao de impresses digitais, fornecidos
dedo do indivduo cadastrado. Em cada Single por fabricantes diversos, utilizando os dois
Finger Record so armazenados, alm do seu formatos de armazenamento, concluindo que a

51
perda de desempenho global aceitvel para o Onde t0 e t1 so tolerncias, utilizadas para
formato compacto e, portanto, adequado para considerar as distores no lineares e podem ser
operaes em sistemas Match-On-Card. determinadas dinamicamente em funo da
distncia considerada, conforme [5].
4. ALGORITMOS DE COMPARAO DE
IMPRESSES DIGITAIS Essa a proposta do algoritmo [15] o qual foi
desenvolvido para ser utilizado em smart cards.
O reconhecimento de impresses digitais Ele aplica sucessivamente a funo de
atravs das mincias a metodologia mais transformao dada pela Equao 4 para alinhar
popular entre os algoritmos comparadores. os dois conjuntos de mincias. Observa-se que
Aliado ao fato de ser semelhante tcnica rotacionar ou transladar um conjunto de
utilizada pelo comparador humano, o trabalho mincias no altera o descritor de tipo.
com essas caractersticas transforma o processo
de verificao de duas impresses digitais em
um problema de combinao de padres de (4)
pontos, ou point pattern matching [1] e [7].
Como discorrido na seo 2, as distores Os algoritmos apresentados em [4] e [14]
introduzidas na aquisio no permitem a utilizam as coordenadas do ncleo como
comparao ponto a ponto entre dois templates referncia de um sistema de coordenadas
quando representadas por seus descritores polares, em relao ao qual todas as mincias
bsicos [x, y, ngulo, tipo]. so codificadas, gerando o vetor caracterstico
As distores do tipo rotao e translao tem (Figura 6). A nova representao, desse modo,
relao direta com a rea da superfcie do sensor absorve automaticamente as distores de
e o posicionamento do dedo do usurio durante a rotao e translao.
aquisio. As distores no lineares so
causadas principalmente pela transformao do
espao 3D do dedo do usurio para o espao 2D
da superfcie do sensor da imagem [1]. Alm
disso, os erros de deteco de mincias so
consequncias, em geral, da maior ou menor
presso com que o usurio coloca seu dedo no
sensor [2]. (a) (b)

Desse modo, um alinhamento entre os dois Figura 6: Codificao das mincias e sua vizinhana segundo [14]. (a)
Mincias em relao ao ncleo. (b) Codificao da estrutura em
conjuntos de mincias, ou a transformao de coordenadas polares (r = distncia radial; = distncia angular; =
sua representao para outra imune rotao e diferena direcional)
translao (vetor caracterstico), um passo Em [5], o algoritmo toma cada uma das
mandatrio [1]. mincias do template e a relaciona com sua
Aps o alinhamento, duas mincias p e q, vizinhana mais prxima (Figura 7). A grande
pertencentes a templates distintos e vantagem dessa abordagem a no necessidade
representadas por seus descritores bsicos sero de se detectar o ncleo da impresso digital.
consideradas similares se satisfizerem, ao Outros algoritmos, como [2] e [15], geram
mesmo tempo, as seguintes equaes [1]: grafos planares atravs da triangulao dos
Distncia_Euclidiana(p,q) t0 (1) descritores espaciais das mincias. Em [2],
conforme se observa na Figura 8, o vetor
Diferena_angular(p,q) t1 (2)
caracterstico criado relacionando-se cada
tipo(p) = tipo(q) (3) mincia com sua vizinhana estabelecida pelas

52
arestas do grafo. Em [15], cada triangulo gerado Verifica-se que a maioria dos algoritmos
codificado em funo de seus lados, ngulos baseados em mincias utilizam apenas os
internos e externos, e outras caractersticas descritores relacionados s coordenadas
associadas. O trabalho de [15] implementou esse espaciais e ao ngulo para gerar o vetor
algoritmo em um smart card. caracterstico. Em tese, o descritor de tipo
aumenta o grau de individualizao de uma
mincia e ocupa, nos formatos normal e
compacto, apenas dois bits por elemento no
template.

Figura 7: Codificao da mincia Mi e suas duas vizinhas mais


prximas, segundo [5].

Figura 9: Codificao de pares de mincias de acordo com [16].

A principal razo para o no uso desse


descritor sua sensibilidade aos erros de
aquisio, onde, por exemplo, uma terminao
(a) (b) pode ser computada como bifurcao se o
usurio pressionar demasiadamente seu dedo no
sensor [1] e [5].
Se comparada economia de memria
proporcionada pela utilizao do formato
compacto da ISO/IEC 19.794-2, a no utilizao
desse descritor geraria uma economia de apenas
(c) (d) dois bits por mincia. No exemplo da seo 3,
Figura 8: Codificao das mincias e sua vizinhana segundo [2]. (a) em conjunto de 40 pontos a economia em espao
Triangulao das mincias. (b) e (c) identificao da vizinhana gerada
pelo grafo e estrutura formada (sub-grafo). (d) Codificao da estrutura de memria seria de 40 * 2 bits = 80 bits, ou 10
em coordenadas polares (d = distncia radial; = distncia angular; d = bytes.
diferena direcional)
Seria ento adequado utilizar esses dois bits
BOZORTH3 [16] o nome dado ao algoritmo
para aumentar a resoluo do descritor de ngulo
comparador de mincias utilizado em [17].
no modo compacto, o qual representado por
Nessa metodologia, todas as mincias do
apenas 6 bits? Qual seria a perda de performance
conjunto so agrupadas aos pares, codificando-se
dos algoritmos comparadores quando utilizamos
as distncias, ngulos e diferenas direcionais
ou desprezamos esse descritor? o que se
entre extremos, de acordo com a Figura 9.
pretende responder na prxima seo.
Outros algoritmos no baseados em mincias
j esto sendo aplicados no reconhecimento de 5. RESULTADOS EXPERIMENTAIS
impresses digitais em sistemas MOC, como o Para se conferir a performance dos algoritmos
proposto em [3], que se utiliza do denominado ante a utilizao dos formatos de armazenamento
FingerCode para o reconhecimento rpido de normal e compacto, com e sem a utilizao de
impresses digitais em smart cards.

53
todos os seus descritores, foram selecionados os resultados dos valores do parmetro AUC para
algoritmos de comparao propostos em [5] e diversas configuraes de descritores e formatos
[2], implementados em MATLAB, e a base de de template.
dados DB1 da FVC2002 [10], disponibilizada
Em seguida, foram repetidas todas as
em [1]. A seleo desses algoritmos se deve
configuraes de descritores dos testes
principalmente ao esforo de implementao j
anteriores, utilizando-se desta vez templates no
desenvolvido em [2]. Os valores de t0 e t1 so
modo compacto, obtidos pela requantizao dos
selecionados adaptativamente em funo da
descritores anteriores. Os parmetros x e y
distncia, conforme a metodologia apresentada
passam a ser representados com 8 bits, o ngulo
em [5]. Na prtica, esses valores pernamecem no
com 6 bits e o tipo com 2 bits. A Figura 13
intervalo de 10 a 25 pixels para t0 e de 10 a 30
mostra o detalhe da curva ROC resultante
graus para t1.
quando utilizamos os descritores [x, y, ngulo]
A base de dados contm oito amostras de cem no modo compacto e a Figura 14 mostra a curva
indivduos, totalizando oitocentas imagens de quando so utilizados os descritores [x, y,
impresso digital. Os usurios foram orientados ngulo], sendo o ngulo representado dessa vez
a colocar seus dedos no sensor com maior ou por 8 bits (adicionando os dois bits do descritor
menor presso, sem preocupao com rotaes de tipo ao descritor de ngulo: modo compacto
ou translaes. Isso produziu uma base de dados modificado).
com variabilidade intraclasse (variaes entre
As Tabelas 2 e 3 listam os resultados gerais
amostras de um mesmo dedo) bastante
obtidos.
compatvel com o mundo real [10].
Foram utilizadas como figuras de mrito a
AUC (Area Under Curve rea sobre a curva)
de uma curva ROC (Receiver Operating
Characteristic) (Figura 10), com eixo das
abscissas representando o FAR (False
Acceptance Rate) e o eixo ordenado o CAR
(Correct Acceptance Rate). Essa curva aponta a
preciso do comparador, ou seja, a probabilidade
do sistema classificar corretamente um dado
padro de entrada. O protocolo de avaliao
tambm foi baseado em [10].
Ambos os algoritmos [5] e [2] geram vetores
caractersticos relacionando cada mincia do
template suas vizinhas. O primeiro, s mais
prximas. O segundo, quela estabelecida por
uma triangulao. Figura 10: Curva ROC para os algoritmos de comparao por vizinhana
simples [5] e vizinhana por grafo [2], com vetor caracterstico originado
dos descritores [x, y, ngulo], utilizando-se seis bytes por mincia (modo
No primeiro teste, os vetores caractersticos normal).
dos dois algoritmos foram originados dos
descritores [x, y, ngulo]. No segundo, dos
descritores [x, y, ngulo, tipo] e no terceiro, de
uma combinao de [x, y, ngulo] para a mincia
central e [x, y, ngulo, tipo] para a vizinhana,
todos esses descritores representados no modo Figura 11: Detalhe da curva ROC para os algoritmos de comparao por
normal da ISO 19.794-2. As curvas ROC vizinhana simples [5] e vizinhana por grafo [2], com vetor
caracterstico originado dos descritores [x, y, ngulo, tipo], utilizando-se
exibidas nas Figuras 10 a 13 mostram os seis bytes por mincia (modo normal).

54
com os resultados apresentados no MINEXII
[13], sendo essa queda proporcionada,
principalmente, pela menor resoluo do
descritor de ngulo (que passa a ser representado
por apenas 6 bits). O ganho em espao de
Figura 12: Detalhe da curva ROC para os algoritmos de comparao por
memria com esse formato compensa as perdas
vizinhana simples [5] e vizinhana por grafo [2], com vetor em preciso [13], uma vez que viabiliza a
caracterstico originado dos descritores [x, y, ngulo] para a mincia
central e [x, y, ngulo, tipo] para as vizinhas, utilizando-se seis bytes por
utilizao desses algoritmos em sistemas de
mincia (modo normal). baixa capacidade de memria.
TABELA 3
RESULTADOS GERAIS DOS TESTES PARA O FORMATO
COMPACTO

Configurao/ Perda de
AUC
algoritmo desempenho
A-1 0,99492 0,00%
Figura 13: Detalhe da curva ROC para os algoritmos de comparao por
vizinhana simples [5] e vizinhana por grafo [2], com vetor
A-2 0,99694 0,00%
caracterstico originado dos descritores [x, y, ngulo], utilizando-se trs B-1 0,9614 -3,37%
bytes por mincia (modo compacto), ngulo representado por seis bits.
B-2 0,97 -3,56%
C-1 0,9835 -1,15%
C-2 0,9862 -1,35%

TABELA 4
COMPARAO DOS RESULTADOS GERAIS DOS TESTES PARA O
FORMATO NORMAL E COMPACTO
Figura 14: Detalhe da curva ROC para os algoritmos de comparao por
vizinhana simples [5] e vizinhana por grafo [2], com vetor
caracterstico originado dos descritores [x, y, ngulo], utilizando-se trs Configurao/ Perda de desempenho
bytes por mincia e ngulo representado por oito bits (modo compacto algoritmo Normal/Compacto
modificado).
A-1 0,00%
TABELA 2 A-2 -0,04%
RESULTADOS GERAIS DOS TESTES PARA O FORMATO NORMAL
B-1 -0,05%
Configurao/ Perda de
AUC B-2 -0,34%
algoritmo desempenho
A-1 0,99492 0,00% C-1 -0,01%
A-2 0,99732 0,00% C-2 -0,10%
B-1 0,96184 -3,32% O emprego do descritor de tipo nos vetores
B-2 0,97327 -3,56% caractersticos, nos formatos normal ou
C-1 0,98363 -1,13% compacto, degrada o desempenho dos algoritmos
C-2 0,98717 -1,37% de comparao. A razo para isso a alta
A: algoritmo utiliza os descritores [x, y, angulo] sensibilidade desse parmetro aos erros de
B: algoritmo utiliza os descritores [x, y, ngulo, tipo] deteco de mincias.
C: algoritmo utiliza a combinao dos descritores [x, y, ngulo] e [x, y,
ngulo, tipo] Desprezar esse descritor proporciona baixa
1: algoritmo de vizinhana simples [5]
2: algoritmo de vizinhana por grafo [2] economia de memoria (apenas dois bits por
mincia). Adicionar os seus dois bits ao descritor
6. CONCLUSES de ngulo, no modo compacto, fazendo aumentar
A representao do template no modo a sua resoluo (que passa agora a ser
compacto insere nos algoritmos comparadores representado por oito bits), aproxima o
avaliados perdas de performance compatveis desempenho dos algoritmos de comparao

55
queles que se utilizam do modo normal e http://www.nist.gov/itl/iad/ig/minex.cfm
[14] K. C. Chan, Y. S. Moon, P.S. Cheng, "Fast Fingerprint Verification
descritores [x, y, ngulo]. using Sub-regions of Fingerprint Images", IEEE Transactions on
Circuits and Systems for Video Technology, Vol. 14, Issue 1, pp.
Entretanto, considerando a pequena diferena 95-101, Jan. 2004.
[15] Barral, C. Biometrics & Security: Combining Fingerprints, Smart
de desempenho entre os modos normal e Cards and Cryptography, Tese de Doutorado, 2010, Ecole
compacto e os constantes estudos e possvel Polytechnique Fdrale de Lausanne.
[16] Users Guide to NBIS-EC Nist Biometric Image Software
desenvolvimento de algoritmos detectores de (http://www.nist.gov/customcf/get_pdf.cfm?pub_id=51096)
mincias menos suscetveis a erros, a [17] NIST/NBIS, http://www.nist.gov/itl/iad/ig/nigos.cfm.
manuteno do descritor de tipo no template
poder vir a ser til no futuro.

7. TRABALHOS FUTUROS
Os testes experimentais realizados na seo 5
devero ser repetidos com os algoritmos
implementados em smart-cards a fim de se
avaliar a compatibilidade dos resultados obtidos,
medindo-se inclusive o tempo de resposta s
solicitaes de verificao.

8. AGRADECIMENTOS
Ao SETEC/PI e ao SEPAEL pelo apoio e
incentivo.

REFERNCIAS
[1] D. Maltoni, D. Maio, A.K. Jain, and S. Prabhakar, Handbook of
Fingerprint Recognition, Springer 2005.
[2] Rodrigues, R.M., Filho, C.F.F.C. ; Costa, M.G.F; Fingerprint
Verification Using Planar Graphs; Page(s): 87 - 92 IVMSP
Workshop, 2011 IEEE 10th; 16-17 June 2011.
[3] Kumar P. Y. and Ganesh T. S. Integration of Smart Card and
Gabor Filter Method based Fingerprint Matching for Faster
Verification, INDICON, 2005 Annual IEEE, Page(s): 526 529.
[4] Mimura, M., Ishida, S.; Seto, Y., Fingerprint Verification System
on Smart Card Consumer Electronics, 2002. ICCE. 2002 Digest
of Technical Papers. International Conference on, Page(s): 182
183.
[5] T. Y. Jea, V. Govindaraju, "A Minutia-based partial fingerprint
recognition system", Pattern Recognition 38 (2005) pp. 1672-
1684, March 2005, published by Elsevier Ltd.
[6] ISO/IEC 19749-2 Biometric Data Interchange Formats Part 2:
Finger Minutiae Data.
[7] Moon, Y., Ho, H., Ng, K., Wan, S., Wong, S.: Collaborative
Fingerprint Authentication by Smart Card and a Trusted Host.
[8] Sanchez-Reillo, R., Sanchez-Avila, C.: Fingerprint Verification
using Smart Cards for Access Control Systems. Proc. of Int.
Carnahan Conf. (2001) 250-253.
[9] R. Sanchez-Reillo, L. Mengibar-Pozo, C. Sanchez-Avila,
"Microprocessor Smart Cards with Fingerprint User
Authentication". IEEE Aerospace and Electronic Systems
Magazine; Vol. 18; 22-24 ; Mar 2003
[10] FVC2002, Fingerprint Verification Competition, 2002,
http://bias.csr.unibo.it/fvc2002/
[11] Hendry, M., Prideaux, J., Smart Card Security and Applications,
Artech House, Inc., 1997.
[12] Struif, B.; Scheuermann, D., Smartcards with biometric user
verification, Multimedia and Expo, 2002. ICME '02. Proceedings.
2002 IEEE International Conference on, 2002, Page(s): 589 - 592
vol.2.
[13] MINEXII, Minutiae Exchange Interoperability Text,

56
Avaliao de tcnicas de seleo de quadros-
chave na recuperao de informao por
contedo visual para identificar crimes
cibernticos em contedo multimdia.
Shnia Salvador de Pinho1 , Kleber J. F. Souza2
Instituto de Cincias Exatas e Informtica, PUC Minas
Guanhes, MG, Brasil
VKHQLD.VDOYDGRU#JPDLOFRPNOHEHUMIVRX]D#JPDLOFRP


5(6802  $ UHFXSHUDomR GH LQIRUPDomR GH FRQWH~GR nem sempre o contedo original do vdeo
YLVXDO GH YtGHRV GLJLWDLV p XPD IRUPD GH JHUHQFLDPHQWR H
EXVFDGHGDGRVPXOWLPtGLDV7RGDYLDVHPXWLOL]DUWpFQLFDV condiz com o que o usurio descreveu, sendo
GHVHOHomR GHTXDGURVFKDYH QR SURFHVVR WRGRV RV TXDGURV que alguns dos contedos podem ser crimes
GR YtGHR VmR XWLOL]DGRV LQGHSHQGHQWH GH VXD UHOHYkQFLD cibernticos. Por isso surge a necessidade de se
JHUDQGR H[FHVVR GH LQIRUPDo}HV SDUD DUPD]HQDU 1HVWH
WUDEDOKR p DYDOLDGR R FRPSRUWDPHQWR GH WUrV PpWRGRV GH
ter um controle destes dados publicados [2].
VHOHomRGHTXDGURFKDYHVHOHomRGHHPVHJXQGRHP
VHJXQGRV H SRU SL[HODSL[HO DSOLFDGR QD UHFXSHUDomR GH
Outro cenrio que deve ser levado em
LQIRUPDomR SRU FRQWH~GR YLVXDO 2V UHVXOWDGRV REWLGRV considerao est relacionado s diretrizes de
LQGLFDP TXH D UHOHYkQFLD GRV TXDGURVFKDYH VHOHFLRQDGRV sites referentes a publicao de vdeos que
SRGHVHUGHWHUPLQDQWHQDREWHQomRGHPHOKRUHVUHVXOWDGRV
contm cenas de violncia, encorajam
1. INTRODUO atividades perigosas e ilegais, afetam direitos
autorais, contendo crianas sendo sexualmente
Hoje em dia com as inovaes tecnolgicas sugestivos ou violentos entre outras [3].
que baratearam os preos dos dispositivos e da
comunicao de dados, houve a popularizao Para que estes contedos imprprios sejam
do compartilhamento de contedo visual e sua publicados apenas com o consentimento do
disponibilizao em meio digitais, como administrador do sistema [2], muito
exemplo o site Youtube que possibilita seus importante ter um gerenciamento do contedo
usurios compartilhem dados multimdia. visual publicado [4] e esta automao pode ser
realizada atravs de tcnicas de recuperao de
Nestas demandas de contedos publicados informao por contedo visual.
h o risco de encontrar algum que aproveita
da velocidade e disseminao de contedo Sabendo disso, o presente trabalho visa
multimdia na Internet para cometer crimes avaliar o comportamento de diferentes tcnicas
cibernticos, ou seja, infraes referentes ao de seleo de quadros-chave aplicada na
contedo do vdeo, como exemplo a recuperao de informao por contedo
pornografia infantil, racismo e atentado a visual.
propriedade intelectual. Segundo Gomes [5], no processo inicial da
Os usurios ao publicarem seus vdeos na recuperao de informao pelo contedo
Internet, geralmente descrevem o assunto do visual realizada a coleta de todos os quadros
vdeo atravs de descrio textual, ou seja, o do vdeo. Entretanto os vdeos so compostos
prprio usurio retrata ao publicar seu vdeo o por inmeros quadros, sendo necessrio
contexto que ele se refere. De acordo com o selecionar como base para a recuperao da
trabalho de Arajo et al [1], a descrio do informao os quadros que melhor representem
contedo do vdeo feita pelo usurio no o vdeo [6].
suficiente para realizar um controle eficaz de A no utilizao de tcnicas de seleo de
dados multimdias publicados. O motivo que quadros-chave tem como consequncia o

57
excesso de informaes armazenadas, pois devido ser uma abordagem mais simples de
todos os quadros so utilizados no processo de comparar os quadros do vdeo [7].
recuperao, independentemente de serem
O algoritmo consiste em selecionar o
relevantes ou no, sendo elas: quadros negros,
primeiro quadro de um vdeo como quadro-
quadros repetidos, quadros sem relevncia, chave a partir deste, calcular a distncia
entre outros.
Euclidiana entre todos os quadros seguintes. A
Trabalhos que apresentaram ganhos com a distncia entre o quadro-chave selecionado e o
utilizao de tcnicas de seleo de quadros- quadro que est sendo analisado comparada
chave foi realizado por Pimentel, Saibel e Buck com o limiar 80. O valor do limiar foi definido
[7] e Bueno et al [8] onde foi feito experimentalmente observando as diferenas
comparaes entre tcnicas de seleo de visuais dos quadros-chave selecionados, ou
quadros-chave e obteve diminuio do custo seja, o que obteve entre os experimentos a
computacional e armazenamento. menor taxa de quadros repetidos e a menor
taxa de perda de quadros relevantes do vdeo.
Outro trabalho que apresentou benefcios
com a utilizao de tcnicas de seleo de Quando o valor do limiar na comparao da
tcnica de pixelapixel alcanado, o quadro
quadros-chave foi o Nascimento, Manzato e
que est sendo comparado selecionado como
Goularte [9] o mesmo comparou seis tcnicas
com diferentes intervalos de tempo de seleo o novo quadro-chave do vdeo e a partir deste
momento, ele passa a ser a referncia para as
de quadros-chave sendo 0.5, 1.0, 1.5, 2.0, 2.5 e
prximas comparaes at a seleo do
3.0 segundos, pode-se observar que a tcnica
prximo quadro-chave.
trs segundos proporcionou melhora no
desempenho e sabendo disso faz-se necessrio Devido tcnica de seleo de quadros-
investigar os ganhos que se pode obter com a chave a cada trs segundos do vdeo ter
utilizao de seleo de quadros-chave no reduzido o custo computacional e
processo de recuperao de informao pelo proporcionou melhora no desempenho no
contedo visual, utilizando no s a tcnica do trabalho de Nascimento, Manzato e Goularte
Nascimento, Manzato e Goularte [9], mas [9] em comparao com seis tcnicas de
tambm outras tcnicas de seleo de quadros- intervalos diferentes do trabalho do mesmo.
chave. Foi definido que seria a segunda tcnica para
ser utilizada no trabalho. A tcnica baseia-se
O trabalho est organizado da seguinte
forma: Primeiramente so apresentadas as em selecionar um quadro-chave a cada
intervalo de tempo de trs em trs segundos do
tcnicas de seleo de quadros-chave que
vdeo.
foram utilizadas no trabalho. Logo aps,
discute o teste dos algoritmos, o experimento Por fim, a ltima tcnica foi selecionada
que foi realizado e anlise dos resultados. Para devido j ter sido utilizada no trabalho de Silva
finalizar a concluso da pesquisa e as [11] o trabalho pelo qual foi utilizado seu
referncias utilizadas. processo de recuperao da informao por
contedo visual neste artigo. Sendo o mtodo
2. TCNICAS DE SELEO DE QUADRO-CHAVE de seleo de quadros-chave a cada um
A partir dos estudos realizados foi possvel segundo do vdeo [10]. O funcionamento da
definir as tcnicas de seleo de quadros-chave tcnica consiste em selecionar um quadro-
que foram implementadas e analisadas no chave a cada um segundo do vdeo.
desenvolvimento deste trabalho. As tcnicas Podemos observar que as tcnicas de
selecionadas foram: comparao de quadro seleo de quadro-chave a cada trs segundos e
pixel-a-pixel, seleo de quadros-chave a cada um segundo do vdeo feito a seleo dos
trs segundos do vdeo e seleo de quadros- quadros-chave de acordo com intervalos de
chave a cada um segundo do vdeo. tempo, todavia o mtodo de seleo pixela
A tcnica de seleo de quadros-chave por pixel foi realizado etapa de processamento de
comparao pixel-a-pixel foi selecionada imagem nos quadros do vdeo.

58
Os quadros-chave selecionados em cada quadros. Sendo que, em ambos os vdeos esta
tcnica de seleo foram utilizados no processo taxa de 29 quadros por segundo, ou seja, a
de recuperao de informao por contedo cada 29 quadros na tcnica de 1 em 1 segundo
visual no trabalho de Silva [11]. o quadro selecionado como quadro-chave e
O trabalho de Silva [11] consiste em realizar cada 87 quadros para a tcnica de 3 em 3
segundos. Na tcnica pixel-a-pixel o resultado
comparaes entre as mtricas de indexao e
foi verificado pelas diferenas visuais entre os
recuperao de vdeos. Alm disso, mostrou a
quantidade de informaes para se descrever quadros selecionados. Interessante ressaltar
que os quadros-chave selecionados pela tcnica
uma imagem e como estas caractersticas
tiveram como resultado, quadros de tomadas
influenciam diretamente na recuperao de
informao por contedo visual. distintas. Esta observao tambm foi
verificada manualmente, apenas com a
3. TESTE DOS ALGORITMOS observao das caractersticas visuais dos
quadros e tomadas.
Primeiramente foi realizado o teste dos
algoritmos, com a finalidade de avaliar o TABELA 2
RESULTADO DO TESTE
funcionamento das tcnicas de seleo de
quadros-chave. Para o teste foram utilizados Pixel-a-Pixel Seleo 3 seg. Seleo 1 seg.
dois vdeos do projeto Open Video1. O Open V1 5 8 24
Video um projeto que visa disponibilizao V2 6 5 17
gratuita de vdeos digitais para pesquisa de
recuperao de multimdia.
4. EXPERIMENTO
Os vdeos aplicados no teste dos algoritmos Depois da etapa de teste dos algoritmos, foi
so apresentados na Tabela 1. So realizada uma anlise das tcnicas
documentrios da University of Maryland do implementadas, utilizando a mesma abordagem
ano de 1998, e foram obtidos no projeto Open de avaliao do trabalho de Silva [11]. A partir
Video. Os vdeos utilizados possuem som e cor. da base de quadros-chave selecionados foram
TABELA 1
analisados os acertos da busca de um objeto no
VDEOS DE TESTE vdeo. Vale ressaltar que o trabalho [11] teve
Nome do Vdeo Durao Total de
como objetivo principal a anlise comparativa
quadros do uso de estruturas mtricas para a indexao
V1 New Indians, Segment 08 00:23 707 e a recuperao de vdeos utilizando
V2 New Indians, Segment 09 00:16 503 vocabulrio visual. O autor comparou trs
estruturas: M-Tree, Slim-Tree e D-Index.

As trs tcnicas implementadas foram Como o objetivo deste artigo no avaliar


executadas em ambos os vdeos, com o tais estruturas mtricas, uma destas estruturas
objetivo de verificar a quantidade de quadros- foi escolhida para realizao do experimento
chave que os algoritmos selecionavam. A deste trabalho: a estrutura D-Index uma
Tabela 2 apresenta a quantidade de quadros- estrutura de indexao baseada em hashing.
chave selecionados por cada tcnica em cada Seu objetivo minimizar o nmero de acessos
vdeo. a disco e nmero de clculos de distncias [11].

Para verificar se tais resultados estavam As tcnicas de seleo de quadros-chave


corretos, na tcnica de seleo 3 em 3 foram implementadas em C# no ambiente de
segundos e 1 em 1 segundo foi realizado uma programao Visual Studio 2010. Na
contagem manual da taxa de quadros por realizao dos experimentos foi utilizado o
segundo do vdeo pela quantidade total dos mesmo vdeo utilizado por Silva [11]: The Big
Bang Theory da CBS (Columbia Broadcasting
1
System). Este vdeo tem durao de 19
Open Vdeo um projeto que disponibiliza gratuitamente vdeos
digitais para fins de Pesquisa de recuperao de multimdia. Mais
minutos, 56 segundos e possui 28.682 quadros.
informaes: http://www.open-video.org.
Para o processo de recuperao de

59
informao por contedo visual em vdeo, consulta dos objetos.
foram selecionados aleatoriamente 12 objetos
do vdeo como se pode observar na Figura 1.
Para fazer a busca pelo seu contedo visual,
atravs de sua imagem e no de sua descrio
textual,

Figura 2 Indexao das caractersticas do vdeo, Fonte: Adaptao de


Silva [11]

FIGURA 1 OBJETOS PARA CONSULTA

Inicialmente foram executadas as 3


tcnicas de seleo de quadros-chave no vdeo
para selecionar as imagens que mais
representavam o contedo. Sendo no processo
de seleo de 1 em 1 segundo e 3 em 3
segundos foi feito com base na taxa de 23
quadros por segundo. Na Tabela 3
apresentada a quantidade de quadros-chave
selecionados por tcnica:
TABELA 3
RESULTADO DO EXPERIMENTO

Pixel-a-Pixel Seleo 3 seg. Seleo 1 seg.


440 415 1247

Os quadros-chave selecionados pelas FIGURA 3 QUADROS PARA CONSULTA


tcnicas foram utilizados no processo de
recuperao da informao por contedo visual A Figura 4 apresenta o processo de
no trabalho de Silva [11]. Ou seja, foram recuperao das imagens que possuem os
aplicadas as 3 tcnicas implementadas e o objetos procurados no vdeo. Primeiramente,
restante do processo de recuperao de feito um processo de extrao das
informao por contedo visual do trabalho caractersticas da imagem do objeto que se
[11] como se pode observar na Figura 2. deseja buscar no contedo do vdeo. Logo
aps, as caractersticas extradas so
O objetivo do processo de recuperao armazenadas em um vetor de caractersticas
retornar as imagens que possuem os objetos que possui as informaes sobre cor e textura
apresentados na Figura 1 independente de suas [11]. feita a busca na estrutura de indexao
posies. (gerada no processo de indexao das
A Figura 3 apresenta alguns exemplos de caractersticas do vdeo). Por fim, so
quadros que foram utilizados na base para retornadas todas as imagens que possuem
caractersticas em comum com o objeto

60
procurado. Objeto 09 4 3 75%
Objeto 10 5 2 40%
Objeto 11 5 0 0%
Objeto 12 13 8 61,54%
Mdia Revocao 54,02%

A Tabela 5 apresenta a anlise dos


resultados da recuperao de informao visual
da tcnica de seleo de quadros-chave 3 em 3
segundos.
TABELA 5
SELEO DE QUADRO-CHAVE TCNICA 3 EM 3 SEGUNDOS

Consulta Rotulao dos objetos Acertos % Revocao


verdadeiros
Objeto 01 9 0 0%
Objeto 02 2 0 0%
Objeto 03 63 7 11,11%
Objeto 04 41 9 21,95%
Objeto 05 59 27 45,76%
Objeto 06 55 0 0%
Figura 3Recuperao de Informao por Contedo Visual , Objeto 07 74 28 37,84%
Fonte: Adaptao de Silva [11]
Objeto 08 8 1 12,5%
Objeto 09 8 1 12,5%
5. ANLISE E RESULTADO
Objeto 10 8 7 87,5%
Na anlise dos resultados das consultas Objeto 11 7 0 0%
IRL IHLWR XPD URWXODomR GRV REMHWRV Objeto 12 26 18 69,23%
YHUGDGHLURV SDUD FDGD WpFQLca de seleo de Mdia Revocao 24,86% 
quadros-chave. Portanto, manualmente foi
contabilizada a frequncia com que os objetos
Por fim, a Tabela 6 apresenta os resultados
selecionados para recuperao da imagem da recuperao de contedo visual da tcnica
aparecem nos quadros-chave do vdeo. De
seleo 1 em 1 segundo.
acordo com o mesmo foi realizada a
comparao dos resultados. TABELA 6
SELEO DE QUADRO-CHAVE TCNICA 1 EM 1 SEGUNDO
A Tabela 4 apresenta a anlise quantitativa
Consulta Rotulao dos objetos Acertos % Revocao
dos resultados da recuperao de informao verdadeiros
visual da tcnica de seleo de quadros-chave Objeto 01 35 0 0%
pixel-a-pixel. Objeto 02 07 0 0%

TABELA 4 Objeto 03 184 4 2,17%


SELEO DE QUADRO-CHAVE TCNICA PIXEL-A-PIXEL Objeto 04 131 2 1,53%
Consulta Rotulao dos objetos Acertos % Revocao Objeto 05 171 5 2,92%
verdadeiros
Objeto 06 157 23 14,6%
Objeto 01  11 9 81,82%
Objeto 07 219 29 13,2%
Objeto 02 1 1 100%
Objeto 08 21 2 9,52%
Objeto 03  13 3 23,08%
Objeto 09 27 0 0%
Objeto 04 33 25 75,76%
Objeto 10 19 0 0%
Objeto 05 61 29 47,54%
Objeto 11 18 3 16,7%
Objeto 06 28 1 3,571%
Objeto 12 80 12 15%
Objeto 07 20 13 65%
Mdia Revocao 6.30%
Objeto 08 4 3 75%

61
Foram utilizadas mtricas de revocao na vdeo) os resultados obtidos no foram to
comparao das trs tcnicas de seleo de relevante quanto tcnica pixel-a-pixel, que
quadros-chave, que avaliou a capacidade de se realiza a seleo dos quadros-chaves de maior
recuperar as imagens mais relevantes para o relevncia de acordo com critrio de pr-
usurio. Para o resultado calculou a quantidade processamento.
de quadros que possui o objeto procurado, isto
6. CONCLUSES
, os acertos divididos pela quantidade de
quadros da URWXODomR GRV REMHWRV Com o compartilhamento de contedo
YHUGDGHLURV visual na Internet, um grande volume de dados
multimdias publicado. Entretanto, h risco
De acordo com as tcnicas implementadas de usurios cometerem crimes cibernticos
pode-se observar que o mtodo pixel-a-pixel atravs dos contedos multimdia publicado
o mtodo que apresentou o melhor resultado de [12]. Devido ao volume destes dados, faz-se
forma geral, obteve 54,02% da mdia de necessrio ter formas automticas tanto para
resultados relevantes retornados no processo de realizar o gerenciamento dos mesmos, quanto
recuperao de contedo visual. Obteve para a realizao de buscas. Esta automao
tambm 100% de acerto na consulta do objeto pode ser realizada atravs de tcnicas de
02. O mtodo de seleo de 3 em 3 segundos recuperao por contedo visual.
obteve resultados de algumas consultas de
forma satisfatria. Um exemplo a consulta 12 De acordo com Sivic e Zisserman [10] este
onde se teve 18 acertos, tendo o melhor processo j utilizado para gerenciamento de
resultado nesta consulta entre as trs tcnicas. dados multimdia, sendo extremamente
Entretanto de forma geral alcanou apenas a importante ter gerenciamento e controle do
mdia de 24,86% de resultados relevantes. contedo visual publicado [4]. Entretanto, no
aplicando tcnicas de seleo de quadro-chave
Por fim, o mtodo de 1 em 1 segundo que no processo inicial da recuperao por
teve uma revocao mdia de apenas 6,30%, contedo de um vdeo, tem como consequncia
tambm apresentou vantagens, sendo uma o excesso de informaes armazenadas.
delas a consulta do Objeto 06, onde a mesma
acertou 23 quadros relevantes. Todavia, deve Portanto, o presente trabalho teve como
ser levado em considerao que a mesma objetivo avaliar o comportamento de diferentes
tcnica possua uma base 157 quadros para tcnicas de seleo de quadro-chave aplicado
consulta. Em comparao com as outras na recuperao de informao por contedo
tcnicas que possuem uma maior quantidade de visual. Para isso, trs tcnicas de seleo de
TXDGURV QD URWXODomR GRV REMHWRV quadros-chave foram implementadas e
YHUGDGHLURV avaliadas, so elas: pixel-a-pixel, 3 em 3
segundos e 1 em 1 segundo. Estas tcnicas
Observar-se que apesar da base de quadros foram avaliadas utilizando o trabalho do Silva
selecionados pelas tcnicas 1 em 1 segundo [11] conforme apresentado no experimento
maior que a tcnica pixel-a-pixel, esta ltima realizado. De acordo com os resultados dos
obteve os resultados mais relevantes da experimentos, verifica-se que a utilizao de
consulta na maioria dos casos. Pode-se dizer tcnicas de seleo de quadros-chave na
que o resultado final da recuperao de recuperao de informao por contedo visual
informao por contedo visual possui uma de fato influenciam nos resultados obtidos. A
dependncia das entradas e bases. Mesmo tcnica de seleo de quadros-chave pixel-a-
quando a base de quadros maior, como na pixel foi a tcnica que obteve os melhores
tcnica de seleo de 1 em 1 segundo no resultados, obtendo a media de 54,02% de
houve influncia de maneira geral no melhor resultados relevantes.
resultado. Alm disso, devido ao fato dos dois
primeiros mtodos (i.e., 1 em 1 segundo e 3 em Este trabalho contribui para a rea de
3 segundos) no realizarem nenhum processamento digital de imagens apresentando
processamento sobre as imagens (apenas uma avaliao de tcnicas de seleo de
selecionou os quadros em relao ao tempo do quadros-chave no processo de recuperao de

62
informao por contedo visual. Os resultados
obtidos indicam que a quantidade de quadros
selecionados no garante os melhores
resultados, e, alm disso, a relevncia dos
quadros selecionados pode ser determinante na
obteno de melhores resultados na
recuperao de informao por contedo
visual. Ou seja, algoritmos que realizam uma
anlise para selecionar os quadros relevantes,
como a tcnica pixel-a-pixel, tende a gerar
melhores resultados.

REFERNCIAS
[1] LOPES, Ana Paula B.; AVILA, Sandra Eliza Fontes; PEIXOTO,
Anderson N. A.; OLIVEIRA, Rodrigo Silva; COELHO,
0DUFHOR $5$-2 $UQDOGR  1XGH 'HWHFWLRQ LQ 9LGHR 8VLQJ
Bag-of-Visual-Features XXII Brazilian Symposium on Computer
Graphics and Image Processing, SIBGRAPI, IEEE Computer
Society Press, Rio de Janeiro, RJ, Brasil, 2009.
[2] PAIVA, Claudio Cardoso; SERRANO, Paulo Henrique Souto
0DLRU Critrios de Categorizao para os vdeos do Youtube.
X Congresso de Cincias da Comunicao na Regio Nordeste,
So Luis, MA, Junho 2008.
[3] DESELAERS, Thomas; Lexi Hermann; PIMENIDIS, Ney.
%DJ-of-Visual-Words models for Adult Image Classification
DQG )LOWHULQJ in International Conference on Pattern
Recognition (ICPR), Florida, USA, December 2008.
[4] $9,/$6DQGUD(OL]D)RQWHVGH8PD$ERUGDJHP %DVHDGDHP
Caractersticas de Cor para a Elaborao Automtica e Avaliao
Subjetiva de Resumos Estticos GH 9tGHRV Dissertao
(Mestrado) - UFMG, CNPq, 2008.
[5] GOMES, Marcio Luiz Rossato. Recuperao de Vdeos por
Contedo com Base em Informaes Estticas e Dinmicas.
Dissertao (Mestrado em Informtica) - Pontifcia
Universidade Catlica do Paran, Coordenao de
Aperfeioamento de Pessoal de Nvel Superior , 2006.
[6] 025,0272 &DUORV + 6$1726 7KLDJR 7HL[HLUD 
Estruturao e indexao de vdeo digital. in WebMdia, XVI
Brazilian Symposium on Computer Graphics and Image
Processing, Outubro 2003.
[7] PIMENTEL FILHO, C. A. F.; SAIBEL A. Celso; BUCK, T. A.
Integrao de Mtodos Baseados em Diferena de Quadros para
Sumarizao do Contedo de Vdeos. In: WebMedia - XIV
Simpsio Brasileiro de Sistemas Multimdia e Web, 2008, Vila
Velha, v. 2. p. 1-4, 2008.
[8] BUENO Mrcio, SANTOS Andra, FERREIRA Andr,
KELNER Judith, SIQUEIRA Iony. Refinamento de
Reconstruo 3D atravs de Seleo Apropriada de Keyframes
VIII Workshop de Realidade Virtual e Aumentada, Uberaba,
MG, 2011
[9] NASCIMENTO, Gilson A. do Nascimento; MANZATO,
0DUFHOR * *28/$57( 5XGLQHL Extrao de quadros-chave
FRPRVXEVtGLRSDUDSHUVRQDOL]DomRHPYtGHRVGLJLWDLV. Instituto
de Cincias Matemticas e de Computao, USP, So Carlos,
2010.
[10] 6,9,&-RVHI=,66(50$1$QGUHZ(IILFLHQW9LVXDO6HDUFKRI
Videos Cast as Text Retrieval.IEEE Trans Pattern Ana l Ma ch
Intell 2009.
[11] 6,/9$ +HQULTXH %DWLVWD Anlise de Estruturas Mtricas para
Recuperao de Vdeo Utilizando Vocabulrio VLVXDO I
Dissertao (Mestrado) - Pontifcia Universidade Catlica de
Minas Gerais, Programa de Ps-Graduao em Informtica,
Belo Horizonte, 2011.
[12] Ministrio Pblico Federal Procuradoria Da Repblica No Estado
De Sp Grupo De Combate Aos Crimes Cibernticos. Crimes
&LEHUQpWLFRV0DQXDO3UiWLFR'H,QYHVWLJDomR Abril, 2006.

63
Reconstruo de Trajetria de Voo para
Simulaes 3D em Sinistros Aeronuticos
Bruno Gomes de Andrade
Instituto Nacional de Criminalstica, Polcia Federal, Brasil
SPO Lote 7 Setores Complementares 70.610-902, Braslia/DF - Brasil
andrade.bga@dpf.gov.br

RESUMO A reconstruo da trajetria de voo um im- laudo pericial.


portante passo na investigao das causas determinantes de
sinistros aeronuticos. A proposta deste artigo expor e Entretanto, antes da construo de uma
discutir a metodologia utilizada pelo NTSB (National
Transport Safety Board) para reconstruir o movimento de
simulao 3D que represente os ltimos
uma aeronave e as foras que a produzem a partir de dados instantes de voos sinistrados necessrio
do FDR (Flight Data Recorder). O objetivo principal da me- reconstruir a trajetria da aeronave. O presente
todologia apresentada definir a posio e orientao da
aeronave ao longo do voo, determinando respostas a
artigo visa a expor e discutir a metologia
comandos, falhas no sistema, perturbaes externas ou ou- aplicada pelo National Transport Safety Board
tros fatores que possam afetar sua trajetria. A abordagem (NTSB) [1], [2] em diversos casos.
aqui utilizada permite tambm o clculo das cargas produ-
zidas ao longo do voo em qualquer ponto da aeronave.
2 . CLCULOS DE DESEMPENHO DE AERONAVES
BASEADOS EM DADOS DO FDR
1 . INTRODUO
Em sinistros aeronuticos, um dos aspectos O FDR, enquanto instrumento de gravao
importantes no estudo do desempenho da de dados, tem a funo de registrar os
aeronave consiste no clculo de sua posio e parmetros necessrios para a reconstruo
orientao ao longo do voo, baseados, precisa da trajetria, velocidade e orientao da
principalmente, nas informaes dos radares aeronave, bem como gravar dados relativos
primrios e secundrios do controle de trfego potncia, configurao e operao dos motores
areo, dados do Flight Data Recorder (FDR) e [3], [4].
gravao do Cockpit Voice Recorder (CVR). Apesar de gravar uma srie de parmetros
Juntamente com a investigao e anlise das relacionados ao voo, o FDR no registra
causas determinantes do acidente, comum, diretamente todas as variveis que podem ser
existindo dados disponveis suficientes, a de interesse para a anlise do desempenho da
reconstruo dos ltimos instantes de voos aeronave. Entretanto, diversos parmetros
sinistrados atravs da reproduo por meio de podem ser derivados dos dados gravados
simulao digital 3D. diretamente pelo FDR, entre eles a trajetria.

Os parmetros gravados diretamente pelo Uma estimativa precisa da trajetria de voo


FDR, udio do CVR, dados de radares, da aeronave pode ser obtida atravs da dupla
condies meteorolgicas e demais integrao dos dados do sensor triaxial de
informaes derivadas do FDR, como a acelerao (acelermetros) instalado nas
trajetria do voo, possibilitam, atravs da aeronaves. Entretanto, h alguns fatores
simulao 3D, a integrao de todos os dados intrnsecos relacionados ao sensor que devem
temporais e espaciais, proporcionando uma ser entendidos e levados em considerao para
perspectiva visual dos acontecimentos. a correta interpretao dos dados gravados.

A flexibilidade de combinar os dados, Uma delas o fato de que, geralmente, os


ngulos de cmeras e outros elementos visuais acelermetros no esto localizados
uma grande vantagem na forma de apresentar coincidentemente com o centro de gravidade
a sequncia de acontecimentos e, ao mesmo (CG) da aeronave. Dessa forma, antes de
tempo, valorizar e facilitar ao destinatrio da proceder integrao, os fatores de carga
investigao o entendimento das concluses do (quantidades efetivamente medidas pelos
acelermetros) registrados pelos sensores

64
devem ser corrigidos para valores relativos dos acelermetros e a posio do CG, e
posio do CG. Os ajustes so calculados o erro devido presena do offset na
atravs dos valores efetivamente medidos pelos medio dos fatores de carga.
acelermetros e pelas velocidades e Geralmente, os acelermetros so
aceleraes angulares da aeronave, descritas localizados bem prximos ao CG, de
pelas derivadas dos ngulos de guinada, forma que o erro devido localizao
rolamento e arfagem, parmetros estes do sensor tende a ser bem pequeno. J
gravados diretamente pelo FDR. o erro de bias tende a ser bastante
Ademais, sensores do tipo acelermetro significativo pois mesmo um pequeno
geralmente contm intrinsecamente pequenos offset pode gerar grandes erros quando
erros de offset, ou erros de bias, que podem integrados no tempo.
produzir grandes divergncias entre a Ademais o offset presente nos
velocidade e posio reais e as calculadas, se sensores no constante, mas tende a
no forem removidos antes da integrao. variar lentamente ao longo do voo.
Os valores dos offsets presentes nos sensores Com a finalidade de simplificar os
podem ser determinados atravs de algoritmos clculos, os erros de offset so
de minimizao, de tal forma que o resultado considerados constantes durante
da posio da aeronave quando integrada pelos pequenos intervalos de tempo (algo em
dados dos acelermetros, esteja de acordo com torno de 30 a 60 segundos). Importante
a posio da aeronave vinda de outras fontes, notar que essa simplificao no afeta
como dados de radar ou GPS (geralmente so o resultado final de forma
dados com frequncia de amostragem bem significativa.
mais baixa, mas que possuem maior preciso). 2.2 . ERRO DE POSICIONAMENTO DOS ACELERMETROS

2.1 . CORREES NOS ACELERMETROS E INTEGRAO As mesmas equaes utilizadas para corrigir
o erro relativo diferena entre a posio dos
Os fatores de carga registrados pelo
acelermetros e a posio do CG tambm
FDR so parmetros extremamente
fornecem os meios para calcular os fatores de
teis pois quando integrados
carga em qualquer ponto da aeronave. A
corretamente fornecem informaes
acelerao de um ponto P qualquer na aeronave
sobre a velocidade e posio inercial
dada por:
da aeronave. Ademais, so parmetros
que possuem frequncia de amostragem
bem superior a outros dados que
aP V6 CG xyz

*V 6
CG  xyz
* rP 
*
* rP
tambm registram a trajetria da Eq. 1
aeronave, como informaes de radares
e posio registrada por equipamentos Onde xyz o vetor distncia entre o CG e o
GPS. Dados dos acelermetros ponto P, e o vetor velocidade angular em
costumam ter frequncia de registro torno do CG. A notao xyz na equao 1
pelo FDR da ordem de 120-250Hz significa que a derivada relativa ao sistema de
enquanto que dados de GPS podem ter coordenadas do corpo, em oposio ao sistema
frequncia de registro da ordem de 5s. inercial de coordenadas. A relao entre os dois
Dessa forma, a trajetria obtida atravs sistemas de coordenadas mostrada na fig. 1.
das medidas dos acelermetros
apresenta uma imensa vantagem por Logo, com V CG xyz
 u v w  temos:
apresentarem um maior detalhamento


temporal. u6
Em relao aos problemas intrnsecos
V6 CG xyz
 v6 Eq. 2

presentes nos acelermetros, os dois w6


erros levados em considerao na
metodologia do NTSB so o erro
devido diferena entre a localizao

65

P6
6
xyz
 Q6 Eq. 6
R6

Substituindo as equaes 2, 3, 4 e 6 na
equao 1 e realizando o produto vetorial,
temos que:

  
u6 wQ v R Q yP xQ R zP xR  z Q6 y R 6
a P  v6 u R w P  R zQ yR P xQ yP  x R
6 z P
6
6
wv 6
P u Q P xR zP Q yR zQ  y P6 x Q
Eq. 7

Por definio temos que a posio  x , y , z 


Figura 1: Relao entre os sistemas de coordenadas inercial projetada
(xV, yV, zV) e do corpo (xb,yb,zb), ambos com origem no CG . [4] no CG igual a 0, 0, 0 . Logo, o primeiro
termo entre chaves na equao 7 deve ser a
Onde u , v , w  so as velocidades ao longo acelerao em torno do CG e o segundo termo
dos eixos Xb, Yb e Zb (coordenadas do corpo). entre chaves o incremento na acelerao
Os componentes de rP e
no eixo do corpo devido ao ponto P estar distante do CG.
so: Reescrevendo a equao 7 de forma
simplificada, temos que:


x
r P x i  y j  z k  y
Eq. 3 a P 
aCG 
a Eq. 8
z
Conforme mencionado anteriormente, um


acelermetro triaxial posicionado em um ponto
P
 P i  Q j R k  Q
Eq. 4
P, mede o fator de carga segundo a equao:
R
aP
g a CG 
a
g a
nP
 
nCG  Eq. 9

Onde i, j e k so vetores unitrios ao longo g g g


dos eixos Xb, Yb e Zb. Utilizando a seguinte
notao mais simplificada dx  dt x6 para Onde a equao 8 foi usada para substituir
denotar derivadas, as velocidades angulares P, n so n x , n y , n z .
aP . Os componentes de
Q e R so: Geralmente o fator de carga medido em
relao ao eixo Z b no segue a conveno

  
P sin 0 1 6 tradicional de coordenadas do eixo do corpo,
Q  sin cos cos 0 6 Eq. 5 onde a medio positiva de uma grandeza tem
R cos cos sin 0 6 direo para baixo (figura 1). A medio do
fator de carga no eixo Z b invertida, sendo
Os ngulos de guinada ( ), arfagem, ( ) e registrado pelo acelermetro e gravado pelo
rolamento ( ) so parmetros gravados pelo FDR como:
FDR, sendo o ngulo de guinada considerado
igual ao valor medido pela bssola magntica n LF n z Eq. 10

da aeronave, corrigido pelo valor da declinao


magntica registrada no local do sinistro. Geralmente o FDR registra os valores de
Da equao 4, temos que: n x , n y , n z  como Longitudinal Acceleration,
Lateral Acceleration e Vertical/Normal
Acceleration. Os valores de n x , n y , n z  em
torno do CG podem ser encontrados utilizando
os dados do FDR juntamente com as equaes

66
9, 10 e 11 com  x , y , z  na equao 7 sendo a possvel do evento da queda.
distancia do sensor triaxial at o CG. Os erros de offset relativos aos acelermetros
Uma vez calculado os fatores de carga no podem ser calculados para uma aeronave em
CG, as equaes 7, 9 e 10 podem ser utilizadas voo atravs de um processo iterativo que
para calcular fatores de carga em quaisquer compara a posio resultante da integrao dos
outros pontos, como no centro de massa das valores registrados pelos acelermetros com a
superfcies de controle ou no cockpit da posio calculada utilizando dados de
aeronave, caso seja de interesse da navegao de baixa frequncia registrados pelo
investigao. FDR.
2.3 . ERRO DE BIAS NOS ACELERMETROS A velocidade em relao ao solo (V solo) e o
Os fatores de carga registrados pelos ngulo de deriva ( deriva) so parmetros
acelermetros raramente correspondem aos geralmente registrados pelo FDR, assim como
valores reais, pois os sensores no so a latitude e longitude registrados pelo GPS.
perfeitos. Enquanto os incrementos relativos Entretanto, estas grandezas so registradas com
registrados no fator de carga a partir de um uma frequncia de amostragem bem mais
ponto de referncia possuem um erro muito baixa. Geralmente a informao de posio
pequeno, o valor absoluto do fator de carga de oriunda do GPS mais precisa.
referncia geralmente sofre de um erro de
offset em relao ao valor real. Esse valor 3 . VISO GERAL DO PROCEDIMENTO DE
facilmente visualizado na prtica a partir da CLCULO DO ERRO DE BIAS NOS
anlise dos dados de acelermetro enquanto a ACELERMETROS.
aeronave se encontra em posio de repouso. Nesta seo ser detalhado o processo de
Os fatores de carga longitudinal, lateral e clculo do erro de offset e as equaes
vertical nesse caso so dados pela equao 9 envolvidas segundo o procedimento adotado
com a P0, ou seja,
n P
g  g onde: pelo NTSB [1] e [2] em investigaes de
sinistros aeronuticos que possuem dados do

 
sin FDR disponveis.
g g cos sin
Eq. 11
Primeiramente, a posio atual da aeronave
cos cos definida utilizando os dados de velocidade
relativa ao solo e o ngulo de deriva registrados
e g o valor da acelerao da gravidade. pelo FDR (posio relativa ao eixos inerciais X
e Y). Com relao ao eixo inercial Z, uma
Os fatores de carga registrados pelo FDR
melhor estimativa da altitude calculada
raramente refletem esses valores exatos, e isso
resolvendo a equao hidrosttica com
facilmente verificado em casos reais
estimativas da densidade do ar atual em cada
analisando-se tais variveis, por exemplo, logo
ponto e pode ser vista em maiores detalhes em
antes da corrida de decolagem, quando a
[1], [2].
aeronave se encontra em repouso.
Em seguida uma estimativa do erro de offset
Define-se o erro de offset pela equao:
dos acelermetros realizada atravs do
clculo dos fatores de carga que resultam da
n
natual
n Medido Eq. 12
informao de posio que se obteve
anteriormente e comparando esses fatores de
Os erros de offset que existem logo antes da carga com os fatores de carga registrados pelo
decolagem no so necessariamente os mesmos FDR.
que existem no instante do acidente pois,
conforme j mencionado, o erro de offset pode Nesse ponto as iteraes tem incio. Os
divergir ligeiramente ao longo do voo. Dessa fatores de carga so atualizados com a
forma, o erro de offset que se aplica ao estimativa de erro de offset e depois integradas
momento do acidente deve ser determinado em para obter a informao de posio. Esses
um instante anterior, mas o mais prximo valores de posio integradas so comparadas

67
com a posio inercial calculada previamente e
o erro calculado.
A sensibilidade na variao da posio
devido integrao dos fatores de carga
somada ao incremento da diferena no offset
para cada sensor, avaliada modificando os
valores de offset ligeiramente e recalculando os
erros. Com a avaliao do resultado do
incremento de cada offset sobre a posio da
aeronave, os valores de erro so atualizados e
os valores de posio, erros e valor do offset
so recalculados. Quando mudanas no valor
do offset no mais resultam em uma
significante reduo na diferena, ento se
chegou a melhor estimativa do valor do offset e
os valores dos fatores de carga finais so
calculados.
Os valores integrados finais de velocidade e Figura 2: Convenes utilizadas no clculo dos offsets dos sensores,[2]
(figura adaptada)
posio so tambm calculados e representam a
melhor estimativa da velocidade inercial. V Y V solo sin
novo trajetria
Eq. 16

Na prxima seo todo esse processo ser


visto em detalhes. A posio da aeronave ento ser:
3.1 . DETALHES DO CLCULO DO OFFSET NOS
X novo V X dt Eq. 17
ACELERMETROS. novo

O algoritmo para o clculo do offset dos


acelermetros pode ser assim resumido: Y novo V Y dt novo
Eq. 18

Passo 1 - O valor atual da posio da


aeronave calculada atravs dos parmetros de Passo 2 - Os fatores de carga resultantes da
velocidade relativos ao solo(V solo) e ngulo de utilizao dos valores de posio inercial
deriva ( deriva). A posio medida no sistema calculados previamente so computadas para
de coordenadas inercial, onde a origem do fornecer uma estimativa inicial do offset dos
sistema a posio da aeronave no incio do acelermetros.
clculo, e onde o eixo Xnovo esta alinhado com o Combinando as equaes 7, 9 e 11 os fatores
ngulo de trajetria relativo ao solo (figura 2, de carga no CG so dados por:
[2]). O ngulo de trajetria, ou seja, o heading

  
do vetor velocidade, nesse sistema de
coordenadas dado por: 1 u6 w Qv R sin
n CG  
g v6  u R w P
cos sin Eq. 19

6 v P u Q cos cos
w
trajetrira deriva  deriva t0 Eq. 13

Os ngulos de Euler ( , , ) so
O heading da aeronave nesse sistema de
registrados diretamente pelo FDR, sendo o
coordenadas dado por:
valor do ngulo de guinada considerado
novo  deriva  t0 Eq. 14
como o valor da medio da bssola magntica
corrigida pelo valor da declinao magntica) e
as velocidades angulares so dadas pela
Os componentes da velocidade inercial nos equao 6. As componentes de velocidade no
eixos X (Norte) e Y (Leste) so: sistema de coordenadas do corpo podem ser
calculada pelos componentes das velocidades
V X V solo cos trajetria
novo
Eq. 15
inerciais atravs da utilizao da matriz de

68
cossenos diretores T InercialeCorpo (Direction sistema de coordenadas inercial utilizando a
Cosine Matrix, ou DCM): inversa da matriz de cossenos diretores:

    
u VX novo
VX
u
v T InercialeCorpo  V Y Eq. 20 V Y T CorpoeInercial  v

Eq. 25
novo

w dhdt h6 w

A DCM mostrada na equao 24. Note Passo 6 -As posies X e Y integradas so


que, como T InercialeCorpo ortogonal, sua calculadas utilizando 17 e 18 e as velocidades
inversa simplesmente sua transposta: integradas do passo 5. A derivada da altitude
dh dt integrada para obter o valor de
1 altitude h .
T Corpoe Inercial T Inercial eCorpo  T InercialeCorpo 
T

Eq. 21
As diferenas entre as posies integradas
Renomeando n CG calculado utilizando as  X , Y , h e as posies inerciais
equaes 19, 20 e 24 de nInercial e os valores  X novo , Y novo , hnovo  so uma medida do erro
dos fatores de carga corrigidos para a posio ainda existente nos acelermetros. Para
do CG de n Corrigido , uma estimativa inicial do calcular como os fatores de carga devem mudar
offset vem por meio da equao 12 como: para reduzir esse erro, o efeito da variao de
cada incremento no offset na diferena entre a
n Estimado
n Inercial
nCorrigido Eq. 22 posio calculada e real deve ser entendido.
Idealmente, o offset de um dos trs
acelermetros que compe o sensor triaxial
Como na prtica o offset dos acelermetros
deve ser associado com uma medida de erro
( n ) so aproximadamente constantes
nica que relativamente independente dos
durante o perodo de interesse, a mdia de
offsets dos outros acelermetros e que pode ser
n Estimado do resultado da equao 22 durante o
monitorada para determinar os efeitos da
perodo de clculo usada como a estimativa variao do incremento no offset. Tal erro de
de offset inicial.
medida para os offsets n x , n y , n z  esto
Passo 3 - Agora se inicia o processo ilustrados na figura 2.
iterativo. O n Corrigido atualizado com a mdia
n Estimado do passo 2 para obter os novos Para aeronaves de transporte comerciais que mantm
um pequeno ngulo arfagem ( ) e rolamento ( ), um
valores de fatores de carga:
erro em nx resulta em uma diferena entre a distncia
n novo 
nCorrigido 
n Estimado mdia
Eq. 23 horizontal percorrida integrada e a verdadeira conforme
ilustrado pelas curvas Iint e Iact na figura 2. Um erro em ny
resulta em uma diferena entre o ngulo de trajetria atual
Passo 4 - Os valores de nnovo e a equao
e integrados, no final do processo de integrao, esse erro
19 fornecem trs equaes diferencias no
aparecera como um erro de posio final
lineares para as variveis u , v , w  . Essas
(distancia a na figura 2). Um erro em nz vai
equaes so integradas numericamente resultar em uma diferena entre a altitude atual
utilizando os valores de u , v , w  dados pela e a integrada.
equao 20 como valores iniciais para a
integrao. Ierro, a diferena mdia no tempo entre Iint e
Iact, dada por:
Passo 5 - Os valores u , v , w  obtidos Eq. 26
atravs do passo 4 so transformados para o

 
coscos novo cos sin novo sin
T Inercial eCorpo sin sin cos novo cos sin novo sin sinsin novo cos cos novo sin cos
cos sin cos novo sin sin novo cos sin sin novo sin cos novo cos cos
Eq. 24

69
t
no offset, e o incremento, ento o novo ni :
I i nt I act 2 dt
I erro 
0
t ni novo
ni 
i
i
Eq. 34

dt
0 na prtica, o incremento de ni durante cada
onde iterao no deve ser maior que um
determinado valor (0.002g, por exemplo) sob


t t
dI i pena de o processo de minimizao no
I i t  dt  v i t dt Eq. 27
convergir.
0 dt 0
Se aps diversas iteraes o incremento em
v i t v x 2 v y 2 i i
Eq. 28
i ficar abaixo de um determinado valor, ento
o offset mais adequado foi encontrado e o
e o subscrito i refere-se aos dados integrados em um processo esta completo.
caso, e o dado real no outro.
Uma equao aproximada para a distancia a na figura 4 . RESULTADOS PRTICOS
2 que fornece a medida do erro em ny dada por: Os casos que envolvem investigaes de
acidentes areos correm, geralmente, em
ac b Eq. 29
segredo de justia. Essa condio inviabiliza a
onde apresentao dos resultados em casos reais de
atuao da percia criminal federal.
bI I atual Eq. 30
Entretanto, para mostrar a eficincia da
e c a distncia entre a posio final integrada e metologia, sero utilizados dados reais do
a posio atual: acidente com a aeronave Airbus A320 que
realizaria o voo US Airways 1549, ocorrido em
c X X novo 2  Y Y novo 2 Eq. 31
15 de janeiro de 2009, em Nova Jersey, Estados
Unidos1. Logo aps a decolagem a aeronave
Para que se possa utilizar a no
teve um incidente de bird strike causando
clculo do erro, feita uma media no tempo do
perda de potncia em ambos os motores,
valor a:
culminando com o pouso de emergncia no rio
t Hudson.
a dt As figuras 3 e 4 mostram a coerncia entre
a mdia  0 t Eq. 32
as posies inerciais da aeronave oriundos dos
dt dados de baixa frequncia e do resultado da
0 aplicao da metologia apresentada.
O erro mdio no tempo da altitude
t

hh 2 dt
h erro 0 t
Eq. 33

dt
0

Para usar essas medidas de erro para


determinar como o offset deve variar, a
sensibilidade de cada erro para com seu offset
deve ser calculado. Isso conseguido atravs
do incremento de cada offset
independentemente por um pequeno valor e
Figura 3: Grfico mostrando a convergncia entre as curvas de baixa
recalculando em seguida a posio e erros frequncia (vermelho) e integrao pelos acelermetros (eixo norte)
integrados. Se i o erro associado com ni, i
o incremento no erro devido ao incremento

70
Apesar de ser uma soluo mais efetiva para o problema
de erros de offset nos acelermetros a filtragem adaptativa
no linear extremamente mais complexa e na literatura
analisada no foram encontrados estudos dessa tcnica
aplicada a casos reais, onde a quantidade de parmetros
disponveis oriundos do FDR bem mais limitada, assim
como a frequncia de amostragem dos parmetros mais
baixa.
7 . CONCLUSO
Este artigo procurou expor e discutir alguns aspectos da
metodologia utilizada pelo NTSB para reconstruo da tra-
Figura 4: Grfico mostrando a convergncia entre as curvas de baixa jetria de voo a partir de parmetros de desempenho grava-
frequncia (vermelho) e integrao pelos acelermetros (eixo leste) dos pelo FDR de aeronaves sinistradas.
5 . ALTERNATIVA AO PROCESSO DE MINIMIZAO
UTILIZADO PELO NTSB A reconstruo da trajetria o primeiro passo na cons-
truo de uma simulao 3D que vise a apresentar a se-
A soluo apresentada pelo NTSB para a correo dos quencia de acontecimentos e, ao mesmo tempo, valorizar e
erros de offset dos acelermetros, apesar de efetiva, no facilitar ao destinatrio da investigao o entendimento das
muito elegante, pois envolve um processo iterativo de concluses do laudo pericial sobre as causas do sinistro ae-
minimizao do tipo tentativa e erro. ronutico.
Ao consultar a literatura cientfica sobre reconstruo de Apesar de comprovadamente efetiva, a metodologia
trajetria de voo a partir de parmetros de desempenho, utilizada pelo NTSB pode ser melhorada com a utilizao
fato que esse um problema considerado resolvido pela de solues mais modernas, como a utilizao de filtragem
literatura [6], [7], [8]. adaptativa no linear atravs de filtros de Kalman.
possvel encontrar diversas tcnicas mais sofisticadas Entretanto, necessrio levar em considerao as limita-
que utilizam filtragem adaptativa no linear, atravs do uso es que casos reais oferecem, como a quantidade de par-
filtros de Kalman do tipo estendidos, do tipo metros de desempenho e suas frequncias de amostragem.
dessensibilizados, do tipo sigma-point, dentre outros.
Apesar de ser uma soluo mais efetiva para o problema REFERNCIAS
de erros de offset nos acelermetros a filtragem adaptativa [1] National Transportation Safety Board, Office of Research and
Engineering, Group Chairmans Aircraft Performance Study, US
no linear extremamente mais complexa e na literatura Airways Flight 1549, Airbus A320-214, Hudson River, New
analisada no foram encontrados estudos dessa tcnica Jersey January 15, 2009, NTSB Accident Number
DCA09MA026, (Washington, DC: NTSB, December 10, 2009).
aplicada a casos reais, onde a quantidade de parmetros [2] National Transportation Safety Board, Office of Research and
disponveis oriundos do FDR bem mais limitada, assim Engineering, Group Chairmans Aircraft Performance Study,
American Airlines Flight 587, Airbus A300B4-605R, Belle
como a frequncia de amostragem dos parmetros mais Harbor, New York, November 12, 2001, NTSB Accident
baixa. Number DCA02MA001 (Washington, DC: NTSB, October 10,
6 . ALTERNATIVA AO PROCESSO DE MINIMIZAO 2002).
[3] Convention on International Civil Aviation, Annex 6, Operation
UTILIZADO PELO NTSB of Aircraft, Part I - International and Commercial Air Transport
(Aeroplanes), ICAO Standard, Ninth Edition, July 2010.
A soluo apresentada pelo NTSB para a correo dos
[4] Convention on International Civil Aviation, Annex 6, Operation
erros de offset dos acelermetros, apesar de efetiva, no of Aircraft, Part II - International General Aviation (Aeroplanes),
muito elegante, pois envolve um processo iterativo de ICAO Standard, Seventh Edition, July 2008.
minimizao do tipo tentativa e erro. [5] E. L. Duke, Antoniewicz R. F., Krambeer, K. D. Derivation and
Definition of a Linear Aircraft Model, NASA RP-1207 ,.August
1988.
Ao consultar a literatura cientfica sobre reconstruo de [6] Mulder, J. A., Chu, Q. P., Sridhar, J. K., Breeman, J., and Laban,
trajetria de voo a partir de parmetros de desempenho, M. (1999). Non-linear aircraft flight path reconstruction review
and new advances. Progress in Aerospace Sciences, 35:673726.
fato que esse um problema considerado resolvido [6], [7], [7] Ges, L.C.S., Hemerly, E.M., Maciel, B.C.O., Neto, W.R.,
[8]. Mendona, C. and Hoff, J. PARAMETER ESTIMATION AND
FLIGHT PATH RECONSTRUCTION USING OUTPUT-
possvel encontrar diversas tcnicas mais sofisticadas ERROR METHOD . Inverse Problems, Design and Optimiza-
tion Symposium, Rio de janeiro, Brazil, 2004.
que utilizam filtragem adaptativa no linear, atravs do uso [8] Teixeira B. O. S., Torres L. A. B., Iscold P., Aguirre L. A.,
filtros de Kalman do tipo estendidos, do tipo Flight path reconstruction A comparison of nonlinear Kalman
filter and smoother algorithms , Aerospace Science and
dessensibilizados, do tipo sigma-point, dentre outros. Technology ,2011.

71
FI2 - UMA PROPOSTA DE FERRAMENTA PARA
INVESTIGACAO FORENSE EM IMAGENS
Andre P.Henriques, Tauan de O. Naves, Gustavo C. Bicalho, Flavio de B. Vidal, Dbio L. Borges
Departamento de Ciencia da Computacao
Universidade de Braslia

RESUMO - Este trabalho trata-se do desenvolvimento necessaria para o aumento do tamanho dos
de um software de processamento de imagens para detalhes uteis; Falta de contraste; Diferentes
investigacao forense, destinado a peritos criminais de- tipos de rudos e perturbacoes; - Tremido
nominado FI2 (Ferramenta de Investigacao de Ima- causado por movimento e/ou falta de foco;
gens). A ferramenta foi desenvolvida utilizando como Distorcoes geometricas limitando, consequen-
base as bibliotecas OpenCV, para o processamento de temente, a reconstrucao das dimensoes dos
imagens, e QT, para a interface da aplicacao, com objetos dentro da imagem;
a linguagem C++. Por se tratar de uma aplicacao Com o intuito de superar essas adver-
voltada a investigacoes criminais, a ferramenta possui sidades o framework proposto pelo software
recursos durante a analise forense de uma imagem, de FI2 (Ferramenta de Investigacao de Imagens)
modo a robustecer sua validade em processos judiciais. disponibiliza diversas ferramentas a m de se
obter uma imagem com signicado relevante
para o usuario. Cada operacao realizada e
PALAVRAS CHAVE - Processamento de Imagens, registrada, certicada, alem fornecer um co-
Analise Forense de Imagens, FI2 nhecimento completo das ferramentas junto
ao algoritmo para obter plena objetividade e
garantir que o resultado possa ser reproduzido
1. Introducao por outra pessoa.
Para a apresentacao desta proposta de
Fotos e vdeos sao atualmente uma das princi- framework para analise forense de imagens,
pais fontes de informacoes para investigacoes. este artigo esta dividido nas seguintes secoes:
No entanto, nem sempre e possvel conseguir A Secao 2 apresenta uma breve introducao ao
imagens ou vdeos de boa qualidade, geral- tema de analise forense de imagens. Na Secao
mente devido a problemas de equipamento e 3 sao apresentadas as principais caractersticas
do ambiente. Com a tecnologia atual esses de proposta do FI2. E nalmente na Secao
fatores nao sao impedimentos para se conse- 4 sao apresentadas as conclusoes e propostas
guir boas imagens e vdeos, para se ter pro- futuras para esta proposta de ferramenta para
vas de identicacao validas, e assim tambem analise forense de imagens.
informacoes uteis para as investigacoes. Para
a utilizacao dessa tecnologia e necessario que
imagens e vdeos sejam digitalizados a m de 2. Analise de Imagens para ns
serem processados por um software dedicado a forenses
melhorar as caratersticas uteis para a analise
do material. Apesar da demanda de ferramentas voltadas
Caractersticas que podem afetar a quali- para aplicacoes, em que tenham o foco na
dade da imagem: Baixa resolucao de imagens, analise forense de imagens digitais, atualmente

72
poucas aplicacoes atendem de forma satisfa- 3. Ferramenta de Investigacao Fo-
toria as necessidades dos agentes de investi- rense - F I2
gacao brasileiros. Atualmente, existem varios
produtos que visam o processamento de ima- Nesta secao sao apresentadas as principais
gens e vdeos, mas poucos sao destinados a caractersticas da ferramenta proposta, bem
area forense, dos quais apenas alguns conse- como suas principais funcionalidades.
guem realizar os objetivos a que se propoem. A FI2 e uma ferramenta de processa-
Entretanto, a maioria desses programas tem mento de imagens especializada em investi-
uma solucao completa de hardware e software gacao forense. A ferramenta foi desenvolvida
tornando o seu custo elevado e ainda impossi- utilizando como base a biblioteca OpenCV [2]
bilitando em muitas vezes sua utilizacao fora e a biblioteca e ambiente de desenvolvimento
do ambiente laboratorial de percia. Qt[3] com a linguagem C++, mantendo a
portabilidade entre os sistemas operacionais
Linux, Windows e MacOS.
Todos essas aplicacoes possuem ferra- Por se tratar de uma aplicacao focada
mentas como ajuste de contraste e brilho, nas necessidades para autoridades investiga-
equalizacao de histograma e edicao, zoom, tivas periciais, o sistema proposto possui re-
espelhamento, rotacao das imagens que podem gistro das tecnicas e manipulacoes realizadas
ser encontradas na literatura basica de proces- nas imagens, incluindo datas, algoritmos e
samento de imagens [1]. Alguns deles oferecem parametros, de modo a conferir sua validade
ferramentas onde se pode personalizar ltros. em processos legais e judiciais. Esta estrategia
Quase todos armazenam um log de auditoria permite a reprodutibilidade dos resultados,
para cada caso realizado a m de torna-los por outros prossionais permitindo maior con-
apropriados para apresentacoes em audiencias. abilidade nos resultados alcancados durante
Apesar de oferecerem a capacidade de regis- a analise.
trar as operacoes realizadas junto com seus O framework de aplicacao do FI2 e des-
parametros, esses softwares nao dao acesso ao crito no diagrama UML (do ingles Unied
algoritmo aplicado, dicultando serem audita- Modeling Language) descrito na Figura 1.
dos. Para se alcancar este framework foram
utilizados como referencia tres principais nor-
Dentro desta linha, existe a necessidade teadores: desempenho, portabilidade e escala-
de que seja criado um framework que realize bilidade, que sao descritos a seguir.
todos estes procedimentos que as principais
ferramentas realizam, permitem sua auditoria A. Desempenho
caso necessario, evitem a dependencia entre
hardware e software, sendo ainda acessvel a O desempenho e um fator crtico pelo fato
todos os orgaos periciais nas esferas investiga- de que tecnicas de processamento de imagens
tivas. terem um custo computacional elevado. As-
sociado a isto, deseja-se resposta (latencia)
rapida, com o intuito de o operador obter
Em relacao ao aspecto de auditoria, al- um resultado o mais celere possvel para cada
ternativamente, este trabalho proposto visa alteracao de parametro de uma determinada
apenas a area de software, destinando-se ao manipulacao, facilitando, assim, a compara-
processamento de imagem com algoritmos e cao entre as diversas conguracoes possveis
tecnicas que sao reconhecidas na literatura de uma determinada tecnica. Para satisfazer
especializada ou descritas e detalhadas pela esse requisito, decidiu-se pelo projeto de uma
propria aplicacao, diferente de alguns daque- aplicacao nativa, utilizando-se a linguagem
les, provendo acesso ao codigo ou ao algoritmo C++, que e servida de compiladores nas mais
implementado. diversas plataformas.

73
Figura 1. Diagrama UML do framework do FI2.

B. Portabilidade tem os mais diversos requerimentos, tanto a


interface quanto as caractersticas internas do
A portabilidade e um aspecto importante programa.
tendo em vista o reaproveitamento de codi-
gos e a alcancabilidade da ferramenta. Para
obter a almejada portabilidade, estudou-se, Para isso, desenvolveu-se uma interface
dentre as possibilidades, ferramentas que pu- unica para o codigo de representacao graca de
dessem ser interoperadas indistintamente en- todas as ferramentas e outra interface (descri-
tre os tres principais sistemas operacionais: tos na Figura 2), tambem unica, para encap-
Windows, MacOS e Linux. Com isso, optou- sular o codigo de processamento de imagens
se pelas bibliotecas OpenCV, para o auxlio das ferramentas, exveis o suciente para
no processamento de imagens, e QT para o atenderem as demandas que as ferramentas
desenvolvimento da interface. que se deseje implementar requerem. Enm,
procurou-se desenvolver uma aplicacao que
C. Escalabilidade seja uma plataforma para que novas tecnicas
de processamento de imagens, em particular
A escalabilidade e importante pelo fato de na area forense, fossem facilmente implemen-
se desejar uma ferramenta que englobe as tadas. As Figuras 3, 4 e 5 descrevem exemplos
mais diferentes e recentes ferramentas volta- de algumas tecnicas de processamento de ima-
das a investigacao forense. Tais ferramentas gens implementadas.

74
Figura 2. Interface com o usuario da ferra- Figura 5. Ferramenta de correcao de histo-
menta. grama.

D. Tecnicas de Processamento de Ima-


gens implementadas

A tabela 1 a seguir explicitam os recursos que


foram implementados na primeira versao do
FI2.

E. Interface

A aplicacao foi desenvolvida de modo que


novas ferramentas fossem futuramente inclu-
das no software, possibilitando que se preserve
Figura 3. Ferramenta de correcao de perspec- um modelo de interface entre todas elas. Foi
tiva. utilizado o QtCreator [3] para a criacao da in-
terface. A interface foi feita com o objetivo de
facilitar ao maximo a interacao com o usuario.
Toda a interface pode ser personalizada
de acordo com a necessidade/comodidade do
usuario. As guras 7 e 6 descrevem a interface
para escolha de qual ferramenta sera utilizada
e o painel de selecao de funcoes, respectiva-
mente.

F. Registro das Atividades Realizadas -


Log

Uma funcionalidade utilizada nesta ferra-


menta e o Registro das atividades realizadas
nas imagens processadas. E de fundamental
Figura 4. Ferramenta de realce. importancia que todo o trabalho de avalia-
cao e analise das imagens seja documentado
para posterior relato dos resultados alcanca-

75
Tabela 1. Funcionalidades implementadas no FI2.
Ferramentas Funcoes
Basicas Cortar, Luminancia, Contraste, Conversao
em escala cinza e Girar/Rotacionar
Interpolacao Vizinhanca mais proxima, Bilinear, Bicu-
bica, Interpolacao Lanczos [4]
Operacao de Pontos Equalizacao de Histograma
Restauracao da Imagem Correcao de Perspectiva

Figura 6. Selecao de ferramentas - Toolbox.

dos, bem como permitir sua reprodutibilidade tigacao forense e suas ferramentas, em que
em caso de necessidade de auditoria e/ou revi- a principal motivacao e ausencia de aplica-
sao dos resultados apresentados. Alem dessas coes no mercado brasileiro desse padrao de
atribuicoes, o processo de Log tambem devera utilizacao. A criacao de uma interface com a
ser criptografado, de maneira tal que este tentativa de facilitar ao maximo a interacao
seja protegido contra alteracoes de terceiros, aplicacao/usuario permite fazer comparacoes
podendo invalidar todo o processo de analise entre varias imagens, aplicar varias ferramen-
das imagens. A Figura 8 mostra a interface de tas, localizar facilmente as ferramentas e a ge-
registro de Log da ferramenta FI2. racao de um log que permite a reproducao dos
procedimento aplicados, bem como a audito-
ria das atividades realizadas pela ferramenta.
4. Conclusoes e Trabalhos futuros Apesar da falta de algumas ferramentas, foi
observada a grande margem de aplicacoes que
Neste artigo e apresentado um framework para podem ser feitas com o software, principal-
processamento de imagens voltado para inves-

76
mente na area de investigacao forense, onde
foi possvel vericar algumas aplicacoes com
resultados relevantes.
Nosso objetivo principal com esta apli-
cacao e a melhoria das investigacoes forenses,
tanto em relacao ao tempo quanto em quali-
dade, permitindo ao perito reduzir o tempo
despendido e ao aperfeicoamento da quali-
dade do trabalho com imagens. Um software
que integre todas as ferramentas de analise
forense de imagens com logs que permitam
a reproducao dedigna de todas as tecnicas
empregadas durante o exame pericial, bem
como apresente uma interface pratica e agil
na aplicacao de suas ferramentas, possibilitara
ao perito criminal realizar suas analises com a
rapidez e reprodutibilidade necessarias a uma
investigacao tecnica criminal.
Dentre as propostas para trabalhos fu-
turos com este framework estao a incorpo-
racao de suporte a arquivos de vdeos para
processamento com as ferramentas existentes,
extracao de frames especcos para processa-
mento, reconhecimento facial em arquivo de
imagens (comparacao com retrato falado, ima-
Figura 7. Painel de Selecao de Ferramentas. gens diversas) e extracao automatica de faces
em vdeos (ex.: vdeos de seguranca). Novos
algoritmos que facilitem o trabalho pericial
devem ser estudados e incorporados a esta pla-
taforma com facilidade de uso que otimizem e
documentem todas as analises realizadas.

Referencias
[1] R. Gonzales, R; Woods, Digital Image Processing,
2nd ed., 2002.
[2] W. Garage. (2012, Maio). [Online]. Available:
http://opencv.willowgarage.com/wiki/Welcome
[3] Q. Nokia. (2012, maio). [Online]. Available:
http://qt.nokia.com/
[4] C. E. Duchon, Lanczos ltering in one and two dimen-
sions, Journal of Applied Meteorology, 1979.

Figura 8. Interface de Registro de atividades -


Log.

77
Exames de Reconhecimento Facial na
Polcia Federal
Gustavo H. M. de Arruda1 e Andr L. da C. Morisson2
1,2
Departamento de Polcia Federal
1
Superintendncia Regional de Pernambuco
Av. Cais do Apolo, 321, 50030-230, Recife, PE, Brasil
2
Instituto Nacional de Criminalstica
SPO lote 7, Ed. INC, 70.675-607, Braslia, DF, Brasil
{gustavo.ghma, morisson.alcm}@dpf.gov.br

RESUMO A metodologia usada pelos peritos criminais situaes, podem implicar na condenao de
federais nos exames de reconhecimento facial definida
pelo Instituto Nacional de Criminalstica, responsvel um inocente.
tambm por aes de capacitao, que contam com a
presena inclusive de peritos criminais estaduais e do
Por sua vez, a ausncia de mtodo cientfico
Distrito Federal. Neste artigo, procura-se verificar at que na comparao facial inaceitvel, do ponto de
ponto a doutrina do Instituto Nacional de Criminalstica vista pericial. Os mtodos holsticos, assim
segue as recomendaes e orientaes do FISWG (Facial
Identification Scientific Working Group), cuja misso
definidos, trazem consigo um elevado grau de
apresentar metodologias, recomendaes e manuais de subjetividade, que no compatvel com a
boas prticas, que sejam consenso na rea de identificao neutralidade que o exame pericial requer [5]
humana por meio de imagens..
[6].
1. INTRODUO Diante desse cenrio, um grupo cientfico,
O exame de reconhecimento facial, dentro organizado pelo Federal Bureau of
do escopo da percia criminal, trata da Investigation (FBI), tem trabalhado no
comparao de duas faces presentes em estabelecimento de padres, manuais e
registros visuais, ou de uma face em registro requisitos, dentre outros, voltados para o
visual e um indivduo conhecido, tendo por exame forense de reconhecimento facial. O
objetivo determinar se se trata da mesma grupo, denominado Facial Identification
pessoa. face conhecida d-se o nome de Scientific Working Group (FISWG), conta com
face padro, e a face no conhecida a participao de diversas agncias americanas
denominada face questionada. federais e estaduais, alm de universidades e
outras associaes (Universidade John
Apesar da ampla bibliografia sobre sistemas Hopkins, Laboratrio Lincoln do MIT, Polcia
biomtricos de reconhecimento facial, so raras Federal Australiana, Polcia Nacional
as publicaes que abordam aspectos Israelense, Instituto Forense da Holanda,
especficos do exame realizado por peritos dentre vrios outros).
criminais [1] [2] [3]. Tais exames so
realizados de forma no automatizada, por Neste artigo, procura-se estabelecer at que
meio de comparaes individuais (um para ponto a doutrina do Instituto Nacional de
um), e uma concluso acerca da identidade da Criminalstica (INC) da Polcia Federal segue
face questionada emitida ao final. as recomendaes e orientaes do FISWG, no
que diz respeito aos exames periciais de
Mesmo no estado da arte dos sistemas reconhecimento facial. Para tanto, um breve
biomtricos, ainda no h um mtodo resumo dos principais documentos publicados
automatizado de reconhecimento facial que pelo FISWG at o momento so apresentados
possa ser usado como prova pericial em um na seo 2. Em seguida, os principais aspectos
processo criminal [1]. Diferentemente de da doutrina empregada na Polcia Federal so
exames de DNA, a capacidade discriminatria indicados, correlacionando-os com as
dos mtodos automatizados ainda no recomendaes do FISWG. Por fim, uma
suficiente para evitar erros [4], que em tais

78
anlise qualitativa de laudos periciais de b) Morfolgicos: as caractersticas anatmicas
reconhecimento facial, recentemente das faces analisadas so identificadas e
elaborados, discutida, e as consideraes classificadas em relao sua capacidade
finais so apresentadas. discriminatria, e uma concluso emitida
com base em observaes subjetivas;
2. RECOMENDAES DO FISWG
c) Antropomtricos: exames realizados a
O conjunto de documentos elaborados pelo partir de medidas sobre pontos
FISWG trata de diversos aspectos relativos cefalomtricos nas faces comparadas, com a
rea de reconhecimento facial. Para este artigo, concluso emitida a partir de limiares
os seguintes documentos sero considerados: subjetivos para as diferenas observadas;
1) Facial Comparison Overview [7]; d) Por superposio: por meio da criao de
2) Guidelines and Recommendations for composies entre as faces questionada e
Facial Comparison Training to Competency padro, devidamente alinhadas, no intuito
[8]; de auxiliar a visualizao das caractersticas
observadas.
3) Guidelines for Facial Comparison Methods
[9]; Conforme disposto em [9], em relao
utilizao dos mtodos para fins forenses,
4) Recommendations for a Training Program recomenda-se que:
in Facial Comparison [10];
1) Mtodos holsticos sejam usados somente
5) Capture and Equipment Assessment for quando houver restrio de tempo, no
Facial Recognition Systems [11]. sendo recomendado para realizao de
2.1. CONSIDERAES INICIAIS exames periciais;
Os documentos do FISWG diferenciam o 2) Mtodos morfolgicos so considerados os
exame de reconhecimento facial (facial mtodos principais para realizao de
examination) do processo de anlise facial exames de comparao facial;
(facial review). Ambos so procedimentos de
3) Mtodos antropomtricos no devem ser
comparao de faces (facial comparison),
empregados em exames forenses, tanto de
porm o exame de reconhecimento facial
forma individual quanto conjunta a outros
realizado por profissionais especializados,
mtodos, devido incerteza provocada por
usando mtodos e procedimentos rigorosos.
condies no controladas, como ngulo de
Neste artigo, ser adotada a nomenclatura captura, iluminao, etc.;
exame de reconhecimento facial para indicar
4) Mtodos por superposio podem ser
o exame realizado por peritos criminais, que
utilizados apenas em conjunto com os
tem por objetivo comparar duas faces, no
mtodos morfolgicos.
intuito de determinar se pertencem ou no a um
mesmo indivduo, mesmo considerando no 2.3. CAPACITAO
ser esta a nomenclatura mais adequada. A capacitao de pessoal tambm abordada
2.2. MTODOS nos documentos emitidos pelo FISWG, que
estabelece critrios e competncias necessrias
Segundo [9], os mtodos de reconhecimento
para o treinamento na rea de reconhecimento
facial foram classificados em quatro tipos
facial. Em [10], so especificadas as diversas
distintos:
categorias de treinamento (nvel introdutrio,
a) Holsticos: so mtodos baseados na conhecimento de processos e relaes,
habilidade natural humana de classificar e preparao e apresentao em juzo, etc.), bem
reconhecer rostos, levando-se em conta como os nveis de avaliao (conhecimento,
todas as caractersticas visualizadas de competncia, proficincia e certificao). Tais
maneira simultnea; especificaes so ento estabelecidas para a
funo desempenhada (gerncia, superviso,
examinador, etc.). No presente caso, identifica-

79
se o cargo de perito criminal como tendo a procedimentos de captura de imagens em
funo facial image examiner, o qual exige sistemas biomtricos [11], as especificaes
proficincia em todas as categorias, exceo tambm trazem implicaes na realizao dos
de instrutor. exames periciais.
Como disposto em [8], de maneira resumida, Primeiramente, porque estabelecem
as seguintes competncias so desejadas para especificaes e parmetros para a coleta de
peritos criminais: imagens que podem ser usadas em documentos
de identificao. Assim, possvel estabelecer,
a) Conhecer a evoluo histrica do exame
eventualmente, se um determinado material
pericial de reconhecimento facial;
questionado, oriundo de uma foto de
b) Compreender os princpios que regem a documento, possui os requisitos mnimos
individualidade e a permanncia, as necessrios consecuo do exame.
diferenas entre classe e indivduo, bem
Alm disso, as especificaes tambm so
como as diferenas entre caractersticas
aplicveis nas situaes em que necessrio
estveis e transitrias;
registrar as imagens da face padro,
c) Conhecimento amplo de princpios bsicos interagindo diretamente com o indivduo que
de comparao facial, tais como avaliao ter sua face comparada face questionada.
da qualidade da face em uma imagem,
processo ACE-V1, mtodos de comparao, Esse ltimo aspecto constitui um importante
passo em exames periciais, usualmente
dentre outros;
denotado coleta de material padro, aplicvel
d) Conhecimento profundo acerca dos sistemas em vrias reas de percia, como fontica
biomtricos automatizados, sua operao e forense, balstica, documentoscopia, dentre
limitaes, e aspectos gerais de algoritmos outras. Em geral, o xito de um exame pericial,
biomtricos; em que a coleta de padro necessria, est
e) Compreenso dos princpios que regem a fortemente ligado qualidade do material
representao por imagens, em processos padro obtido.
fotogrficos; Dessa forma, fica clara a importncia de se
Por sua vez, os cursos de capacitao na rea ter especificaes de equipamentos e
devem incluir os seguintes assuntos, quando procedimentos relacionados captura de
voltados para a percia criminal: imagens para comparao facial.
a) Metodologia para obter concluses a partir 3. EXAMES NA POLCIA FEDERAL
de comparaes faciais;
Na Polcia Federal, a competncia para
b) Limitaes na representao da face por realizao dos exames de reconhecimento
imagens, como distores de perspectiva; facial dos peritos criminais federais, por se
c) Questes legais aplicveis ao caso, como tratar de percia oficial de natureza criminal
preparao e apresentao do material, e [12].
conhecimento de casos judiciais relevantes; Por questes histricas, alm da afinidade
Alm disso, deve-se demonstrar proficincia com a rea de Processamento Digital de
por meio de avaliao, e o curso deve ser Imagens e da realizao frequente de exames
especificamente voltado para a realizao de em material audiovisual, os exames de
exames de comparao facial. reconhecimento facial tm sido
majoritariamente realizados por peritos com
2.4. EQUIPAMENTOS E PROCEDIMENTOS formao em Engenharia Eltrica/Eletrnica.
Embora haja um conjunto de recomendaes No entanto, no h restries quanto
voltadas especificamente para equipamentos e formao acadmica para realizao de tais
exames.
1
Do ingls, Analysis, Comparison, Evaluation and
Verification

80
Na Polcia Federal do Brasil, o Servio de Compreender o processo de degradao de
Percias em Audiovisual e Eletrnicos uma imagem por rudo e por meio da PSF
(SEPAEL) do INC tem a atribuio de propor (Point Spread Function), bem como
normatizaes e aes de capacitao na rea. tcnicas de melhoria e tratamento;
At a data de elaborao deste artigo, foram
ministrados trs cursos de Reconhecimento 3.1.2. ANATOMIA FACIAL FORENSE
Facial (2009, 2010 e 2012), com pblico alvo O mdulo de AFF est voltado para a anlise
composto por peritos criminais federais, detalhada da anatomia da face, as principais
estaduais e do Distrito Federal. nomenclaturas e a metodologia de descrio
3.1. ESTRUTURA DO CURSO das estruturas da face. Ao final deste mdulo,
as seguintes competncias e habilidades so
O curso de capacitao em Reconhecimento
esperadas:
Facial est voltado para profissionais que
realizam exames periciais de natureza criminal. Conhecer e identificar as diversas estruturas
Tais exames envolvem a comparao de envolvidas na descrio e anlise da face:
imagens de faces ou indivduos desconhecidos estrutura bsica da cabea; classificaes
com um indivduo conhecido, ou com imagens antropolgicas da face; osteologia bsica
de sua face. associada ao estudo da cabea; e
O curso tem carga horria de 80h e, em Compreender os aspectos e consequncias
geral, realizado em turmas com 20 do envelhecimento na face e suas estruturas
participantes. (boca, orelha, sulcos, linhas de expresso,
A estrutura do curso est dividida em trs etc.);
mdulos distintos: Processamento Digital de 3.1.3. EXAME DE RECONHECIMENTO FACIAL
Imagens (PDI); Anatomia Facial Forense
(AFF); e Exame de Reconhecimento Facial O mdulo de ERF responsvel por agrupar
(ERF). O detalhamento dos mdulos as ferramentas e mtodos apresentados nos
apresentado a seguir. mdulos de PDI e AFF, de maneira
sistemtica, inserindo-os na metodologia do
3.1.1. PROCESSAMENTO DIGITAL DE IMAGENS exame a ser realizado pelo perito criminal.
O mdulo de PDI tem como objetivo particularmente neste mdulo que a doutrina
principal desenvolver habilidades com o estabelecida, a partir da definio da
tratamento de imagens estticas digitais. metodologia do exame, sendo discutidos ainda
Espera-se que, ao final do mdulo, o perito outros aspectos importantes relacionados.
criminal possua as seguintes competncias e Atualmente, a doutrina baseada em mtodo
habilidades: morfolgico, sugerindo tambm, sempre que o
material assim o permitir, uma anlise
Conhecer os fundamentos matemticos da
complementar por superposio. Embora a
representao de imagens numricas;
anlise por cefalometria seja apresentada no
Compreender os conceitos relativos mdulo de AFF, a utilizao dos ndices
Transformada de Fourier Espacial aplicada cefalomtricos como ferramenta auxiliar foi
em imagens digitais; descartada no caderno didtico mais recente
[13].
Aplicar filtros no domnio espacial e
frequencial em imagens digitais, No mtodo morfolgico recomendado, a
compreendendo os efeitos de filtros passa- face dividida em oito regies, conforme
baixas, passa-altas, passa-faixa, notch, e mostrado na Figura 1. Em cada regio, so
outros; apontadas as caractersticas principais a serem
observadas, alm de outras julgadas relevantes
Compreender e aplicar tcnicas de
pelo perito criminal.
ampliao de contraste, equalizao de
histograma, filtragem homomrfica, dentre Em seguida, as caractersticas anotadas so
outras; e classificadas como atributos de semelhana ou

81
divergncia, sendo atribudo um dos seguintes Realizao de procedimentos preparatrios
graus: semelhante em detalhes, semelhante, para o exame, como digitalizao de
sem comparao, diferente, diferente em registros analgicos, correo de
detalhes. As caractersticas so ainda alinhamento e escala e ajustes de
classificadas em relao sua capacidade contraste/brilho.
discriminatria, podendo ser: forte, moderada
Em relao anlise de viabilidade do
ou fraca, conforme anlise subjetiva do perito
exame, importante destacar que havia uma
criminal.
recomendao de no se realizar o exame
quando uma das faces (padro ou questionada)
apresentasse uma distncia entre os centros dos
olhos inferior a 40 pixels. Tal recomendao
teria se originado nos valores mnimos
possveis para algoritmos biomtricos, que se
encontram na faixa de 40 a 60 pixels de
distncia entre os centros dos olhos [11].
No entanto, esta recomendao no se
mostrou apropriada, uma vez que mesmo
imagens com melhor resoluo apresentavam
outros fatores de degradao que impediam a
realizao do exame, tais como foco, distoro
de lente, artefatos JPEG, dentre outros. Alm
disso, grande parte da casustica voltada para
anlise de fotografias impressas em
documentos e fichas criminais, de modo que a
recomendao no seria aplicvel.
No caderno didtico mais recente, a anlise
de viabilidade realizada de forma mais
Figura 1 Diviso da face em regies: 1. frontal; 2. nasal; 3. labial; 4. abrangente, abordando aspectos como
mentoniana; 5. orbital; 6. zigomaxilar; 7. bucomandibular; e 8.
auricular.
definio da face questionada, ocluso ou
obstruo parcial da face e impacto dos fatores
A metodologia baseada em superposio de de degradao na qualidade do exame.
imagens tambm apresentada, porm de
forma complementar ao exame. Sua utilizao 4. ADEQUAO S RECOMENDAES DO
recomendada apenas para ilustrar eventuais FISWG
convergncias ou divergncias importantes, Diante do que foi observado nas sees 2 e
sendo a concluso emitida com base nos 3, passa-se a discutir as adequaes da doutrina
resultados do mtodo morfolgico. estabelecida na Percia Criminal da Polcia
Alm da definio da metodologia, outros Federal, face s recomendaes do FISWG.
aspectos tambm so abordados neste mdulo, Inicialmente, verifica-se que o principal
tais como: aspecto relativo aos exames de reconhecimento
Verificao da viabilidade do exame, por facial o mtodo a ser empregado. Desde as
meio das caractersticas do material primeiras edies, o procedimento envolvia a
questionado; anlise da morfologia da face, o clculo de
ndices cefalomtricos e a sobreposio de
Equipamentos e metodologia para coleta de imagens, quando as condies de alinhamento
imagens para comparao, incluindo permitiam. O resultado seria conclusivo se
sugesto de ambiente adequado e ajustes no fossem identificados aspectos morfolgicos
equipamento; e suficientemente discriminatrios nas faces
analisadas.

82
A sobreposio de imagens e o clculo de Inicialmente, foram anotadas as quantidades
ndices cefalomtricos eram considerados de laudos classificados como relativos aos
exames complementares, que tambm exames de reconhecimento facial, que no
embasavam a concluso do laudo pericial. SisCrim podem ser:
Essas eram recomendaes contidas nas duas
a) Exame de Reconhecimento Facial (44);
primeiras edies do curso, e logo surgiram
indagaes dos prprios peritos criminais b) Exame de Reconhecimento de Indivduo por
acerca da confiabilidade do mtodo ou de sua Imagens (102);
capacidade discriminatria. c) Exame Biomtrico: Reconhecimento Facial
Estudos recentes acabaram por mostrar que a (1);
anlise por ndices cefalomtricos em imagens Constatou-se que, entre janeiro/2011 e
(ou foto-antropometria) no confivel, junho/2012 foram emitidos 147 laudos
mesmo em situaes ideais [2] [3]. Assim, o periciais relativos ao exame de reconhecimento
clculo de ndices cefalomtricos no mais facial.
recomendado em [13], e tal orientao est em
processo de divulgao entre os peritos Em seguida, em uma anlise mais
criminais das primeiras turmas. aprofundada, uma amostra desses laudos
periciais foi analisada, com vistas a responder
Em relao capacitao e treinamento dos s seguintes questes:
peritos criminais federais, ainda no h uma
previso de incluso da matria no Curso de a) A metodologia baseada em um mtodo
Formao Profissional, haja vista se tratar de morfolgico?
percia geralmente associada rea de exames b) H a utilizao de mtodo baseado no
em material audiovisual. No entanto, a clculo de ndices cefalomtricos?
Academia Nacional de Polcia (ANP), o INC e
o SEPAEL tm envidado esforos para garantir c) Qual o tipo de material questionado
uma periodicidade anual do Curso de analisado?
Reconhecimento Facial, sempre destinando d) Houve coleta de material padro?
vagas para peritos criminais dos estados e
e) O resultado conclusivo3 ou
Distrito Federal.
parcialmente conclusivo4?
A estrutura do curso atende, de um modo
f) Foi realizada anlise de adequabilidade
geral, s recomendaes elencadas nos
do material questionado?
documentos emitidos pelo FISWG (vide seo
2). g) Foram empregados mtodos de
comparao por superposio?
5. LAUDOS PERICIAIS
h) O exame tem resultado conclusivo?
A fim de verificar aspectos pontuais da
Foi analisada uma amostra de 38 laudos
metodologia empregada pelos peritos criminais
periciais, sendo preenchida uma planilha
federais, foram coletados dados de laudos
contendo as respostas s questes elencadas. A
periciais elaborados entre 2011 e 2012,
partir do cruzamento dos dados obtidos, os
cadastrados como no-sigilosos no Sistema
seguintes resultados foram observados:
Nacional de Criminalstica2 (SisCrim).

3
Entende-se por resultado conclusivo quando possvel
2
O Sistema Nacional de Criminalstica um sistema de apontar com elevado grau de certeza ou excluir a
informao utilizado pela Percia Criminal Federal identidade da face questionada, quando comparada
para a gesto da Criminalstica, e possui em sua base face padro.
4
de dados todos os laudos periciais produzidos no O resultado parcialmente conclusivo quando
DPF desde 2006, sendo acessveis aos peritos possvel excluir a face questionada comparada com
criminais federais, desde que classificados como no vrios padres, exceto para pelo menos uma face
sigilosos. padro, onde o resultado inconclusivo.

83
a) Exames realizados em imagens de CFTV branca ou impresso de baixa qualidade, ou
foram conclusivos em apenas 3 de 26 laudos ainda coleta inadequada de padro por
examinados (11,5%); policiais no habilitados. Tais problemas so
normalmente sanados por meio de novas
b) Quando o exame realizado em fotografias
solicitaes, para que o material adequado seja
de documentos (padro 3 x 4cm), dos 6
encaminhado, ou para que seja realizada nova
laudos analisados, todos foram conclusivos
coleta. Por sua vez, os fatores externos esto
(100%);
associados a aspectos da qualidade da
c) Nos demais casos, que envolvem fotografias fotografia para documentos ou fichas
e filmagens diversas, de 6 laudos avaliados, criminais, tais como posicionamento da face,
3 apresentaram resultados conclusivos ocluso das orelhas e expresso facial, que
(50%); fogem ao controle da percia criminal.
d) Em apenas 4 dos 38 laudos examinados foi
realizada a coleta de padro de suspeitos
(10,5%); Destes, apenas 1 apresentou
resultado conclusivo;
e) O uso de ndices cefalomtricos em
conjunto com os exames morfolgicos foi
observado em 7 laudos, dos quais 6
apresentaram resultados conclusivos
(85,7%), quando combinados ao exame
morfolgico;
f) A maioria dos laudos em fotografia 3x4cm
tambm levou em conta a anlise por
ndices cefalomtricos (4 laudos,
representando 66,7%);
Uma importante constatao a clara
necessidade de se orientar os diversos rgos
pblicos sobre a importncia do projeto de
sistemas de CFTV adequados. Na maioria das
vezes, as imagens dos indivduos investigados
apresentam pssima qualidade, mesmo para
uso de sistemas biomtricos, que normalmente
requerem de 40 a 60 pixels de distncia entre
os centros dos olhos. Outros fatores tambm
contribuem para a baixa qualidade das
imagens, tais como posicionamento da cmera,
iluminao, distoro de lente, dentre outros.
Exemplos tpicos so mostrados na Figura 2.
Quando a anlise realizada em fotografias
de documentos, aumentam significativamente Figura 2 Exemplos tpicos de imagens de suspeitos capturadas por
as chances de resultados conclusivos, uma vez sistemas de CFTV, e encaminhadas para realizao de exame de
reconhecimento facial.
que se tem melhor acesso s estruturas
anatmicas da face. Porm ainda h alguns Mesmo assim, importante divulgar entre as
fatores internos e externos que inviabilizam a unidades que fazem o registro fotogrfico da
realizao do exame. Os principais fatores identificao criminal, institutos de
internos esto relacionados ao identificao e demais rgos, material
encaminhamento de material padro ou didtico informando da necessidade de pessoal
questionado na forma de fotocpia preto-e- treinado para realizar o procedimento, alm de

84
estabelecer critrios, condies e mtodos [4] Anil K. Jain, Arun Ross, and Salil Prabhakar, "An
Introduction to Biometric Recognition," IEEE
adequados para o registro fotogrfico da face. Transactions on Circuits and Systems for Video
Em um cenrio ideal, a fotografia seria Technology, vol. 14, no. 1, pp. 4-20, Jan 2004.
realizada por equipamento dedicado, com [5] BRASIL, Recurso Extraordinrio 363.889/DF. Ministro
controle de iluminao, foco e enquadramento, Dias Toffoli, voto do Ministro Luiz Fux, junho 02, 2011.
dotado ainda de algoritmo de anlise [6] USA, Daubert v. Merrell Dow Pharmaceuticals. United
States Supreme Court., 1993.
qualitativa da fotografia obtida e formato
[7] FISWG. (2010, June) Facial Identification Scientific
adequado, como o JPEG 2000. Working Group. [Online].
http://www.fiswg.org/FISWG_Facial_Comparison_Overv
Tambm se mostra necessrio realizar aes iew_v1.0_2010.04.29.pdf
de divulgao entre os peritos criminais [8] FISWG. (2010, Nov.) Facial Identification Scientific
federais acerca dos riscos em se incluir a Working Group. [Online].
anlise por ndices cefalomtricos. http://www.fiswg.org/FISWG_Training_Guidelines_Reco
mmendations_v1.1_2010_11_18.pdf
6. CONCLUSO [9] FISWG. (2012, Feb.) Facial Identification Scientific
Working Group. [Online].
Os exames de comparao de faces http://www.fiswg.org/FISWG_GuidelinesforFacialCompa
risonMethods_v1.0_2012_02_02.pdf
realizados na Polcia Federal esto de acordo
[10] FISWG. (2012, Feb.) Facial Identification Scientific
com os padres recomendados pelo Facial Working Group. [Online].
Identification Scientific Working Group, que http://www.fiswg.org/FISWG_RecommendationsForTrai
estabelece, dentre outros, recomendaes e ningProgram_v1.0_2012_02_02.pdf
boas prticas internacionais para realizao de [11] FISWG. (2011, Apr.) Facial Identification Scientific
Working Group. [Online].
exames periciais na rea. http://www.fiswg.org/FISWG_CaptureAndEquipmentAss
essmentForFRSystems_v1.0_2011_05_05.pdf
A anlise de laudos periciais de
[12] BRASIL, Lei 12.030, de 17 de setembro de 2009.
reconhecimento facial realizados por peritos
[13] Carlos E. P. Machado, Eduardo M. Lacerda Filho,
criminais federais mostrou que praticamente Gustavo H. M. de Arruda, and Paulo M. G. I. Reis,
todos os casos com imagens oriundas de CFTV Reconhecimento Facial, 2012.
no resultaram em exames conclusivos. Por [14] W. Zhao, R. Chellappa, P. J. Phillips, and A. Rosenfeld,
outro lado, os exames realizados em "Face Recognition: A Literature Survey," ACM
Computing Surveys, vol. 35, no. 4, pp. 399-458, 2003.
fotografias de documentos ou fichas criminais
[15] A. S. Tolba, A.H. El-Baz, and A.A. El-Harby, "Face
apresentam elevada probabilidade de resultado Recognition: A Literature Review," vol. 2, no. 2, pp. 88-
conclusivo. No entanto, ainda se constata a 103, 2006.
necessidade de padronizar procedimentos e [16] M. Evison et al., "Key parameters of face shape variation
realizar treinamentos para os profissionais in 3D in a large sample," Jounal of Forensic Science, vol.
55, no. 1, pp. 159-162, 2010.
responsveis pelo registro fotogrfico de
indivduos, ou empregar equipamentos
dedicados a esse fim, com algoritmo de
controle de qualidade das fotografias obtidas.

REFERNCIAS
[1] Tauseef Ali, Raymond Veldhuis, and Luuk Spreeuwers,
"Forensic Face Recognition: A Survey," Centre for
Telematics and Information Technology (CTIT),
University of Twente, Enschede, The Netherlands,
Internal Report TR-CTIT-10-40 2010.
[2] Krista F. Kleinberg, Peter Vanezis, and A. Mike Burton,
"Failure of Anthropometry as a Facial Identication
Technique Using High-Quality Photographs," Journal of
Forensic Science, vol. 52, no. 4, pp. 779-783, 2007.
[3] R. Moreton and J. Morley, "Investigation into the use of
photoanthropometry in facial image comparison.,"
Forensic Science International, vol. 212, no. 1, pp. 231-
237, 2011.

85
Estimativa de Altura de Indivduos em Imagens
de Perspectiva Cnica com Distores Esfricas
(Caso Prtico)
Luiz Vincius Gontijo Laborda Larrain
Gerncia de Percias em udio e Vdeo, Percia Oficial e Identificao Tcnica do estado de Mato Grosso (POLITEC)
Av. Gonalo Antunes de Barros, 3245, Bairro Novo Mato Grosso, Cuiab ,Mato Grosso,Brasil
OXL]ODUUDLQ#VHJXUDQFDPWJRYEU

5(68022HPSUHJRGHWpFQLFDVGHIRWRJUDPHWULDSRVVXL DOPRIDGD SURYRFDQGR D FXUYDWXUD das retas


DSOLFDomR HP GLYHUVRV FDVRV GH LQWHUHVVH IRUHQVH
$SUHVHQWDVH QHVWH DUWLJR XP FDVR SUiWLFR HP TXH p
presentes na imagem. Na prtica a
XWLOL]DGR XP DOJRULWPR LQWHUDWLYR SDUD D FRUUHomR GDV identificao de duas referncias verticais
GLVWRUo}HV HVIpULFDV H p HVWLPDGD QD VHTXrQFLD D DOWXUD GH conhecidas na imagem, a fim de ser explorada
XP LQGLYtGXR FRQKHFHQGRVH UHIHUrQFLDV YHUWLFDLV QD
LPDJHP 8WLOL]DVH SDUD LVWR D FRQVHUYDomR GD UD]mR
a conservao da razo cruzada sob a
FUX]DGD HQWUH RV REMHWRV QD SHUVSHFWLYD F{QLFD perspectiva cnica, tambm se torna um
HPSUHJDQGR VH QHFHVViULR FRPR SRQWR GH UHIHUrQFLD desafio.
DX[LOLDU R SRQWR GH IXJD YHUWLFDO (VWD WpFQLFD GHPRQVWUD
VHU XPD DOWHUQDWLYD SRVVtYHO GLDQWH GH LPSRVVLELOLGDGH GH No caso de s se ter disponvel apenas uma
VXSHUSRVLo}HVGHJDEDULWRVPpWULFRV
referncia vertical uma alternativa utilizar
1. INTRODUO como ponto de referncia auxiliar o ponto de
fuga vertical do objeto em anlise e da
Em diversas situaes de interesse forense a referncia utilizada.
imagem analisada no s de forma
qualitativa, mas tambm quantitativa, Este artigo apresentar um caso prtico da
empregando-se tcnicas fotogramtricas para criminalstica do estado de Mato Grosso em
extrair informaes de medidas e distncias que fora estimada a altura de um indivduo em
relativas entre diferentes objetos que compem imagens contendo distores esfricas atravs
a cena. da conservao da razo cruzada entre os
objetos na perspectiva cnica.
Para os registros que no oferecem
condies para identificao dos indivduos 2. CORREO DE DISTORES
atravs dos exames de reconhecimento facial, ESFRICAS
seja por limitaes qualitativas destes ou As distores esfricas so aberraes
mesmo pela ocluso da face, a estimativa da pticas frequentemente encontradas nas
altura dos indivduos pode ter relevncia imagens oriundas de sistemas de CFTV
significativa reduzindo possivelmente o (Circuito Fechado de Televiso). Explica-se
universo dos suspeitos. esta ocorrncia devido utilizao de lentes
Em imagens sob a perspectiva cnica, nos com ngulos acentuados, comumente
casos em que o sistema de captura encontra-se empregadas nos conjuntos pticos destes
indisponvel para a equipe forense, equipamentos de captura. A utilizao dos
impossibilitando assim a utilizao de conjuntos pticos desta natureza visa
gabaritos mtricos, pode-se utilizar a proporcionar maior rea de cobertura das
conservao da razo cruzada entre as medidas imagens, caracterstica geralmente desejada
de dois outros objetos conhecidos na imagem nestes sistemas de monitoramento e segurana.
para estimar uma medida questionada. Para viabilizar a realizao de medies
Dentre as dificuldades para este tipo de atravs do emprego das tcnicas
medio encontra-se a presena de distores fotogramtricas, as distores esfricas
geomtricas, principalmente GRWLSREDUULORX presentes nas imagens devem ser amenizadas.

86
Pode-se constatar na imagem questionada,
exibida na figura 1, a presena da distoro do
WLSR EDUULO evidenciada atravs da curvatura
aparente presente na coluna da edificao
(indicada pela seta vermelha) localizada na
regio esquerda da imagem.

FIGURA 2 INTERFACE DO PLUGIN


LENS_UNDISTORTIONSMT

Dentre as vantagens para a utilizao deste


plugin, destaca-se alm da sua disponibilidade
gratuita, tal como o software ImageJ, a sua
interatividade. Aps escolher um referencial
para o ajuste na imagem questionada, pode-se
FIGURA 1 DISTORO DO TIPO %$55,/ NA IMAGEM
QUESTIONADA.
facilmente, atravs de uma anlise perceptiva,
amenizar a distoro esfrica presente na
2.1. MODELO DE CONRADY-BROWN
imagem ajustando os parmetros K1 e K2. O
As distores esfricas podem ser plugin tambm permite a visualizao
reproduzidas segundo o modelo clssico de instantnea do resultado obtido aps aplicao
distores de lentes, desenvolvido por Conrady dos parmetros.
[1] e Brown [2], [3]. A expresso do modelo
de Brown [4] : Segue na figura 3 o resultado da imagem
corrigida. Evidencia-se atravs da reta na cor
xu = xd + (xd - xc)(K1r 2 + K2r 4 + ...) + (P1(r 2 + vermelha a correo tomando como referncia
2(xd xc)2) + 2P2(xd xc)(yd yc))(1 + P3r 2+...) a coluna da edificao localizada a esquerda da
imagem.
yu = yd + (yd - yc)(K1r 2 + K2r 4 + ...) + (P2(r 2 +
2(yd yc)2) + 2P1(xd xc)(yd yc))(1 + P3r 2+...)
Os parmetros Kn referem-se s distores
radiais enquanto os parmetros Pn s distores
tangenciais [4].
Na prtica a representao das distores do
tipo EDUULO RX DOPRIDGD SRGH VHU
satisfatoriamente modelada considerando
apenas as distores radiais (K1 e K2).
2.2. APLICAO DO ALGORITMO PARA A CORREO DAS
DISTORES ESFRICAS
FIGURA 3 IMAGEM COM AS DISTORES ESFRICAS
Para a correo da distoro GRWLSREDUULO AMENIZADAS.
presente na imagem questionada foi utilizado o
3. FOTOGRAMETRIA
plugin Lens_unDistortionSMT [5], exibido na
figura 2, que implementa a verso simplificada A seguir sero descritos passo-a-passo a
do modelo de Brown (considerando apenas as aplicao de tcnicas fotogramtricas com o
distores radiais). Este plugin fora intuito de estimar a altura do indivduo
desenvolvido para execuo no software de questionado nas imagens em anlise.
anlise e processamento de imagens ImageJ
[6].

87
O contedo contido no item 3.1 fora extrado
e adaptado da apostila de Fundamentos de
Processamento Digital de Imagens, do Instituto
Nacional de Criminalstica [7].

3.1. PERSPECTIVA CNICA E A RAZO


CRUZADA
Ao visualizar uma fotografia, imagem
dotada de apenas duas dimenses, o crebro
humano tem a capacidade de interpretar de
forma consistente as relaes de distncias dos
objetos em trs dimenses, tal como a cena real
capturada. FIGURA 4 DIAGRAMA EM PERSPECTIVA CNICA
As linhas retas paralelas na cena real so Observa-se na figura 4, a presena de um
convertidas, no plano imagem, em linhas retas objeto de dimenso desconhecida (LO) e dois
que convergem em pontos denominados HOHPHQWRV GH UHIHUrQFLD GHQRPLQDGRV 5 H
SRQWRVGHIXJD(VVDpXPDFDUDFWHUtVWLFDGD 5 WRGRV ORFDOL]DGRV QD SRVLomR YHUWLFDO
perspectiva linear cnica, que de fato a sobre o solo. Supondo que as dimenses das
perspectiva de projeo do plano real no plano referncias sejam conhecidas, LR1 e LR2,
imagem. possvel obter a dimenso do objeto (LO)
Na perspectiva cnica, dois ou mais pontos utilizando-se a conservao da razo cruzada.
de fuga determinam XPD OLQKD GH IXJD RX A partir da base de cada uma das referncias,
seja, uma linha reta que corresponde ao 5 H 5 p WUDoDGD XPD UHWD TXH SDVVD
encontro de infinitos planos paralelos. tambm pela base do objeto, identificado pelo
ponto $ GHWHUPLQDQGR DVVLP VREUH D OLQKD
fato conhecido da geometria projetiva que, GH IXJD RV SRQWRV 3 H 3
em uma imagem sob perspectiva cnica, respectivamente.
preserva-se o que denominamos de razo
cruzada. A partir de P3 e P4 so traadas retas
que passam pelo topo de cada uma das
A razo cruzada pode ento ser utilizada referncias, determinando sobre o objeto os
nessas situaes como uma forma se medir a SRQWRV % H & UHVSHFWLYDPHQWH &RPR DV
dimenso de objetos em uma imagem a partir retas que convergem para o mesmo ponto na
da informao conhecida da dimenso de linha de fuga horizontal so paralelas ao plano
outros objetos tambm contidos na mesma horizontal, os segmentos de reta AB e AC
imagem. correspondem segmentos obtidos pela
3.1.1. ESTIMATIVA DE ALTURA QUESTIONADA A PARTIR DE projeo de pontos com dimenses iguais s de
DUAS REFERNCIAS VERTICAIS R1 e R2, se marcados sobre o objeto a
partir do solo.
Apresenta-se na figura 4 um diagrama
traado em perspectiva cnica. Nessa Dessa forma pode-se determinar o
ilustrao, observa-se a existncia dos pontos comprimento real do objeto, a partir da
de fuga P1 e P2, formados pelo encontro propriedade da preservao da razo cruzada
do padro quadriculado do plano horizontal. na perspectiva cnica:
Os pontos P1 e P2 definem, portanto, a
linha de fuga horizontal.

O valor da constante K pode ser obtido


diretamente da imagem a partir dos segmentos,
em pixels, AC, AD, BC e BD. Nesse caso a

88
dimenso do objeto poder ser obtida Assim pode-se calcular novamente a
diretamente por: constante K diretamente da imagem, e a
dimenso do objeto estimada em:

3.1.2. ESTIMATIVA DE ALTURA QUESTIONADA UTILIZANDO-


SE APENAS UMA REFERNCIA VERTICAL
3.2. ESTIMATIVA DO DESVIO DA ALTURA DO
Nas situaes em que h apenas um objeto OBJETO QUESTIONADO
vertical de referncia com dimenses Para se estimar adequadamente a altura do
conhecidas na imagem, pode-se utilizar como objeto questionado, de modo a minimizar o
ponto de referncia auxiliar o ponto de fuga erro em relao medida real, recomenda-se a
YHUWLFDO,IRUPDGRSHORREMHWRHDUHIHUrQFLD repetio completa deste procedimento por no
Apresenta-se na figura 5 um diagrama mnimo dez vezes, calculando o valor mdio
traado em perspectiva cnica. possvel ver para a constante K e seu desvio padro de
os pontos de fuga P1 e P2 e o ponto de acordo com as expresses [8]:
fuga vertLFDO , IRUPDGR SHOR HQFRQWUR GDV
retas verticais traadas a partir da base do
objeto e da referncia.
2VSRQWRV3$H&VmRGHILQLGRVGD
mesma maneira que descrito no subitem 3.1.1.
Assim, pode-se estabelecer o desvio da
altura do objeto questionado (LO) atravs da
propagao de erros, exibida na tabela 1 [8]:
TABELA 1
PROPAGAO DE ERROS

3.3. APLICAO EM CASO PRTICO


Inicialmente foi selecionado o quadro mais
favorvel para a estimativa da altura do
FIGURA 5 LINHA DE FUGA E O PONTO DE FUGA VERTICAL indivduo questionado. A postura e a posio
do indivduo na imagem foram os parmetros
Nesse caso, tambm atravs da conservao avaliados para a escolha deste quadro, uma vez
da razo cruzada, com perdo a falta de rigor que a regio localizada ao centro da imagem
matemtico na notao do limite ao infinito, a rea menos afetada pelas distores esfricas.
encontra-se a seguinte relao entre os
segmentos de reta: Em uma primeira anlise fora realizada a
estimativa da altura do indivduo questionado
(LO) utilizando-se apenas uma referncia
vertical na imagem (LR2), sendo apresentados
os resultados obtidos em 3.3.1.

89
Posteriormente observou-se a possibilidade O ponto de fuga P1 foi definido atravs do
de utilizar uma segunda referncia vertical encontro das retas traadas a partir das
(LR1). De modo a verificar a metodologia j extremidades da via enquanto que o ponto de
utilizada foi inicialmente estimada a altura fuga P2 foi definido atravs do encontro das
desta segunda referncia vertical (LR1) retas traadas a partir da base da coluna da
utilizando a mesma metodologia utilizada no edificao e da calada localizada a direita da
item 3.3.1, sendo apresentados os resultados imagem, conforme exibido nas figuras 7 e 8.
obtidos em 3.3.2. Realizou-se este procedimento dez vezes,
E finalmente apresenta-se no item 3.3.3 o utilizando-se em cinco destes a imagem tratada
clculo da altura do indivduo questionado SHORILOWUR)LQG(GJHV, com intuito de realar
utilizando-se as duas referncias verticais as bordas dos objetos, conforme demonstrado
encontradas na imagem (LR1 e LR2). na figura 7.
3.3.1. ESTIMATIVA DA ALTURA QUESTIONADA (LO)
UTILIZANDO-SE APENAS UMA REFERNCIA
VERTICAL(LR2)

A medida utilizada inicialmente como LR2


referncia neste caso foi a altura da faixa
LO
branca presente no poste localizado na regio
direita do vdeo, conforme exibido na figura 6.
Foi constatado pelo perito no local, utilizando
uma trena de alta preciso, que a altura desta
faixa branca em relao ao solo de 210,50cm.

LR2 FIGURA 7 IMAGEM COM AS BORDAS REALADAS

Segue na figura 8 a aplicao da tcnica


fotogramtrica descrita em 3.1.2, para o caso
em anlise. A linha na cor rosa a linha de
fuga e o ponto formado pelo encontro das duas
retas verticais na cor azul o ponto de fuga
vertical ,. Tambm encontra-se explicitados
QDILJXUDRVSRQWRV$&H'
FIGURA 6 COMPRIMENTO DA REFERNCIA UTILIZADA

P4

P2
P1 D
C Linha de fuga

LO A

FIGURA 8 DIAGRAMA CONTENDO A LINHA DE FUGA E O PONTO DE FUGA VERTICAL

90
Seguem na tabela 2 os resultados obtidos nas apresentado em 3.3.1, estimou-se a altura de
dez medies realizadas. LR1 utilizando apenas uma referncia vertical
(LR2).
TABELA 2
RESULTADOS DAS MEDIES REALIZADAS

D   / / <


     
     
     
     
     
     
     
     
FIGURA 9 ALTURA LR1 NA IMAGEM QUESTIONADA
     
     
Segue na figura 9, a aplicao do diagrama
Dessa forma, foram obtidos os resultados utilizado para estimativa de LR1 a partir da
exibidos na tabela 3. altura de LR2 utilizando como ponto de
referncia auxiliar o ponto de fuga vertical.
TABELA 3
RESULTADOS OBTIDOS
P1 P3

D
C
LR1 LR2
A

Dessa forma, a altura estimada do indivduo


questionado, na ocasio em anlise, utilizando
apenas uma referncia vertical (LR2),
aproximadamente:
LO = 164,08 +/- 2,86 (cm)
3.3.2. ESTIMATIVA DA ALTURA DA SEGUNDA REFERNCIA
VERTICAL (LR1) UTILIZANDO-SE APENAS UMA
REFERNCIA VERTICAL (LR2)

Em um segundo momento vislumbrou-se a I


FIGURA 10 DIAGRAMA CONTENDO O PONTO DE FUGA
possibilidade de identificar uma segunda VERTICAL PARA ESTIMATIVA DE LR1
referncia vertical na imagem (LR1), exibida
Seguem na tabela 4 as dez medies
na figura 9. Foi constatado pelo perito no local,
realizadas e na tabela 5 os resultados obtidos a
utilizando uma trena de alta preciso, que a
partir destas medies.
altura desta construo em relao a calada
de 107 cm. Vale ressaltar que devido ao aclive TABELA 4
desta via esta medida no permanece constante RESULTADOS DAS MEDIES REALIZADAS

ao longo da imagem. D   / / <


Inicialmente a fim de verificar a viabilidade      
de utilizao desta nova referncia vertical      
alm da prpria confiabilidade do mtodo

91
      Seguem na tabela 6 as dez medies
      realizadas e na tabela 7 os resultados obtidos a
     
partir destas medies.
      TABELA 6
RESULTADOS DAS MEDIES REALIZADAS
     
      D     <
           
           
     
TABELA 5
RESULTADOS OBTIDOS      

      
     
     

     
     
     

TABELA 7
Dessa forma, a altura estimada de LR1, RESULTADOS OBTIDOS
utilizando apenas uma referncia vertical 
(LR2) na imagem :
LR1 = 105,91 +/- 1,25 (cm) 
3.3.3. ESTIMATIVA DA ALTURA QUESTIONADA UTILIZANDO
DUAS REFERNCIAS VERTICAIS.

A partir da identificao das duas referncias
verticais conhecidas na imagem (LR1 e LR2),
pode-se calcular a altura do indivduo Dessa forma, a altura estimada do indivduo
questionado (LO) a partir do mtodo questionado, na ocasio em anlise, utilizando
apresentado no item 3.1.1. as duas referncias verticais conhecidas (LR1 e
Apresenta-se na figura 11 a aplicao do LR2), aproximadamente:
diagrama para o clculo da altura questionada LO = 160,34 +/- 2,18 (cm)
(LO) utilizando a conservao da razo e as
duas referncias conhecidas: LR1 e LR2, 4. CONCLUSO
medindo 107 e 210,50 cm respectivamente.
O emprego das tcnicas fotogramtricas
P1 P3 P4 apresentadas neste artigo demonstra ser uma
alternativa possvel para as diversas situaes
D em que o sistema de captura encontre-se
LR1 C
indisponvel a equipe forense, impossibilitando
B assim a utilizao de gabaritos mtricos.
A
LO Verificou-se no caso em anlise que o
mtodo para estimativa de uma altura
LR2 questionada utilizando apenas uma referncia
vertical e o ponto de fuga vertical, conforme
resultados obtidos exibidos no item 3.3.2,
apresentou pequena variao em relao a
medida real conhecida (LR1). Cabe ressaltar
FIGURA 11 DIAGRAMA CONTENDO A RAZO CRUZADA
PARA O CLCULO DA ALTURA QUESTIONADA (LO)

92
que a medida real encontra-se dentro da [5] Plugin Lens_unDistortionSMT. Disponvel em:
<http://svg.dmi.unict.it/iplab/imagej/Plugins/Forensics/LensUn
margem definida pelo desvio obtido. Distortion/Lens_unDistortionSMT.htm>. Acesso em
15/07/2012.
Em relao a estimativa da altura do [6] ImageJ Features. Disponvel em: <http://imagej.nih.gov/ij>.
Acesso em 15/07/2012.
indivduo questionado (LO), o mtodo [7] REIS, P. M. G. I., Fundamentos de Processamento Digital de
utilizando apenas uma referncia e o ponto de Imagens, Academia Nacional de Polcia, Instituto Nacional de
Criminalstica, Braslia, 2012.
fuga vertical, cujo os resultados obtidos foram [8] 982/2 - + )XQGDPHQWRV GD 7HRULD GH (UURV. Ed. Edgard
exibidos no item 3.3.1, apresentou Blcher Ltda, So Paulo, 1992.
divergncias em relao ao resultados obtidos
atravs do mtodo utilizando as duas
referncias verticais conhecidas, cujo os
resultados obtidos foram exibidos no item
3.3.3.
Foi constatada uma pequena faixa comum,
1,61m a 1,62m, para os resultados obtidos
atravs dos dois mtodos (Item 3.3.1 e 3.3.3).
Entretanto nota-se que o resultado obtido em
3.3.1, utilizando apenas uma referncia e o
ponto de fuga vertical, contemplou faixas
maiores de altura (1,62 a 1,66) enquanto que
resultado obtido em 3.3.3, utilizando as duas
referncias verticais, contemplou faixas
menores de altura (1,58 a 1,62).
Apesar de o autor considerar provvel que a
altura questionada encontre-se contida na faixa
comum aos resultados dos dois mtodos,
recomenda-se que a estimativa de alturas de
indivduos, sempre que possvel, utilize duas
referncias verticais presentes na imagem.

AGRADECIMENTOS
A diretoria da Percia Oficial e Identificao
Tcnica do Estado de Mato Grosso
(POLITEC) por viabilizar a capacitao dos
peritos lotados na Gerncia de Percias em
udio e Vdeo.
Aos profissionais do SEPAEL (Servio de
Percias em Audiovisual e Eletrnicos) do
Instituto Nacional de Criminalstica da Polcia
Federal, pela difuso de conhecimento e
cooperao tcnica quando necessrio.

REFERNCIAS
[1] CONRADY, A.'HFHQWHUHGOHQVV\VWHPV0RQWKO\1RWLFHVRI
the Royal Astronomical Society 79, 384390, 1919.
[2] BROWN, D.. 'HFHQWHULQJ GLVWRUWLRQ RI OHQVHV
Photogrammetric Engineering 7, 444462, 1966.
[3] BROWN, D.. &ORVH UDQJH FDPHUD FDOLEUDWLRQ
Photogrammetric Engineering 8, 855855, 1971.
[4] DE VILLIERS, J. P.; LEUSCHNER, F. W.; GELDENHUYS,
R.. "Centi-pixel accurate real-time inverse distortion
correction," in Proceedings of the 2008 International
Symposium on Optomechatronic Technologies, ser. ISOT2008,
vol. 7266, pp. 1-8, 2008.

93
On the practical aspects of applying the PRNU
approach to device identification tasks
Hermeson B. Costa1, Ronaldo F. Zampolo1, Diego M. Carmo1, Adalbery R. Castro1,2, Eurpedes P. Santos1
1
Computer and Telecommunications Department, Federal University of Par
Augusto Correa, 1, Belm , Par, 66075-110, Brazil
2
Centro de Percias Cientficas Renato Chaves
Rodovia Transmangueiro, s/n, Belm, Par, Brazil
hermeson.costa@itec.ufpa.br, zampolo@ufpa.br,
diego.carmo@itec.ufpa.br, adalbery@ufpa.br, epsantos@ufpa.br

ABSTRACT This paper addresses some practical issues number of the camera. Its simplicity however
regarding the device identification problem when using the
sensor photo-response nonuniformity (PRNU). The PRNU
is accompanied by the characteristic of being a
is unique to each digital imaging sensor due to weak evidence provider, once the file header
imperfections in the manufacturing process. The can be easily modified or erased.
motivation for this work comes from some problems found
in identifying devices by using threshold strategies On the other hand, analysis of watermark
presented so far. Experiments with five digital cameras,
from two different manufacturers, were performed and
consistency requires a camera capable to insert
their corresponding results are discussed. Although such a digital watermark in files it produces. In
results are preliminary, they may point out correct usage addition, such a watermark must be robust to
and help to find out limitations of the forensic techniques
based on PRNU.
re-quantisation, resizing, and filtering
operations, in order to serve as a reliable
1. INTRODUCTION feature for identification purposes. Then, this
watermark would be recovered later from a
This work presents a brief discussion,
digital picture/video to determine its origin.
supported by experimental results, about the
The drawback here is exactly the necessity of
use of the photo-response nonuniformity
having an acquisition equipment with
(PRNU) of camera sensors as a strategy to
watermarking capabilities, which is not
identify acquisition devices from digital
common if one considers the typical universe
photographs or videos.
of Brazilian forensic institutes.
In forensics, device identification means
The third approach aforementioned is the
verifying a possible connection between a
analysis of the sensor noise pattern, also
signal under analysis and an acquisition
known as PRNU. The PRNU is due to
equipment. We are particularly interested in
differences among photo-sensor elements in
digital camera identification. In this context,
converting light to electrical signal [2], [3].
both the digital photograph and the suspicious
Such differences lead to a sort of inherent
camera must be available. Thus, the question to
watermark, which characterises uniquely each
be answered is Did this camera take the
photo-sensor (sensor fingerprint). The PRNU
photo? In order to find out, the following
can be estimated from a camera and then
approaches can be adopted alone or combined:
compared with the PRNU found in a
file header evaluation, watermark checking,
photograph under analysis.
and sensor noise pattern analysis [1].
The PRNU has some properties, which make
The simplest strategy is the file header
it useful for forensic purposes: a) the noise
evaluation. Such an approach consists in
pattern is unique to each sensor; b) every
extracting the information contained in the
sensor exhibits it and every picture as well
image or video file header which is written
(with the exception of completely dark
automatically by the acquisition equipment
images); c) the PRNU is robust to a wide range
itself. For camera identification, the
of image processing operations, such as lossy
information of interest is the model and serial
compression, filtering, and gamma adjustment;

94
and d) the PRNU is stable in time and under a Based on (1), a maximum likelihood (ML)
wide range of physical conditions. estimator for the PRNU can be derived as
Images under test are filtered in order to shown in Expression 2 [2].
separate as much as possible the image signal d

from its PRNU component, which is then W I k k

compared with the estimated camera PRNU. K = k =1


, (2)
I k2
Such a comparison consists in assessing the
statistical similarity between camera and image where, d is the number of camera images used;
PRNUs. This image PRNU extraction is not an Ik represents the k-th camera image; and Wk
easy task, because the noise sensor is corresponds to the residual noise of Ik, which in
multiplicative and consequently correlated with turn is given as follows.
image pixels.
Wk = I k Ik( 0) , (3)
The remaining of this text is organised as
follows. Section 2 introduces a model of the where the Ik( 0) is a denoised version of I k .
image sensor output as well as the PRNU
estimation process. In Section 3, the fingerprint The larger the number of camera images (d),
detection procedure in test images is addressed. the better the PRNU estimation. Typically, for
Section 4 shows and discusses some acceptable quality estimation, d ranges from 30
experimental results. In Section 5, concluding to 50.
remarks are drawn.
3. FINGERPRINT DETECTION
2. SENSOR OUTPUT MODEL AND FINGERPRINT By fingerprint detection, we mean extracting
ESTIMATION
the PRNU from the image under investigation
In the formation process of a non computer and its comparison with the estimated camera
generated digital image, real scene information PRNU. Actually, the best we can do is to infer
passes through several stages, as wavelength the image PRNU by filtering. Details of the
filtering (usually by using a colour filter array), procedure used in this paper can be found in
light-to-electrical current conversion, signal [2], [4]. From this section on, we consider the
amplitude quantisation, colour channel scenario in which that image has the same
interpolation (demosaicing), and lossy coding. dimensions of the estimated camera PRNU and
Such stages are common to the most of video does not have undergone any kind of
cameras, cellphones and camcorders spread geometrical transformation, such as scaling or
worldwide. Each of those stages inserts rotation.
distortions into the original image signal,
which must be taken into account in modelling 3.1. HYPOTHESIS TESTING
the image formation process. A general model For detection purposes, the following two-
for the image sensor output [2] is given by channel hypothesis testing problem is assumed
[3]:
I = g [(1 + K )Y + ] + Q , (1)
H 0 : K1 K 2
where g is the gain factor (different for each , (4)
colour channel); represents the gamma H 1 : K1 = K 2
correction factor; Y denotes the original image where K1 and K2 denotes the camera and the
in the absence of any noise; is a combination image under investigation fingerprints,
of several types of noise; Q models the respectively.
combined distortion due to quantisation and/or
lossy compression (usually from JPEG The null hypothesis H0 means the image was
coding); and K is the device PRNU (camera not taken by the given camera (i.e. their
fingerprint). fingerprints are different), while the alternative
hypothesis H1 says it was.

95
Two figures are associated to the hypothesis correlation, whose expression is given as
testing problem in (4): the probability of false follows.
rejection, and the probability of false m 1 n 1
acceptance. False rejection or false negative [ X (i, j ) X ][Y (k + i, l + j ) Y ]
occurs when the hypothesis H1 is rejected, NCC (i, j ) = k =0 l =0

given the analysed image had indeed been X X Y Y


acquired by the suspicious camera. In turn,
, (7)
false acceptance or false positive happens
when H1 is accepted for an image that had not Those metrics are related, since NCC(0,0)
been taken by the suspicious camera. Such equals by definition. In spite of that, PCE
figures are actually the ultimate quality attains better results (see Section 4) due to the
indicators of any technique conceived to solve inherent comparison between peak and average
the camera identification problem. For forensic energy of NCC.
applications, in particular, the most important
figure seems to be the false acceptance 3.3. DECISION MAKING
probability, since in general this means that a For simplicity reasons, in the following
compromising photograph/video is linked to a discussion we refer only to but the same
camera owned by an innocent person. points also apply to PCE. Thus, after the
Obviously, the smaller those probabilities, the calculation of , its value is then compared
better the identification system. However, there with a decision threshold th. If exceeds th,
is a trade-off between such probabilities, one decides for hypothesis H1 (the image had
meaning that the decrease of one of them been taken by the camera), otherwise, one
results in the increase of the other. decides for H0. Rigorously, we would need two
thresholds, one corresponding to the
3.2. STATISTICAL SIMILARITY METRICS probability of false positive and other
In order to test the hypothesis in (4), some associated to the false negative probability.
metric to quantify the statistical similarity The determination of those thresholds is an
between estimated PRNUs is required. Two issue, asking for training procedures or the
possibilities are given next. availability of some previous statistical model.
The first metric presented here is the well- Undoubtedly, having general statistical
known Pearson's correlation coefficient, which models that describe the behaviour of , one
is defined as for each hypothesis H0 and H1, would be very
m 1 n 1
useful and time-saving because of the
[ X (i, j ) X ][Y (i, j ) Y ]
i =0 j =0
avoidance of training sessions. However, such
models are not easily obtained, as their
= , (5)
X X Y Y statistical properties seem to be camera-
dependent. Thus, training comes up as a
where X and Y denotes two random samples necessary step in practical situations.
with dimensions m n ; X and Y are the When the suspicious camera is available,
arithmetic means of X and Y, respectively; and developing specific models with regard to
represents the L2 norm. similarity metrics, considering test images had
been taken by the suspicious camera, is
Another metric used in this paper is the perhaps cumbersome but not technically
peak-to-correlation energy (PCE) [5]: difficult. As a result, decision thresholds for
NCC (0,0 ) given probabilities of false negative can be
2
PCE = , (6) easily derived. However, practical models
1
MN
NCC (i, j) 2
(even specific ones) for the behaviour of
i j similarity metrics, when images had not been
taken by the suspicious camera, have not been
where MN denotes the dimension of the NCC
achieved so far to the best of our knowledge.
matrix, and NCC is the normalized cross

96
Existing attempts fail when applied to real is displayed together. In addition, such a figure
situations [2], [3]. points out the difficulty of obtaining general
models as, even for the PCE, a lot of class
4. EXPERIMENTS AND RESULTS confusion can be noticed.
This section begins by describing the
4.3. DISCUSSION
experimental procedure adopted. Then, the
corresponding results are presented and As stated before, a camera identification
discussed. system is evaluated from its false positive and
negative probabilities. Tuning thresholds for
4.1. EXPERIMENTAL PROCEDURE each of such quality figures relies on statistical
The experiments conducted in this paper models of PRNU similarity metrics. False
were conceived to evaluate the performance of negative probability depends on models
the two metrics addressed in Section 3 as derived from images taken by the suspicious
features intended for device identification. We camera (H1 is true). This can be easily done,
have used five different cameras, three of the but false negative is the less important figure
model Fuji-FinePix JZ300 with serial numbers for a forensic application. In turn, false positive
OAQ38568, OAQ38657, and OBQ39278 (for probability depends on models derived from
convenience, identified as Fuji_1, Fuji_2 and images taken by cameras that are different
Fuji_3, respectively); and other two of the from the suspicious camera (H0 is true). Note
model Sony-DSC-W210, serial numbers that, in this case, our results suggest that as
6507300 and 6507323 (named Sony_1 and new cameras are included the model
Sony_2, respectively). parameters change and system overall
performance decays.
For each camera, 30 images of a cloudy sky
were taken to estimate the camera fingerprint, 5. CONCLUSIONS
and other 30 images of random content serve
as test signals. This paper has presented a discussion about
the practical use of PRNU approaches for
4.2. EXPERIMENTAL RESULTS digital camera identification. Experimental
results have demonstrated that statistical
The first set of tests regards Pearsons models for similarity PRNU metrics, which
correlation coefficient. Results are shown in allow threshold tuning for a given false
Figures 1-5 for cameras Fuji_1, Fuji_2, Fuji_3, positive rate, are not easy to obtain. Those
Sony_1 and Sony_2, respectively. In Figures 1 results suggest that as new cameras are
to 3, one can see the correlation coefficients included the model parameters change and
from those images taken by the suspicious system overall performance decays.
camera present higher values and the existence
of a threshold th can be clearly perceived. Future research efforts include a deeper
Figures 4 and 5, however, present what we can investigation of statistical modelling under true
call a class mixture, where one must tolerate H0 condition.
some misclassification. In addition, note that
the variation between camera models of the
underlying th cannot be overlooked. ACKNOWLEDGEMENTS
The results concerning PCE are shown in The authors would like to thank UFPA and
Figures 6-10 for suspicious cameras Fuji_1, CPCRC for the financial support.
Fuji_2, Fuji_3, Sony_1 and Sony_2,
respectively. By taking the results separately, REFERENCES
one realizes PCE outperforms the correlation [1] J. Redi, W. Taktak, J. -L. Dugelay, Digital image forensics: a
coefficient, since no class confusion is verified. booklet for beginners, Multimedia Tools and Applications, vol.
51 (1), pp. 133-162, 2011.
Again, underlying decision threshold values [2] J. Fridrich, Digital image forensics, IEEE Signal Processing
vary from model to model. Figure 11 Magazine,.vol. 26(2), pp 16-37, 2009.
[3] M. Goljan and J. Fridrich, Camera identification from cropped
emphasises this last aspect, where all PCE data and scaled images, in Proc. of the SPIE Electronic Imaging,

97
Forensics, Security, Steganography, and Watermarking of
Multimedia Contents X, 2008, pp 28-30.
[4] M. K. Mihcak, I. Kozintsev, and K. Ramchandran, Spatially
adaptive statistical modeling of wavelet image coefficients and
its application to denoising, Proc. IEEE Int. Conf. Acoustics,
Speech, and Signal Processing, Mar. 1999, vol. 6, pp. 3253
3256.
[5] B. V. K. V. Kumar and L. Hassebrook, Performance measures
for correlation filters, Applied Optics, Vol. 29(20) (1990), pp.
2997-3006.

Figure 4: Pearson's correlation coefficients for 30 images of each


camera with the camera fingerprint estimated from Sony_1.

Figure 1: Pearson's correlation coefficients for 30 images of each


camera with the camera fingerprint estimated from Fuji_1.

Figure 5: Pearson's correlation coefficients for 30 images of each


camera with the camera fingerprint estimated from Sony_2.

Figure 2: Pearson's correlation coefficients for 30 images of each


camera with the camera fingerprint estimated from Fuji_2.

Figure 6: Peak-to-correlation energy (PCE) for 30 images of each


camera with the camera fingerprint estimated from Fuji_1.

Figure 3: Pearson's correlation coefficients for 30 images of each


camera with the camera fingerprint estimated from Fuji_3.

98
Figure 7: Peak-to-correlation energy (PCE) for 30 images of each Figure 10: Peak-to-correlation energy (PCE) for 30 images of each
camera with the camera fingerprint estimated from Fuji_2. camera with the camera fingerprint estimated from Sony_2.

Figure 11: Peak-to-correlation energy (PCE) showed on Figure 6,


Figure 8: Peak-to-correlation energy (PCE) for 30 images of each Figure 7, Figure 8, Figure 9 and Figure 10 together.
camera with the camera fingerprint estimated from Fuji_3.

Figure 9: Peak-to-correlation energy (PCE) for 30 images of each


camera with the camera fingerprint estimated from Sony_1.

99
Avaliao de Classificadores Haar Projetados
para Deteco Facial
R. Padilla1, C. F. F. Costa Filho2, M. G. F. Costa2
1
Instituto Nokia de Tecnologia
Av. Torquato Tapajs, 7200 Col. Terra Nova, Manaus-AM. CEP: 69048-660 Brasil
2
Universidade Federal do Amazonas
Av. Gal. Rodrigo Otvio Jordo Ramos, 3000, Manaus-AM. CEP: 69010-110 Brasil
rafael.padilla@indt.org.br, cffcfilho@gmail.com, marly.costa@uol.com.br

RESUMO Nos ltimos anos vrios estudos foram A imagem capturada da face pode ser pr-
realizados na rea de deteco de faces. A face humana
contm caractersticas importantes que podem ser
processada para eliminar as variaes de
utilizadas em sistemas biomtricos para a identificao de iluminao [2]. A extrao de caractersticas
indivduos. A localizao facial, a primeira etapa de o processo onde um modelo geomtrico ou
sistemas biomtricos pela face, localiza faces na imagem de
entrada. O framework Viola-Jones tem sido amplamente
vetorial obtido reunindo caractersticas
utilizado por pesquisadores para deteco e localizao de importantes presentes na face. A extrao de
objetos e faces. Classificadores de deteco facial so caractersticas pode ser dividida em 3
compartilhados pela comunidade cientfica e acadmica.
Este trabalho tem como objetivo avaliar classificadores
abordagens: holstica, baseada em
localizadores de face atravs de pontos faciais, auxiliando caractersticas e hbrida. So exemplos de
pesquisadores na escolha do melhor classificador de acordo abordagens holsticas: Anlise de
com a necessidade de cada um.
Componentes Principais [3] [4], Anlise
1. INTRODUO Discriminante de Fisher [5] [6] e Mquina de
Vetores de Suporte [7]. Extrair caractersticas
Embora o reconhecimento de um indivduo de uma determinada face uma tarefa difcil,
atravs da face seja uma tarefa trivial para uma vez que suas caractersticas, tais como
seres humanos, um desafio para sistemas de olhos, boca, nariz e queixo, possuem, em geral,
automao baseados em imagens. Este tema a mesma configurao geomtrica. Abordagens
tem sido estudado por pesquisadores de baseadas em caractersticas utilizam as
diferentes reas envolvendo processamento relaes geomtricas das caractersticas faciais.
digital de imagens, redes neurais, estatstica, O Modelo de Forma Ativa pode ser aplicado
reconhecimento de padres, antropometria e para obter informaes importantes presentes
viso computacional. Sistemas de automao em alguns pontos faciais [8]. Classificadores
baseados em imagens fazem o reconhecimento estatsticos, tais como Distncia Euclidiana [9],
e identificao facial em diversas aplicaes Classificador de Bayes [10], Distncia de
comerciais, tais como autenticao por Mahalanobis [11] e Classificadores Neurais
biometria, interao homem-mquina, [12] podem ser usados na comparao do vetor
vigilncia, jogos e entretenimento. de caractersticas com outras classes
Ao contrrio de outras biometrias, o (indivduos) durante a etapa de
reconhecimento de face no-invasivo e no reconhecimento.
necessita de contato fsico do indivduo com o A deteco de faces teve sua acurcia
sistema, tornando-se uma tecnologia muito melhorada com a aplicao de caractersticas
aceitvel no mercado. Sistemas automticos tipo Haar, com a contribuio do framework de
baseados em viso para o reconhecimento de deteco de objetos Viola-Jones.
indivduos pela face pode ser dividido em 4 Implementaes deste framework tonaram-se
etapas: deteco da face, pr-processamento da populares e proporcionam a criao de
imagem, extrao de caractersticas e classificadores por autores que utilizaram
reconhecimento [1]. diferentes conjuntos de imagens para sua

100
gerao. O desempenho e a confiabilidade
desses classificadores varia muito [13].
Este artigo tem como objetivo avaliar
classificadores faciais considerando
caractersticas faciais contidas nas faces
encontradas. Propomos um mtodo utilizando
diferentes pontuaes dadas para cada
caracterstica facial contida na face localizada.
Dois bancos de dados de faces (FEI e Yale) Figura 2 Base de faces FEI

foram utilizados para avaliar 10 classificadores 2.3. DETECTORES DE FACE VIOLA-JONES


faciais. Motivados pelo desafio de deteco de faces,
[16] propuseram um framework detector
2. MATERIAIS
objetos utilizando caractersticas tipo Haar.
2.1. BASE DE FACES YALE Este framework tem sido amplamente utilizado
A base de faces Yale [14] contm imagens por outros pesquisadores e trabalhos, no s
dos rostos de 15 indivduos, com 11 fotos cada para a deteco de faces, mas tambm para
um, tiradas em diferentes condies de localizao de objetos em imagens e vdeos.
iluminao. Os indivduos apresentam Graas implementao da biblioteca
expresses faciais variadas (com culos, triste, OpenCV [17], o framework Viola-Jones
sonolento, piscando, surpresos). O tamanho de tornou-se popular e motivou a comunidade a
cada imagem 320x243 pixels. gerar seus prprio classificadores de objetos.
A Figura 1 mostra exemplos de imagens da Esses classificadores usam caractersticas tipo
base de faces Yale. Haar que so aplicadas sobre a imagem.
O conceito de caractersticas tipo Haar
provm de funes Haar de Base [18]. Existem
basicamente 4 tipos de caractersticas, que so
demonstradas na Figura 3.

Figura 1 Base de faces Yale

2.2. BASE DE FACES FEI


A base de faces FEI [15] um banco de
dados brasileiro contendo 14 imagens para
cada um dos 200 indivduos, com um total de
2800 imagens. As imagens so coloridas e
apresentam faces em diferentes rotaes, com
expresses neutras e sorrindo. Utilizamos 2 Figura 3 Caractersticas tipo Haar posicionadas sobre uma janela de
amostragem. FONTE: P. Viola and M. Jones [16]
imagens frontais por indivduo, considerando
as imagens com sorriso e neutras, totalizando Cada caracterstica posicionada sobre uma
400 imagens. O tamanho original de cada parte da imagem, chamada de sub-janela,
imagem 640x480 pixels. Exemplos de expressa um valor obtido atravs da soma dos
imagens da base de faces FEI podem ser vistos pixels da regio branca subtrados da soma dos
na Figura 2. pixels da regio escura.

101
Uma vez obtido o conjunto de caractersticas recomea atravs de toda a imagem, conforme
e seus limiares, o processo de teste feito mostra a Figura 6.
utilizando uma tcnica de verificao em
cascata, conforme a Figura 4. Nesta figura
temos um classificador formado por N
camadas. Cada camada composta por vrias
caractersticas. Para o classificador comprovar
que uma sub-janela possua uma face, esta sub-
janela deve passar por todas as N camadas do
classificador, de modo que no seja rejeitada
por nenhuma delas.

Figura 6 Sub-janela deslocada atravs de uma imagem

Cada estgio formado por caractersticas e


por um limiar de estgio. Cada caracterstica
formada por retngulos, por um limiar de
caracterstica, valor esquerdo e valor direito. A
Figura 7 mostra a estrutura de um nico
estgio.

Figura 4 Deteco em cascata

Alguns classificadores de localizao de


faces so distribudos na implementao do
OpenCV [17]. Estes classificadores so
arquivos XML (Extensible Markup Language)
estruturados em estgios como mostra a Figura
5.

Figura 5 Estrutura de um classificador Viola-Jones em XML

Cada classificador formado por vrios


estgios. O classificador determina o tamanho Figura 7 Estrutura de um estgio utilizado no classificador de objetos
mnimo da sub-janela que ser analisada pelos
Cada caracterstica possui um valor esquerda
estgios at que seja reprovada por um deles.
e um valor direita. Estes valores so pesos
Caso a sub-janela seja reprovada, a mesma
encontrados no processo de treinamento e
deslocada pela imagem, gerando uma nova
atribudos a cada caracterstica, que so
sub-janela a ser analisada pelo classificador.
somados e comparados com o limiar do
Ao passar por toda imagem, a sub-janela ter
estgio.
suas dimenses ampliadas e o processo

102
O valor de cada caracterstica calculado pontos faciais e propuseram um conjunto de
pela aplicao da mesma na sub-janela. Se o ferramentas que facilitam a integrao com
valor da caracterstica for menor do que seu outras bases de dados. [26] propuseram uma
limiar, acumula-se o valor da esquerda, caso tcnica para segmentao facial usando
contrrio, o valor acumulado o valor da Modelo de Forma Ativa com base em pontos
direita. Para uma sub-janela ser aprovada por de fronteira do rosto. [27] utilizou um modelo
um estgio, o valor acumulado por todas as geomtrico facial com base na distncia dos
caractersticas deve ser menor do que o limiar olhos para estipular a posio dos pontos da
do estgio. face. Este modelo geomtrico mostrado na
Neste trabalho, foram utilizados 10 Figura 8.
classificadores, apresentados na Tabela I.
Mantivemos a mesma descrio utilizada por
[13] para facilitar comparaes.
TABELA 1
CLASSIFICADORES

Classificador Tamanho Estgios Referncias Posio da


face
FD 24x24 25 [19,20] Frontal
FA1 20x20 22 [19,20] Frontal
Figura 8 Deteco em cascata
FAT 20x20 46 [19,20] Frontal
O projeto FGnet publicou a localizao de
FA2 20x20 20 [19,20] Frontal
22 traos faciais de cada face do banco de
FW 30x30 19 [21] Frontal
faces AR [28]. Ns tambm marcamos
FWQ 30x30 20 [21] Rotacionada
manualmente estes 22 pontos faciais nas bases
FWH 25x30 20 [21] Rotacionada
de Yale e FEI utilizadas neste trabalho. A
Figura 9 mostra uma imagem com os pontos
PR 20x20 26 [22] Perfil faciais marcados.
HS1 22x18 30 [23] Parte
superior do
No total, 565 imagens foram utilizados e
corpo para cada um dos 22 pontos de referncia, uma
HS2 22x20 19 [24] Cabea e pontuao foi dada (ver Tabela 2). A
ombros pontuao dada para cada ponto foi 1 ou 2.
Selecionamos o maior nmero de Para pontos localizados no contorno da face a
classificadores disponveis pela comunidade maior pontuao foi dada. A aplicao das
cientfica. A escolha desses classificadores pontuaes ser explicado na sesso seguinte.
resultou de uma pesquisa detalhada realizada
na literatura, de onde extramos as referncias
listadas na Tabela 1 e seus correspondentes
classificadores. Os classificadores FW, FWQ,
FWH, HS1 e HS2 foram gentilmente cedidos
pelos autores atravs de contato realizado. Os
classificadores PR, FD, FAT, FA2, FA1 esto
disponveis na verso 2.4 da biblioteca
OpenCV.

3. PONTOS FACIAIS
A deteco de pontos faciais importante
no somente para gerar um modelo geomtrico
do rosto, mas tambm para ser utilizado na
deteco de faces [24]. [25] compararam Figura 9 Exemplo de pontos faciais marcados manualmente
diferentes algoritmos para a localizao de

103
TABELA 2 esto dentro da face localizada - pontos 13 e
PONTOS FACIAIS E SUAS PONTUAES
21.
Ponto facial Descrio Pontuao
0 Centro do olho direito 1
Ao analisarmos diferentes faces, estimamos
1 Centro do olho esquerdo 1
que um rosto bem localizado, se sua
pontuao total for maior ou igual a 27. Faces
2 Canto direito da boca 1
com pontuaes mais baixas deixam
3 Canto esquerdo da boca 1
importantes pontos faciais fora da imagem do
4 Canto direito da sobrancelha direita 2
rosto.
5 Canto esquerdo da sobrancelha direita 2
6 Canto direito da sobrancelha esquerda 2
7 Canto esquerdo da sobrancelha esquerda 2
8 Limite superior direito da face 2
9 Canto direito do olho direito 1
10 Canto esquerdo do olho direito 1
11 Canto direito do olho esquerdo 1
12 Canto esquerdo do olho esquerdo 1
13 Limite superior esquerdo da face 2
14 Ponta do nariz 1
15 Narina direita 1
16 Narina esquerda 1
17 Limite superior labial 1
18 Limite inferior labial 1 Figura 10 Face localizada com pontuao igual 27

19 Queixo 2
4.2. CRITRIO II
20 Limite direito da face 2
21 Limite esquerdo da face 2
Ns tambm consideramos o mesmo critrio
utilizado por [13] para avaliar a preciso do
4. EXPERIMENTOS tamanho da face detectada. Uma face
corretamente detectada se sua altura e largura
Primeiramente coletamos 10 classificadores so menores que quatro vezes a distncia entre
de localizao facial. Eles diferenciam-se pelo os olhos. Diferentemente de [13], no
nmero de estgios e pelo tamanho mnimo de avaliamos o tempo de processamento de cada
faces que podem ser detectadas. Eles foram classificador. Nosso objetivo avaliar a
projetados para detectar rostos em diferentes acurcia dos classificadores, considerando
posies (frontal e de perfil) e somente a pontos faciais (critrio I) e o tamanho das faces
cabea ou cabea e ombros e juntos. localizadas (critrio II).
Dois critrios foram utilizados para
determinar a preciso de cada classificador, e 4.3. RESULTADOS
so descritos a seguir. Podemos ver os resultados da aplicao dos
dez classificadores nas duas bases nas Figuras
4.1. CRITRIO I 11 e 12.
A preciso de um classificador foi A Figura 11 mostra os resultados obtidos
mensurada pela pontuao obtida pelas face quando o critrio I foi utilizado e a Figura 12
localizadas. A regio do rosto detectado deve com a utilizao do critrio II.
conter o mximo de pontos faciais possvel. A
pontuao de cada caracterstica facial
somada se esta encontra-se dentro do retngulo
que representa a face.
A Figura 10 mostra o exemplo de uma face
localizada por um dado classificador. Note que
existem 2 pontos faciais importantes que no

104
aprovao, o critrio I, proposto neste trabalho,
foi, na maioria dos casos, mais exigente que o
critrio II. A nica excesso a essa regra foi
verificada com o classificador HS2, quando
avaliado na base FEI.

REFERNCIAS
[1] J. Fagertun, 2005. Face Recognition. Dissertao de Mestrado,
Universidade Tcnica da Dinamarca (DTU).
[2] Y. Gang, L. Jiawei, L. Jiayu, M. Qingli and Y. Ming,
Illumination Variation in Face Recognition: A Review, IEEE
Figura 11 Resultados utilizando o critrio I Second International Conference on Intelligent Networks and
Intelligent Systems (ICINIS 2009), pp. 309-311.
[3] M.A. Turk, A.P. Pentland, "Face Recognition Using Eigenfaces",
Proceedings of the IEEE Conference on Computer Vision and
Pattern Recognition (CVPR91), 3-6 Junho 1991, Maui, Hawaii,
USA, pp. 586-591.
[4] H. Moon, P.J. Phillips, "Computational and Performance Aspects
of PCA-based Face Recognition Algorithms", Perception, Vol.
30, 2001, pp. 303-321.
[5] K. Etemad, R. Chellappa, "Discriminant Analysis for
Recognition of Human Face Images", Journal of the Optical
Society of America A, Vol. 14, No. 8, Agosto 1997, pp. 1724-
1733.
[6] J. Lu, K.N. Plataniotis, A.N. Venetsanopoulos, "Face Recognition
Using LDA-Based Algorithms", IEEE Transaction on Neural
Networks, Vol. 14, No. 1, Janeiro 2003, pp. 195-200.
[7] B. Heisele, P. Ho, T. Poggio, "Face Recognition with Support
Vector Machines: Global versus Component-based Approach",
Figura 12 Resultados utilizando o critrio II
Proceedings. of the Eighth IEEE International Conference on
Computer Vision (ICCV01), Vol. 2, 09-12 Julho 2001,
A partir dos dados obtidos, podemos Vancouver, Canad, pp. 688-694.
concluir que: [8] A. Lanitis, C.J. Taylor, T.F. Cootes, "Automatic Interpretation
and Coding of Face Images Using Flexible Models", IEEE
a) Os melhores ndices de aprovao Transaction Pattern Analysis and Machine Intelligence (1997),
pp. 743-756.
foram alcanados pelos classificadores FA1, [9] E. Gomathi, K. Baskaran, "Recognition of Faces Using Improved
FA2 e FAT; Principal Component Analysis", (ICMLC10), pp.198-201.
[10] C. Liu and H. Wechsler, "Probabilistic Reasoning Models for
b) Nota-se que o ndice de 100% de Face Recognition", in. IEEE Computer Society Conference on
Computer Vision and Pattern Recognition (CVPR98), pp.827-
aprovao s foi conseguido em alguns 832.
classificadores, utilizando-se a base de imagens [11] Y. Ji, T. Lin, and H. Zha, "Mahalanobis Distance Based Non-
negative Sparse Representation for Face Recognition", em The
Yale; Eighth International Conference on Machine Learning and
Applications (ICMLA09), pp.41-46.
c) Os classificadores FD, FA1, FAT, FA2 [12] V. Kabeer & N. K. Narayanan, "Face recognition using state
space parameter and Articial Neural Network Classier", IEEE
tiveram ndices de aprovao semelhantes ao International Conference on Computational Intelligence and
se utilizar os Critrios I e II, em ambas as Multimedia Applications (ICCIMA07), Sivakasi, ndia Vol.3,
Dezembro, 2007, pp 250-254.
bases; [13] M. Castrilln, O. Dniz, D. Hernndez, and J. Lorenzo. A
Comparison of Face and Facial Feature Detectors based on the
d) Os classificadores FW, FWQ, FWH, Viola-Jones General Object Detection Framework. Machine
PR e HS1 tiveram ndices de aprovao bem Vision and Applications, vol. 22 issue 3, 2011.
[14] P. N. Bellhumer, J. Hespanha, and D. Kriegman, "Eigenfaces vs.
menores, em ambas as bases, ao se utilizar o fisherfaces: Recognition using class specific linear projection",
Critrio I do que o Critrio II; IEEE Transactions on Pattern Analysis and Machine
Intelligence, Special Issue on Face Recognition, 1997, pp. 711-
e) O classificador HS2 teve um ndice 720.
[15] L. L. de Oliveira Junior and C. E. Thomaz. "Captura e
aprovao maior na Base FEI ao se utilizar o Alinhamento de Imagens: Um Banco de Faces Brasileiro".
Critrio I, enquanto que o mesmo teve um Relatrio Final de Graduao. Departamento de Engenharia
Eltrica, FEI, So Bernardo do Campo, So Paulo, Brasil, Junho
ndice de aprovao maior na Base Yale ao se 2006.
utilizar o Critrio II. [16] P. Viola and M. Jones, "Robust real-time object detection,"
International Journal of Computer Vision, 2002 vol. 57, no. 2,
Assim sendo, a partir das concluses pp. 137-154.
[17] Inte, Intel Open Source Computer Vision Library, v1. 1ore,
anteriores podemos afirmar que os melhores http://sourceforge.net/projects/opencvlibrary (Outubro 2011).
classificadores avaliados foram FA1, FA2 e [18] PAPAGEORGIOU, C.; OREN, M.; POGGIO, T. "A general
framework for object detection" International Conference on
FAT. Em termos dos percentuais de Computer Vision, 1998.

105
[19] Lienhart, R., Kuranov, A., Pisarevsky, V., Empirical Analysis of
Detection Cascades of Boosted Classifiers for Rapid Object
Detection, em 25th Pattern Recognition Symposium
(DAGM03), pp. 297-304.
[20] Lienhart, R., Liang, L., Kuranov, A., A Detector Tree of Boosted
Classifiers for Real-Time Object Detection and Tracking,em
IEEE International Conference on Multimedia and Expo
(ICME03), pp. 277-280.
[21] Wilson, P. I., Fernandez, J., Facial feature detection using haar
classifiers, em Journal of Computing Sciences in Colleges
(2006), pp. 127-133.
[22] Bradley, D. Profile face detection http://www.cs.cmu.edu/
~dbradley/publications/bradley-iurac-03.swf, (2003) ultimo
acesso em 10/12/2011.
[23] Kruppa, H., Castrilln Santana, M., Schiele, B., Fast and Robust
Face Finding via Local Context, em IEEE International
Workshop on Visual Surveillance and Performance Evaluation of
Tracking and Surveillance (VS-PETS03), pp. 157-164.
[24] G. M. Beumer, Q. Tao, A. M. Bazen and R. N. J. Veldhuis, "A
Landmark Paper in Face Recognition". IEEE International
Conference on Automatic Face and Gesture Recognition
(FGE02), pp. 73-78.
[25] M. Koestinger, P. Wohlhart, P. M. Roth and H. Bischof,
Annotated Facial Landmarks in the Wild: A Large-scale, Real-
world Database for Facial Landmark Localization, IEEE
International Workshop on Benchmarking Facial Image Analysis
Technologies (BeFIT11).
[26] M. Jian-Wei and F. Yu-Hua, "Face segmentation algorithm based
on ASM", IEEE Conference on Intelligent Computing and
Intelligent Systems (ICIS09), 2009, pp 495-499.
[27] Z. Liu, W. Li, X. Zhang and J. Yang, "Efficient Face
Segmentation Based on Face Attention Model and Seeded
Region Merging", 9th International Conference on Signal
Processing (ICSP08). pp. 1116-1119.
[28] A.M. Martinez and R. Benavente, "The AR Face Database",
CVC Technical Report #24, Junho - 1998.

106
Identicacao de Cameras de Celulares Usando
Sensor Pattern Noise
Leonardo Torres1 , Valter Ramos1 , Alisson S. Nascimento1 , Jose Alencar-Neto1 , Alejandro C. Frery2
1
Departamento de Pesquisa & Desenvolvimento Investigacao e Percia Digital, RASTRU
57057-780, Maceio, AL Brasil
2
Instituto de Computacao Universidade Federal de Alagoas, UFAL
57072-970, Maceio, AL Brasil
{ljmtorres, valter, alisson.sa.nascimento, alencar}@rastru.com.br, acfrery@gmail.com

ResumoNeste trabalho, propomos uma metodologia uma tabela de quantizacao utilizada como parametro
para identicacao de cameras usando Sensor Pattern Noise. no processo de compressao JPEG [1] e [2]; (ii) a
Para cada camera investigada sao obtidas caractersticas correlacao entre os pixels referente a interpolacao
de n-imagens, pela media e pela mediana do rudo residual
das cores utilizando Color Filter Array (CFA) [1];
por tecnicas de ltragem, denotadas ngerprints. Entao o
rudo residual da imagem investigada e comparado com (iii) o rudo padrao do fotossensor deixado na
as ngerprints da camera para mensurar sua correlacao. imagem, denotado Sensor Pattern Noise (SPN) [3]
Finalmente, no processo de decisao, o algoritmo utiliza e [4]. Estas e outras informacoes obtidas de uma
metodos estatsticos e um limiar adaptativo nos resultados imagem digital podem provar sua autenticidade e
provenientes das correlacoes. No melhor caso obtivemos integridade, identicar o dispositivo de origem ou a
100% de acuracia e como pior resultado uma taxa de falsa
correlacao entre imagens como provenientes de um
aceitacao FAR = 0% com falsa rejeicao FRR = 13.33%
para ambos os padroes estimados usando 10-imagens. mesmo dispositivo, auxiliando a analise forense em
crimes digitais.
Este trabalho apresenta uma metodologia para
1. I NTRODUC AO
identicacao de cameras digitais baseado no rudo
A analise forense de vdeos e imagens digitais e padrao do sensor. Apresenta as principais condicoes
uma area recente, cujo interesse da comunidade ci- para captura das imagens do dispositivo investigado
entca vem aumentando no decorrer dos anos. Uma e um modelo entidade-relacional para armazena-
das tecnicas bastante utilizada na analise forense sao mento destas imagens. As imagens investigadas
as blind techniques, que usam atributos extrados da passam por uma processo de extracao do rudo
propria imagem em analise. Assim, nao ha necessi- residual, denotado atributos. Estes atributos servem
dade de inserir caractersticas em qualquer etapa da como entrada para o processo de formacao do
formacao da imagem para posterior vericacao ou padrao do modelo do dispositivo. Neste processo
validacao, caractersticas que levam vantagens sobre sao identicados dados estatsticos comuns e ineren-
outras tecnicas, como exemplo, as watermarks. tes as imagens. Tais caractersticas extradas servem
Devido aos avancos tecnologicos e reducao dos de entrada para o processo de decisao. O objetivo
custos de dispositivos e softwares para aquisicao principal e constatar de qual dispositivo as imagens
e manipulacao de imagens digitais, mais pessoas investigadas se originam.
se tornam usuarias destas tecnologias usando li- O artigo esta organizado da seguinte forma: Na
vremente seus recursos, legal ou ilegalmente. As- Secao II apresenta o estado da arte, onde sao expos-
sim, estes usuarios trazem novos desaos para tas as principais tecnicas utilizadas. Na Secao III
investigacao na ciencia forense em imagens digitais. descreve a metodologia abordada, ressaltando as
Uma imagem digital contem bem mais que so- entradas e sadas de cada processo. Na Secao IV
mente a cena a qual se captou, cada imagem leva sao expostos os resultados alcancados e por m, na
consigo caractersticas inerentes a sua formacao, Secao V nos discutimos as contribuicoes e trabalhos
como por exemplo: (i) o coecientes gerados por futuros.

107
Figura 1. Modelo de aquisicao de imagem digital.

2. T RABALHOS R ELACIONADOS positivo, como em [3], [4], [5] e [6]. Diferentemente


A analise forense de imagens digitais, mais es- de outras tecnicas, a analise por SPN nao necessita
pecicamente em identicacao de dispositivos, e de conhecimento a priori das caractersticas fsicas
comumente utilizada para responder as questoes do dispositivo, evitando-se a necessidade de aborda-
abaixo dando suporte a comunidade forense no gem intrusiva sobre os dispositivos na investigacao
combate aos crimes eletronicos: de Camera Identication, ou mesmo a necessidade
Dada uma imagem pode-se provar se ela foi
da posse do dispositivo original nas percias de
ou nao produzida por uma certa camera ou Device Linking.
dispositivo digital (Camera Identication)? Uma outra objecao em se utilizar tecnicas ba-
Duas ou mais imagens podem ser correlaciona-
seadas em caractersticas fsicas e a facilidade de
das como originadas de um mesmo dispositivo adulteracao das informacoes que as imagens levam
desconhecido (Device Linking)? no cabecalho (e.g. EXIF), por exemplo, diminuindo
sua credibilidade.
A. Aquisicao de Imagem Digital A motivacao deste trabalho e a utilizacao de
A Figura 1 mostra um modelo de aquisicao de tecnicas nao intrusivas e uma estrutura de difcil
imagem digital: a luz reetida da cena e dos objetos adulteracao. Essas premissas levam a utilizacao do
nela contidos passa atraves de lentes e de ltros rudo padrao do sensor, o qual se torna ecaz visto
oticos, para que seja capturada pelos sensores de que cada dispositivo deixa na imagem, um tipo de
cores. A maioria das cameras digitais usam sensores impressao digital (ngerprint), uma marca unica e
Charge-coupled Device (CCD) ou Complementary inerente a cada sensor, mesmo em marcas e modelos
Metal-Oxide-Semiconductor (CMOS) e capturam as iguais. Com esta ngerprint e possvel identicar o
imagens usando um CFA. Os CFAs sao matrizes, dispositivo da qual uma imagem foi capturada, ou
em sua maioria, com tres ltros de cores em padrao pelo menos determinar quais dispositivos a imagem
RGB (red, green, blue), acoplados a cada sensor. se origina [7].
Cada pixel de uma imagem digital tem tres valores, Lukas et. al [4] descrevem que o rudo produzido
um de cada cor ou banda, que compoem a cor no processo de aquisicao pode ser dividido em
do pixel, porem cada ponto do CFA captura um duas categorias: (i) Fixed Pattern Noise (FPN) e
unico valor de uma banda especca, os valores das (ii) Photoresponse Nonuniformity (PRNU). O FPN
outras bandas sao inexistente, ate entao. O processo e formado por pontos escuros, pontos do sensor
de interpolacao usa os valores da vizinhanca do (CCD ou CMOS) nao expostos a luz. Em uma
pixel nas outras bandas para estimar os valores imagem natural o que predomina e a PRNU, que
inexistentes, am, de torna possvel a exibicao da e formada pelo rudo devido a nao uniformidade
imagem e, nalmente, pode ser aplicado um pos- dos pixels (Pixel Nonuniformity PNU) e pelos
processamento onde, por exemplo, pode ser feito componentes de baixa frequencia. Todos os sensores
uma compressao JPEG. nao recebem a mesma intensidade de luz da cena,
tornando-se mais uma caracterstica do processo
B. Rudo Padrao do Sensor de fabricacao do dispositivo. Porem, diferentemente
Muitos autores vem se dedicando no uso do SPN do FPN, a temperatura nao e considerada para
como principal caracterstica para identicar um dis- contribuicao na PNU.

108
C. Rudo Residual D. Identicacao e correlacao usando SPN
Os componentes de baixa frequencia de uma ima- Para identicar um dispositivo atraves do SPN,
gem digital advem dos elementos da cena capturada. utiliza-se caractersticas unicas que podem ser pro-
A luz refratada por partculas de poeira, superfcies venientes de imperfeicoes dos componentes, de efei-
opticas e conguracoes de zoom tambem geram tos do ambiente e condicoes de operacao [4]. Estas
componentes de baixa frequencia. caractersticas dao unicidade ao rudo produzido no
A supressao do rudo e um passo importante no processo de captacao da imagem, fazendo com que
processo de investigacao e identicacao de dispositi- seja viavel a identicacao do dispositivo somente
vos atraves do SPN. Dos trabalhos como de [3], [4], atraves de imagens originadas deste dispositivo.
[6], [8] e [9], obtem-se o rudo residual, denotado Obtido o rudo residual, como subsdio para o
wk , utilizando tecnicas de ltragem e dado por processo de classicacao, alguns autores extraem
wk = Ik F (Ik ), (1) caractersticas do rudo (features) [5], [10], outros
estimam a PNRU [11], [8] e outros ainda usam
em que Ik representa uma imagem natural e F o proprio rudo residual como entrada [3], [6].
um funcao de ltragem. Com isso, o SPN pode Alinhado a primeira abordagem, este trabalho utiliza
ser estimado pela media do rudo residual de n- caractersticas estatsticas extradas do rudo resi-
imagens, denotado e dado por dual como entrada para o processo de classicacao.
n
1
= wk , (2) E. Processo de Classicacao
n k=1
O processo de decisao e responsavel pela au-
em que n representa o numero total de imagens tenticacao do dispositivo investigado. Esta proposta
usadas para estimar a impressao digital do sensor. utiliza a autenticacao do tipo vericacao Um para
A Figura 2 apresenta um exemplo do processo de Um e o tipo de identicacao Um para Muitos.
pre-processamento em imagem digital para obter o O primeiro tipo verica se uma imagem investigada
rudo residual utilizando a Equacao (1). pertence a um certo dispositivo conhecido, ou nao.
Enquanto, o segundo tipo identica para um dado
conjunto de cameras se uma imagem investigada
pertence a alguma das cameras ou a nenhuma delas.
Muitos autores utilizam o SVM (Support Vector
Machine) como processo de decisao supervisionado.
Os resultados alcancados sao satisfatorios, como em
[10], [12], [5], [3].
A Curva ROC (Receiver Operating Characteris-
tic) e um metodo estatstico, comumente utilizado
(a) Original (b) Intensidade para classicar indivduos em grupos. Este metodo
e fortemente apoiado no grupo e amostras de trei-
namento. A quanticacao da medida do erro ou
da chance do algoritmo validar corretamente e o
objetivo deste metodo, como visto em [10], [3].
As taxas de falsa rejeicao (False Rejection Rate
FRR) e as taxas de falsa aceitacao (False Accep-
tance Rate FAR) sao um dos metodos estatsticos
utilizados para tracar a Curva ROC. Porem, traba-
(c) Filtrada (d) Rudo residual wk lhos como de [4], [8] tratam diretamente com estes
dados para classicar os grupos com limiares adap-
Figura 2. Pre-processamento em imagem para obter o rudo residual tativos. Mancomunado com esta ultima abordagem,
utilizando a Equacao (1). este trabalho propoe um limiar adaptativo que e
mensurado pelas taxas de FAR e FRR.

109
3. M ETODOLOGIA A DOTADA de um banco de dados externo ou online, o atributo
Esta secao apresenta as principais etapas para Base Externa deve ser preenchido com uma
alcancar os objetivos elencados. descricao desta base.

A. Banco de Dados de Imagens B. Extracao de Atributos


A primeira etapa da metodologia e a aquisicao e Uma vez populado o BD, colhemos n-imagens
armazenamento das imagens capturadas para forma- de cada camera registrada para estimar a nger-
cao do modelo do dispositivo e das imagens investi- print. Foram utilizados dois operadores: (i) a media,
gadas. Nesta etapa denimos alguns aspectos, como seguindo a Equacao (2) e (ii) a mediana. Cada
os dispositivos a serem investigados, quantidade de operador e aplicado em cada ponto correspondente
imagens capturadas, ambiente (urbano, em labo- das n-imagens, que resulta em uma imagem de
ratorio), dentre outros. Podemos denir tambem, de- intensidade, denotada ngerprint.
pendendo da necessidade, se serao usadas imagens C. Processo de Decisao
ja existentes de uma base de dados disponvel.
Apos estimarmos a ngerprint e denimos um
A coleta e armazenamento de imagens de varias
conjunto de m-imagens para treinamento (obtidas
cameras nao e uma tarefa facil e nem muito
do mesmo dispositivo que originou a ngerprint).
economica. Gloe e Bohme [13] criaram o Dresden
Calculamos as correlacoes entre a ngerprint e as
Image Database for Benchmarking Digital Image
m-imagens de treinamento usando a correlacao de
Forensics, que contem mais de 14 mil imagens em
Pearson em blocos 88. O coeciente de correlacao
JPEG e TIFF de cenas variadas, capturadas de 73
de Pearson e dado por
modelos de cameras diferentes. Este banco de dados u
e uma ferramenta de alto valor para a comunidade (xr x)(yr y)
v (X, Y ) =  r=1 (3)
u
forense, pois apresenta uma visao clara do estado r=1 (x r x) 2 (y y)2
r
da arte em identicacao de cameras.
em que
Inspirados pelo trabalho de Gloe e Bohme [13],
u u
nos utilizamos um modelo entidade-relacional para 1 1
x = xr , y = yr
o armazenamento de imagens e informacoes do pro- u r=1 u r=1
cesso de aquisicao. Um Banco de Dados (BD) e uma sao as medias dos blocos referente as imagens
colecao de dados inter-relacionados, representando do rudo padrao da camera X e a imagem de
informacoes sobre um domnio especco e um treinamento Y , respectivamente, no r-esimo pixel e
Sistema Gerenciador de Banco de Dados (SGBD) v = 1, . . . , b, onde b e a quantidade de blocos 8 8
prove ferramentas para acesso a estes dados. das imagens. Em posse das matrizes de correlacoes
A Figura 3 mostra um modelo simplicado do Z , j = 1, . . . , m uma para cada imagem de
j
BD proposto. As entidades sao representadas por treinamento, calculamos o coeciente de variacao
retangulos, os relacionamentos sao representados destas matrizes, que e uma medida de dispersao
Zj
por losangos e os atributos sao as elipses. O relacio- relativa denida por
namento entre um Fabricante e um Modelo ca- sZ
racteriza um Dispositivo. Podem existir varios Zj = j (4)
Modelos para cada Fabricante, assim como Zj
varios Dispositivos com um mesmo Modelo em que sZj e o desvio padrao e Zj a media das
e Fabricante. O Ambiente tem tipo (urbano, matrizes de correlacao Zj .
ceu azul, natural) e uma ag indicando se e indoor Assim, podemos denir um limiar LCi seguro
ou outdoor. As condicoes em que uma imagem para identicar o dispositivo de origem, dado por
foi capturada (camera xa, distancia focal, ash) sao
LCi = Z (3 sZ ) (5)
registradas no relacionamento Condicoes, carac-
terizado pelo relacionamento entre o Ambiente em que sZ e o desvio padrao e Z a media dos
e um Dispositivo. Cada Imagem recebe um coecientes de variacao das Zj , j = 1, . . . , m de
identicador (Id) criptografado. Se a imagem for m-imagens de treinamento.

110
Figura 3. Modelo Entidade-Relacional simplicado do BD usado para registrar dados e imagens de entrada dos experimentos.

Tabela I
A Figura 4 apresenta um diagrama em blocos da FABRICANTES E MODELOS DAS C AMERAS UTILIZADAS NOS
metodologia abordada para identicacao de dispo- EXPERIMENTOS .

sitivos e o processo de validacao.


ID Modelo da Camera Resolucao Nativa
4. E XPERIMENTOS E R ESULTADOS C1 Samsung Galaxy Ace 2560 1920
Nesta secao apresentamos os resultados obtidos C2 Samsung Galaxy X 2592 1944
C3 Motorola EX115 2046 1536
com a metodologia proposta para identicacao de
dispositivos utilizando o rudo residual, que foi
extrado com o processo de ltragem baseado em
wavelet 2-D. das cameras (Tabela I), neste experimento foi 1536
Para validar a proposta, nos registramos no BD da C3 .
20 imagens com resolucao nativa provenientes das Em seguida, obtermos as ngerprints de cada
3 cameras listadas na Tabela I, num total de 60 camera, denotada f1 a obtida pela media e f2 a ob-
imagens. As imagens tiveram uma variacao entre in- tida pela mediana. No experimento, cada ngerprint
door e outdoor, luz natural e iluminacao controlada, e correlacionada com as amostras destinadas para
sem ash, com variacao de zoom em dias claros e treinamento utilizando a Equacao (3).
nublados. Alem disso, nenhuma imagem passou por Ao nal deste processo, utilizando a Equacao (4)
conversao de formatos ou recompressao. obtermos duas tabelas: (i) Na Tabela II apresenta-
Dentre as 20 imagens de cada camera, 10 imagens mos os coecientes de variacao entre a ngerprint
foram utilizadas para extrair o rudo padrao do f1 e todas as amostras para treinamento; (ii) Na Ta-
sensor, 5 imagens para determinar o limiar LCi e bela III sao expostos os resultados obtidos utilizando
as 5 imagens remanescentes foram utilizadas nos a ngerprint f2 .
testes. Com o suporte nestas tabelas (Tabelas II e III) cal-
Realizamos um recorte central quadrado em todas culamos os limiares para cada dispositivo utilizando
as imagens disponveis no BD. A ordem do recorte e a Equacao (5). A Tabela IV apresenta os limiares
igual a menor dimensao dentre as resolucoes nativas para as cameras envolvidas neste experimento.

111
wk = Ik F (Ik ), 1
 n
= n k=1 wk fi
k = 1, . . . , n Fingerprint
Operador i
Rudo residual wk
Camera Ci
n-imagens

X = (xij )M N
Rudo residual

u
(xr x)(yr y)
v (X, Y ) = r=1
Y = (yij )M N Zj = s/, v = 1, ..., b
u LCi = Z (3 sZ )
r=1(xr x) (yr y)2
Rudo residual 2 Coeciente de Variacao
Limiar LCi
Correlacao de Pearson

m-imagens m vezes: conjunto de treinamento.

u
(xr x)(qr q)
Q = (qij )M N
(X, Q) = r=1
u
Z = s/ Teste de
r=1(xr x) (qr q)2
Rudo residual 2 Coeciente de Variacao Hipotese
Correlacao de Pearson Classicacao

t-imagens t vezes: conjunto de imagens investigadas.

Figura 4. Diagrama em blocos da metodologia adotada e o processo de validacao.

Tabela II Tabela IV
C OEFICIENTES DE VARIAC OES Zj OBTIDOS COM A CORRELAC AO L IMIARES DAS C AMERAS ENVOLVIDAS NO EXPERIMENTO .
ENTRE O PADR AO f1 E AS IMAGENS PARA TREINAMENTO .
Cameras LCi da f1 LCi da f2
Amostras Zj da C1 Zj da C2 Zj da C3
C1 65.62769 60.07475 32.21999 25.50330
#1 73.6045246 43.3224565 8.89200948 C2 40.58637 19.39327 19.82283 9.619036
#2 37.1437447 50.7092309 16.4527572 C3 10.98961 9.544547 12.68986 11.44459
#3 52.8831584 37.4681718 9.88767764
#4 84.8770245 35.5886513 10.1710338
#5 79.6299762 35.8433435 9.54454742
limiar LCi (veja Tabela IV) correspondente de cada
Tabela III ngerprint para cada modelo de camera.
C OEFICIENTES DE VARIAC OES Zj OBTIDOS COM A CORRELAC AO Ambos os testes realizados com as ngerprint f1
ENTRE O PADR AO f2 E AS IMAGENS PARA TREINAMENTO .
e f2 foram satisfatorios e obtivemos no melhor caso
uma acuracia de 100% (FAR = 0% e FRR = 0%)
Amostras Zj da C1 Zj da C2 Zj da C3
para as cameras C1 e C3 . Houveram duas falsas
#1 38.0277898 25.4793670 10.3750708 rejeicoes associadas ao padrao da camera C2 pro-
#2 21.9204324 18.0073213 19.4063936
#3 26.2725724 18.3630436 12.1477842 porcionando uma FRR = 13.33%, contudo, nao
#4 42.8895011 17.9749418 10.7467727 houveram falsas aceitacoes (FAR = 0%).
#5 31.9896522 19.2894891 10.7732969
As 2 imagens, que resultaram na falsa rejeicao em
ambos os testes no padrao da camera C2 foram cap-
turadas com um zoom acentuado e, provavelmente,
Submetemos as 15 imagens de teste para validar sua rejeicao esta relacionada a esta caracterstica.
a metodologia proposta. Correlacionamos cada uma Estudos mais profundos devem ser direcionados ao
delas com as ngerprint f1 e f2 das tres cameras entendimento deste fenomeno.
utilizando a Equacao (3). Em seguida, extramos As Tabelas V e VI apresentam uma sumarizacao
de cada resultado o coeciente de variacao Zj . Por dos dados provenientes dos testes com as ngerprint
m, vericamos se cada coeciente esta dentro do f1 e f2 , respectivamente.

112
Tabela V
C OEFICIENTES DE VARIAC OES Zj OBTIDOS COM A CORRELAC AO um FRR = 0%. Chen et. al [8] utilizam o criterio
ENTRE O PADR AO f1 E TODAS AS IMAGENS DE TESTE . de correlacao NeymanPearson e denem as taxas
de erro por uma funcao de probabilidade com limiar
Amostras Zj da C1 Zj da C2 Zj da C3 determinado. Os resultados obtidos foram uma taxa
#1 da C1 40.014724 360.978214 134.552898 de falsa aceitacao em FAR = 105 para todos
#2 da C1 40.865016 208.343016 153.370379 os teste e uma taxa de falsa rejeicao variada por
#3 da C1 33.251045 987.985970 265.912326
#4 da C1 32.707328 228.554239 114.971440 dispositivo investigado.
#5 da C1 32.370200 226.186325 5938.93515
5. C ONCLUS AO
#1 da C2 214.283909 43.605546 292.500198
#2 da C2 167.854468 4523.2382 112.740948 Este trabalho propos uma metodologia para
#3 da C2 215.626974 34.337964 80.5481029 analise forense em imagens digitais que responda
#4 da C2 276.034535 37.349068 331.834290
#5 da C2 259.536631 334.91339 120.501912 a questao: Dada uma imagem, pode-se provar se
ela foi ou nao produzida por uma certa camera ou
#1 da C3 207.305097 84.3339083 8.4803013
#2 da C3 365.319795 318.032940 14.351982 dispositivo digital?
#3 da C3 190.351127 93.5151662 9.1345649 A metodologia proposta foi validada utilizando
#4 da C3 76.3076703 68.6430355 10.360035 o Sensor Pattern Noise e duas ngerprints fo-
#5 da C3 589.618371 132.979152 9.3097546
ram estimadas para cada dispositivo. Como metodo
de organizacao e armazenamento apresentamos
Tabela VI
C OEFICIENTES DE VARIAC OES Zj OBTIDOS COM A CORRELAC AO
um modelo entidade-relacional simplicado, que
ENTRE O PADR AO f2 E TODAS AS IMAGENS DE TESTE . abrange as informacoes das imagens capturadas e
seus respectivos dispositivos.
Amostras Zj da C1 Zj da C2 Zj da C3 Um grande diferencial foi adotar um limiar adap-
#1 da C1 20.645812 723.010023 327.962533 tativo baseado no coeciente de variacao Zj , onde
#2 da C1 18.739010 1386.01104 160.740719 para cada ngerprint existe um intervalo que iden-
#3 da C1 16.212133 783.042479 3815.42664 tica o dispositivo. Nos melhores casos obtivemos
#4 da C1 19.063436 160.647400 128.627354
#5 da C1 16.167803 124.934004 254.222252 100% de acuracia (nas cameras C1 e C3 nas Ta-
#1 da C2 3485.16331 24.227291 143.456115
belas V e VI) e como pior resultado uma taxa de
#2 da C2 237.097587 316.44011 203.522081 falsa aceitacao FAR = 0% com falsa rejeicao de
#3 da C2 332.106203 19.942202 77.8998215 FRR = 13.33% (camera C2 ) para ambos os padroes
#4 da C2 285.208588 16.812953 1245.56721
#5 da C2 4790.17089 330.59364 272.922369
estimados usando 10-imagens. Frente a literatura
obtemos resultados satisfatorios utilizando poucas
#1 da C3 196.266328 161.075700 9.5609000
#2 da C3 2616.05192 176.474426 18.632235
imagens para obter o rudo padrao do sensor.
#3 da C3 12520.0039 82.9365908 10.823300 Com a evolucao desta metodologia espera-se
#4 da C3 58.5053499 72.2391886 11.861742 utilizar um numero ainda menor de imagens para
#5 da C3 1688.85154 139.116071 10.215513
estimar o padrao do sensor. Tendo em vista, que a
aquisicao destas imagens na area forense, em certas
condicoes, pode ser onerosa ou nao ser possvel. Ou-
Fazendo uma analise com os trabalhos de Lukas tros metodos para classicacao devem ser abordados
et. al [4] e Chen et. al [8], enquanto eles utilizam para futuras comparacoes e juncoes de metodos.
300 e 30 imagens de cada camera para obter o Com a analise do erro relacionado as imagens
padrao do sensor, respectivamente, nos extramos com zoom acentuado, iremos direcionar testes mais
o padrao com 10 imagens; um numero alto de focados para avaliar o comportamento do rudo em
imagens, neste caso, diculta a replicacao dos ex- diversas condicoes.
perimentos. Outros passos estao relacionados a ampliacao
Lukas et. al [4] avaliam sua proposta xando a do Banco de Dados para que os dados dos ex-
taxa de falsa aceitacao em FAR = 103 e para perimentos, da etapa de extracao de atributos e
cada camera com um limiar determinado obteve do processo de decisao possam ser registrados e
diferentes taxas de falsa rejeicao e em um unico caso replicados facilmente por outros peritos.

113
AGRADECIMENTOS
Os autores agradecem o apoio nanceiro conce-
dido pelo CNPq atraves Programa RHAE Pesqui-
sador na Empresa (550670/2011-4), assim como,
o suporte nanceiro da FAPEAL pelo Programa
PDT-TI (2010-02). Tais apoios vem viabilizando
os resultados ate entao alcancados nos projetos de
P&D da empresa RASTRU em parceria com a
Universidade Federal de Alagoas.
R EFER ENCIAS
[1] H. Farid, Image forgery detection, IEEE Signal Processing
Magazine, vol. 26, no. 2, pp. 1625, Mar 2009.
[2] T. Bianchi and A. Piva, Detection of nonaligned double
jpeg compression based on integer periodicity maps, IEEE
Transactions on Information Forensics and Security, vol. 7,
no. 2, pp. 842848, Apr 2012.
[3] X. Kang, Y. Li, Z. Qu, and J. Huang, Enhancing source camera
identication performance with a camera reference phase sensor
pattern noise, IEEE Transactions on Information Forensics and
Security, vol. 7, no. 2, pp. 393402, Apr 2012.
[4] J. Lukas, J. Fridrich, and M. Goljan, Digital camera iden-
tication from sensor pattern noise, IEEE Transactions on
Information Forensics and Security, vol. 1, no. 2, pp. 205214,
Jun 2006.
[5] O. Celiktutan, B. Sankur, and I. Avcibas, Blind identication
of source cell-phone model, IEEE Transactions on Information
Forensics and Security, vol. 3, no. 3, pp. 553566, Sep 2008.
[6] C.-T. Li, Source camera identication using enhanced sensor
pattern noise, IEEE Transactions on Information Forensics and
Security, vol. 5, no. 2, pp. 280287, Jun 2010.
[7] J. A. Redi, W. Taktak, and J.-L. Dugelay, Digital image
forensics: a booklet for beginners, Multimedia Tools and
Applications, vol. 51, no. 1, pp. 133162, Jan. 2011.
[8] M. Chen, J. Fridrich, M. Goljan, and J. Lukas, Determining
image origin and integrity using sensor noise, IEEE Transac-
tions on Information Forensics and Security, vol. 3, no. 1, pp.
7490, Mar 2008.
[9] M. Goljan, J. Fridrich, and M. Chen, Defending against
ngerprint-copy attack in sensor-based camera identication,
IEEE Transactions on Information Forensics and Security,
vol. 6, no. 1, pp. 227236, march 2011.
[10] H. Gou, A. Swaminathan, and M. Wu, Noise features for
image tampering detection and steganalysis, in IEEE Inter-
national Conference on Image Processing, vol. 6, Oct. 2007,
pp. VI97100.
[11] C.-T. Li and Y. Li, Color-decoupled photo response non-
uniformity for digital image forensics, IEEE Transactions on
Circuits and Systems for Video Technology, vol. 22, no. 2, pp.
260271, Feb. 2012.
[12] H. Gou, A. Swaminathan, and M. Wu, Robust scanner iden-
tication based on noise features, in Security, Steganography,
and Watermarking of Multimedia Contents, San Jose, CA, Jan.
2007.
[13] T. Gloe and R. Bohme, The dresden image database, Online,
2010, acessado em 17 de julho de 2012. [Online]. Available:
http://forensics.inf.tu-dresden.de/ddimgdb/licenses

114

Anda mungkin juga menyukai