Kl 1
vCl (n) cl (i) u 2Cl 1 (kl 1 , n i)
kl 1 1 i Sl
(5)
5. Experimentos
13x13
13x13 7x7 7x7
3x3
Tabela 1. Resultados do experimento 1.
13x13 7x7
20x20 3x3 Configuração REC NREC ERRO
Figura 3. Estrutura da rede utilizada para 01: Classe 0 81,82% 18,18% -
realização dos experimentos 02: Classe 1 90,91% 9,09% -
03: Classe 2 27,23% 72,72% -
04: Classe 3 100% 0% 3,03%
Para a realização do treinamento foram escolhidas
05: Classe 4 100% 0% 3,03%
dez classes de padrões com dez padrões cada. O 06: Classe 5 81,82% 18,18% -
treinamento foi realizado com a entrada da imagem da 07: Classe 6 81,82% 18,18% -
região facial de 57x57 pixels na rede neocognitron, 08: Classe 7 100% 0% -
resultando na obtenção de um vetor de características, 09: Classe 8 100% 0% -
conforme mostra o diagrama da figura 4. O vetor de 10: Classe 9 81,82% 18,18% -
características é composto do conjunto de todos os
pesos variáveis, pesos-a e pesos-b, da rede neocognitron Como pode ser visto na Tabela 1 nas configurações
resultante. da classe 3, 4, 7 e 8 foi obtida uma taxa de 100% de
reconhecimento, ou seja, nessas configurações todos os
padrões pertencentes à classe foram reconhecidos
quando utilizadas suas configurações correspondentes.
Apenas as configurações 4 e 5 obtiveram padrões não-
pertencentes à classe sendo reconhecido como
pertencente, sendo que a porcentagem encontrada
refere-se a classificação de 3 padrões, erroneamente,
Figura 4. Diagrama da fase de treinamento.
num universo de 99 padrões não pertencentes à classe. rede em reconhecer padrões distorcidos mesmo com a
A configuração 03 obteve menor taxa de utilização de padrões não-treinados durante a fase de
reconhecimento, sendo que a porcentagem encontrada reconhecimento. Esses resultados podem ainda serem
refere-se a oito padrões num universo de 11 padrões melhorados, pelas mesmas razões descritas, com a
pertencentes à classe. utilização de maior número de padrões de treinamento,
Experimento 2 – consiste no resultado da aplicação e também com a diminuição do limiar de disparo, usado
de padrões não utilizados durante o treinamento da rede no treinamento.
na operação de reconhecimento das classes.
8. Agradecimentos
Tabela 2. Resultados do experimento 2.
Configuração Reconhecimento do padrão
não-treinado
Os autores agradecem a Fundação de Amparo à
01 Sim Pesquisa do Estado da Bahia (FAPESB) pelo apoio
02 Sim financeiro concedido.
03 Não
04 Sim 9.Referências
05 Não
06 Não [1] Lecun, Y. and Bengio, Y. “Convolutional Networks for
07 Sim Images, Speech and Neural Networks”, In: ARBIB, M. A.
08 Sim (Editor) The Handbook of Brain Theory and Neural
09 Sim Networks. 2ª ed. Cambridge: M.I.T. Press. 2003, pp. 276-279
10 Não (Série Bradford Books).
A tabela 2 apresenta os resultados obtidos neste [2] Fukushima, K. “Neocognitron: A self-organizing neural
segundo experimento em que foram obtidos 60% de network model for a mechanism of pattern recognition
reconhecimento dos padrões não apresentados durante o unaffected shift in position”. Biological Cybernetics, v.36, n.
treinamento restando 40% para os padrões não- 4, pp. 193-202, 1980.
reconhecidos.
[3] Fukushima, K “Neocognitron: A model for visual pattern
recognition”, In: ARBIB, M. A. (Editor) The Handbook of
7. Conclusões Brain Theory and Neural Networks. 2ª ed. Cambridge: M.I.T.
Press. 2003, pp. 715-719 (Série Bradford Books).
Com este trabalho a rede neocognitron mostrou-se
viável para a tarefa de reconhecimento de imagens [4] Neubauer, C. “Evaluation of Convolutional neural
faciais. networks for Visual Recognition” IEEE Transactions on
Neural Networks, v. 9, n. 4, pp. 685-696, 1998.
Observa-se que os resultados devem ser melhorados
com a utilização de maior número de padrões de [5] Saito, J. H.; Carvalho, T. V.; Hirakuri, M.; Saunite, A.;
treinamento por classe, fazendo com que a rede consiga Ide, A. N. and Abib, S.” Using CMU PIE Human Face
extrair maior número de características de cada classe, Database to a Convolutional Neural Network –
resultando numa representação mais adequada. Neocognitron”. European Symposium on Artificial Neural
A configuração 03, conforme tabela1, apresentou Networks. Bruges, pp. 491-496 2005.
maior taxa de erro de classificação que pode ser
explicada pela complexidade da imagem frente às [6] Sim, T.; Baker, S. and Bsat, M. “The CMU Pose,
demais devido a existência de barba e óculos no Illumination and Expression Database”. IEEE Transaction on
Pattern Analysis and machine Intelligence, v. 25, n. 12, pp.
indivíduo representado pela classe 2 da base CMU-PIE
1615-1618, 2003.
podendo obter melhores resultados com a diminuição
do limiar de generalização utilizado durante a fase de [7] LI, Z. S. and JAIN, A. K. “Chapter 1: Introduction.” . In:
treinamento fazendo com que a rede seja capaz de _______. Handbook of Face Recognition. New York:
realizar melhor generalização do padrão apresentado. Springer, 2005. p. 1-11
Observou-se ainda que a rede obteve bons resultados
no segundo experimento, confirmando a habilidade da