Anda di halaman 1dari 10

Reconocimiento de Patrones y Procesamiento Digital De Imágenes

Facultad de Ingeniería de Sistemas e Informática


Universidad Nacional Mayor de San Marcos

RESUMEN

Es sabido que el reconocimiento autónomo de la madurez de las frutas reviste aún hoy un singular
grado de complejidad, ya que para que una fruta sea considerada de buena calidad, deberá cumplir
ciertas cualidades relacionadas principalmente con el grado de color que presenta cada papaya a
analizar. Por lo tanto el objetivo del presente trabajo será reconocer si una fruta posee o no el
color adecuado.

Mediante la implementación de un software de procesamiento de colores, la fotografía de la fruta


será analizada. La fotografía deberá cumplir ciertos requisitos; deberá ser tomada, usando un
fondo blanco.

Nuestro software mostrara una gráfica del análisis de los colores de la fruta fotografiada, donde
se podrá observar la curva correspondiente a cada fruta y los valores de los colores
correspondientes a cada área de la fruta. El objetivo será reconocer la fruta e indicar el grado de
madurez en la que se encuentra.

Palabras claves: Reconocimiento de papayas, Patrones de reconocimiento, Proceso digital de


Colores.
ABSTRACT

This article will show us a higher processing in papayas than other fruits, but the idea can be used
to apply in futures cases. In consequence we must to deal with a problem, which will be to train
a neural network that is able to recognize if a papaya is ideal to eat, in other words, if the papaya
is mature or not.

In the first step, we select a group of papayas, which will be recognised for the system using
pictures by a digital camera. Then using a processing software, each papaya is associated with its
colors, after that we have all the colors of the papaya, and we start with the training of the neural
network. Finally we finish when we use degrees of grey to predict is the papaya is ready to be
consumed or not. If the neural network trained recognizes adequately the colors of the papaya,
and set in scales of grey, we can say we achieve our aim.

Keywords: Papayas Quiality recognition, Pattern Recognition, Digital Process of Colors.


1. INTRODUCCIÓN
¿Qué es un patrón? Siguiendo la definición Las áreas que corresponden al
de, un patrón es una entidad a la que se le procesamiento de imágenes son: 1)
puede dar un nombre y que está representada Mejoramiento de imágenes con fines
por un conjunto de propiedades medidas y analíticos, y 2) Filtrados de un área de una
las relaciones entre ellas (vector de imagen.
características) [1]. Por ejemplo la imagen
de una cara humana de las cuales se extrae el Una imagen puede ser definida como una
vector de características formado por un matriz bidimensional de intensidad de luz,
conjunto de valores numéricos calculados a las coordenadas son proporcionales al brillo
partir de la misma. El reconocimiento (o nivel de gris) de la imagen en ese punto.
automático, descripción, clasificación y Una imagen también puede considerarse
agrupamiento de patrones son actividades
como una matriz cuyos índices de fila y de
importantes en una gran variedad de
columna identifican un punto de la imagen y
disciplinas científicas, como biología,
sicología, medicina, visión por computador, el valor del correspondiente elemento de la
inteligencia artificial, teledetección. matriz indica el nivel de gris en ese punto.
Los elementos de una distribución digital de
El sistema de reconocimiento de patrones este tipo se denominan pixeles [1] .
tiene los siguientes objetivos:
En la Fig. 1 se puede apreciar las faces o
 Identificar el patrón como miembro etapas necesarias que se deben seguir para
de una clase ya definida. poder hacer un procesamiento de una
 Asignar el patrón a una clase todavía imagen. 𝑎) Captura: diseño de las
no definida
propiedades de la captura. Tipo de cámara,
El diseño de un sistema de reconocimiento distancia al objeto, mega píxeles, etc. 𝑏) Pre-
tiene los siguientes objetivos: procesamiento: reducir el entorno que no es
de interés para el problema. Fondo, ruido,
 Adquisición y procesamiento de
etc. 𝑐) Segmentación: reconocer y extraer
datos.
 Extracción de características. cada uno de los objetos presentes en la
 Toma de decisiones o agrupamiento. imagen. 𝑑) Extracción de características:
seleccionar y extraer “características”
Tradicionalmente, el reconocimiento de apropiadas para la identificación de los
patrones se ha abordado desde un punto de objetos deseados. 𝑒) Identificación de
vista estadístico, dando lugar al llamado objetos: utilizar un modelo de toma de
reconocimiento estadístico de patrones decisiones para deducir a que categoría
(REP), existe una alternativa que se ha
pertenece cada objeto [2] .
revelado como muy prometedora en algunos
casos en que el REP no funciona
Pre- Extracción de
satisfactoriamente. Dicha alternativa son las Captura procesamien
to
Segmentacio
n
característica
s
Identificación
de objetos
Redes Neuronales Artificiales (RNA).
Fig.1. Etapas del procesamiento de imágenes
El trabajo que se presenta a continuación se
centra en el análisis de una imagen en 2. Fundamentos
específico dentro del marco de tratamiento 2.1 Definición de redes neuronales
de imágenes. Se hará una revisión de las
principales técnicas que se emplean para el Son modelos matemáticos construidos
procesamiento de imágenes y también basándose en el funcionamiento de las redes
algunas herramientas que permiten hacerlo. neuronales biológicas (sistema nervioso),
por consiguiente, las unidades de
procesamiento fundamental de una RNA,
serán las neuronas artificiales [2].
Una red neuronal también se ve como un proporcionada de la red con el valor deseado
conjunto de unidades de procesamiento y se obtiene un error el cual permitirá que se
llamados neuronas, células o nodos, puedan ajustar los pesos de las
interconectados entre sí por varias ligaduras interconexiones entre las neuronas.
de comunicación directa llamadas
conexiones, con la finalidad de recibir Aprendizaje no supervisado: Es un método
señales de entrada, procesarlas y emitir de Aprendizaje Automático donde un modelo
es ajustado a las observaciones. Se distingue
señales de salida. Cada conexión está
del Aprendizaje supervisado por el hecho de
asociada a un peso, que representan la
que no hay un conocimiento a priori. En el
información utilizada por las neuronas para aprendizaje no supervisado, un conjunto de
resolver un problema [3]. datos de objetos de entrada es tratado. Así, el
Por su capacidad de aprendizaje las neuronas aprendizaje no supervisado típicamente trata
de los organismos biológicos se han los objetos de entrada como un conjunto
estudiado para su aplicación en sistemas de de variables aleatorias, siendo construido un
modelo de densidad para el conjunto de datos.
aprendizaje automático.
Al igual que las neuronas biológicas están 2.3 Modelos de Perceptrón
conectadas 𝐹𝑖𝑔𝑢𝑟𝑎 1, las redes de neuronas 2.3.1 Perceptrón Simple
artificiales están formadas por elementos
sencillos de cómputo interconectados según En su forma más básica, un perceptrón
diferentes modelos 𝐹𝑖𝑔𝑢𝑟𝑎 2. consiste en una neurona que es capaz de
aprender una función discriminante lineal
𝑓𝑑(𝑋), que permite dividir a dos conjuntos
de entrenamiento linealmente separables.
Su respuesta consiste una suma ponderada
de sus entradas:
𝑛

𝑓𝑑(𝑋) = ∑ 𝑤𝑖 𝑥𝑖 + 𝑤𝑛+1 (1)


𝑖=1

Que representa la ecuación de un hiperplano


en el espacio patrón 𝑛 − 𝑑𝑖𝑚𝑒𝑛𝑠𝑖𝑜𝑛𝑎𝑙.
Figura 1. Representación de una Neurona
Biológica La salida depende del signo de 𝑓𝑑 (𝑋). A la
salida se aplica una función de activación
(escalón, sigmoide, etc.) que indica si se
activa o no la neurona 𝐹𝑖𝑔𝑢𝑟𝑎 3.

Figura 2. Representación de una Neurona Artificial

2.2 Aprendizaje
Aprendizaje supervisado: En este tipo de
aprendizaje se muestra ciertos patrones a la Figura 3. Representación del perceptrón simple
red y una salida deseada para estos patrones,
posteriormente se compara la salida
2.3.2 Perceptrón Multicapa
Dentro de las redes neuronales, las que más proceso, los pesos sinápticos de la red son
utilizadas son las redes con múltiples capas fijos y no se modifican.
que funcionan hacia delante. Esta red está
2.4 Determinar la arquitectura de la
compuesta por un conjunto de nodos de
RED.
entrada que componen la capa de entrada,
un conjunto de una o más capas ocultas de Al margen de la estructura interna de una
neuronas y una capa de neuronas de salida. RNA, para trabajar en el reconocimiento de
La señal de entrada se propaga hacia patrones debemos preocuparnos
adelante desde la capa de entrada por la primeramente por establecer el número de
oculta hasta la salida; este tipo de neuronas en la capa de entrada y el número
configuración se conoce como MLP o de neuronas en la capa de salida.
“MultiLayer Perceptron” 𝐹𝑖𝑔𝑢𝑟𝑎 4.El hecho Considerando a una RNA como una caja
negra podremos representar su interacción
funcional con el entorno de la siguiente
manera 𝐹𝑖𝑔𝑢𝑟𝑎 5.

Figura 5. Caja negra de una Red Neuronal

Los Datos de Entrada estarán en relación


Figura 4. Perceptrón Multicapa biunívoca con las Neuronas de Entrada y los
de que este tipo de red se aplique para Datos de Salida 𝐹𝑖𝑔𝑢𝑟𝑎 6 con las Neuronas
resolver con éxito multitud de problemas se de Salida lo que significa que a una RNA de
debe a la utilización del algoritmo de 𝑛 neuronas en la capa de entrada y m
aprendizaje que actualmente está más neuronas en la capa de salida le
extendido, el algoritmo o regla back corresponderá como Datos de Entrada un
propagation, el cual es una generalización vector 𝑋 de tamaño 𝑛 [𝑋1 , 𝑋2 , … . 𝑋𝑛 ] y
de la regla LMS “Least Mean Square”, por lo como Datos de Salida un vector Y de tamaño
tanto también se basa en la corrección del 𝑚 [𝑌1 , 𝑌2 , … . 𝑌𝑚 ], estableciéndose entre
error. ellos una dependencia funcional que la
podemos llamar RN, y que la podemos
Básicamente el proceso back propagation expresar de la siguiente manera:
consiste en dos pasadas a través de las
[𝑌1 , 𝑌2 , … . 𝑌𝑚 ] = RN [𝑋1 , 𝑋2 , … . 𝑋𝑛 ]
diferentes capas de la red, una pasada hacia
adelante y una pasada hacia atrás. En la
pasada hacia adelante, se aplica en la capa
de entrada un patrón o vector de entrada,
este propaga su efecto a través de las
diferentes capas y como consecuencia
produce un vector de salida. Durante este
Figura 6. Correspondencia entre entradas y salidas.
2.5 Adquisición o Captura de formatos, los campos básicos: el ancho, el
alto, la profundidad en bits y la matriz de
Los medios para la obtención de una imagen pixeles. Por ejemplo para guardar una
digital más comunes son: los scanners de imagen en tonos de gris adquirida de una
cama plana y las cámaras digitales. Se dice fotografía de 2”x3” con una resolución de
que la imagen ha sido digitalizada, ya que 300 dpi y una profundidad en bits de 8, se
por cada región e ella se genera un número requiere un espacio de almacenamiento de:
que representa la cantidad de luz que fue N = (2 x 300)(3 x 300) bytes=5.4 10^5
registrada. En el siguiente diagrama (fig. 2) bytes
se muestra un arreglo de 3 X 3 de Que corresponde aproximadamente a ½
digitalización. Para cada celda de registro se MB.
genera un número que corresponde a la
cantidad de luz que se registró en la zona [3] 2.8 Histograma de una Imagen
[4]. Dada una imagen es posible contar el
número de pixeles que corresponden a cada
tono en cada canal, a la representación
gráfica de esta característica se le llama
(como en estadística descriptiva) el
Fig. 2 Digitalización de una imagen Histograma del canal. Para el caso de
imágenes en tonos de gris solo existe un
2.6 Representación Digital Simple histograma.
La representación más simple de una En la Figura 4, puede notarse que el
imagen es una colección de puntos en un histograma de la imagen presenta dos picos
arreglo bidimensional, donde para cada y está cargado a los tonos claros [5].
punto se almacena una serie de parámetros
propios de la imagen(Fig. 3).

Fig. 3 Arreglo Bidimensional

Muchos de los dispositivos modernos


permiten realizar el registro en
colores, de tal forma que para cada
zona de la imagen se genera un pixel
con tres componentes. Así un color
“cualquiera” se puede expresar
como una combinación lineal de los
colores básicos (Rojo, Azul y
Verde).
C = r R + g G + b B.
Donde podemos interpretar un color
como una combinación lineal de los vectores
unitarios cromáticos
(R, G, B) y las proyecciones en cada eje
cromático o coordenadas del color C son (r,
g, b).

2.7 Almacenamiento
Para almacenar una imagen en disco o Fig. 4 Histograma
memoria se han desarrollado una diversidad
2.9 Segmentación
2.10 Diagrama de Control:
La segmentación de una imagen consiste
Los gráficos de control o diagramas de
en la división o partición de la imagen en
control se utilizan para controlar el
varias zonas o regiones homogéneas y desarrollo de los procesos de producción e
disjuntas a partir de su contorno, su identificar posibles inestabilidades y
conectividad, o en términos de un conjunto circunstancias anómalas.
de características de los píxeles de la imagen
que permitan discriminar unas regiones de En resumen, lo que se pretende con este tipo
otras. Los tonos de gris, la textura, los de análisis es controlar los procesos para
asegurarse de que funcionan correctamente.
momentos, la dirección de los bordes, las
Si la gran mayoría de los puntos mostrados
modas de los tonos de gris en ventanas 3x3,
7x7 y 15x15, etc., son características a de la gráfica están dentro de los límites se
utilizar para la segmentación. considera que el proceso está controlado. En
Distinguiremos entre segmentación el momento en el que uno o varios puntos
completa, cuando las regiones disjuntas aparecen fuera de los límites establecidos o
corresponden directamente a objetos de la no representan una distribución estadística
imagen y segmentación parcial, cuando las gaussiana, se considera que el proceso está
descontrolado y comienza la búsqueda de la
regiones no se corresponden directamente
causa de su mal funcionamiento.
con objetos de la imagen. Para conseguir la
segmentación completa se necesita un nivel 2.11 Entrenamiento de la Red Neuronal
superior de conocimiento que utiliza un
Parámetros de entrenamiento:
conocimiento específico del dominio de la
escena. Este conocimiento de nivel superior  Neurona Intermedia: 200
puede ser, por ejemplo, que los objetos de la  Bias: Si
imagen corresponden a caracteres numéricos  Ratio: 0.0009
o letras de un alfabeto. Los métodos de  Momento: 0
segmentación se pueden agrupar en cuatro  a: 0
clases diferentes:  c: 0
 error: 10%
a) Métodos basados en píxeles, que a  etapas: 300
su vez pueden ser:
- locales (basadas en las propiedades
Curva de Resultado de
de los píxeles y su entorno) entrenamiento:
- globales (basadas en la información
global obtenida, por
- ejemplo, con el histograma de la
imagen).
b) Métodos basados en bordes.
c) Métodos basados en regiones, que
utilizan las nociones de homogeneidad y
proximidad geométrica, como las técnicas
de crecimiento, fusión o división.

d) Métodos basados en modelos. Antes de


pasar a estudiar cada uno de estos modelos
vamos a ver técnicas para la detección de
puntos, rectas, bordes y contornos, como
herramientas previas.
3. Información

3.1 Selección de imágenes de las papayas

Fig. 5 Papayas de diferentes tamaños y colores

Estas imágenes nos proporcionaran una entrada para el análisis y reconocimiento de la


madurez de las papayas (Fig. 5), pero nótese que no importa la forma de la papaya, pues
nosotros vamos a reconocer si una papaya es consumible por el color que este tiene, y la
papaya nos ayuda con sus colores si está maduro o no.

3.2 Selección de imágenes de las papayas

La interpretación que tenemos, nosotros los humanos, es la capacidad de visualizar una


imagen a través del sentido de la vista e interpretar dicha imagen mediando un proceso
mental.

Por otro lado la propuesta en este artículo consiste en que la computadora por medio de
la aplicación que usa las imágenes de una cámara digital sea capaz de reconocer una
papaya y usando el procesamiento de imágenes logre interpretarlo (Fig. 6).

a. Se captura la imagen de un mango mediante una cámara digital.

Fig. 6 Imagen de una papaya

b. Se asigna una matriz con cuadriculas lo suficientemente pequeñas, para que contenga
la imagen de la papaya. Para nuestro caso vamos a trabajar con una matriz de 50x50,
tendremos en cuenta que no importa la calidad de la imagen, si es grande o no, pues
siempre se va a escalar a la dimensión dicha (Fig. 7).

Fig. 7 Imagen de una papaya con una matriz asociada


c. Mediante un programa de procesamiento de colores, se obtiene los colores que le
pertenece a cada una de las columnas de la matriz, una vez obtenido los valores de
la columna de la matriz, se procede a sacar una media de estos y nos mostrara un
valor de color que será mostrado en una gráfica(Fig. 8).

Valor del
Color (120) r

Fig. 8 Imagen del color de una parte de la papaya

d. Se generara una gráfica con los datos que se obtuvo de la matriz indicando, los
colores de cada uno (Fig. 9).

Fig. 9 Grafica de los datos obtenidos de la matriz,

3.3 Reconocimiento de madurez de la papaya usando procesamiento digital de


imágenes.

3.3.1 Dependencia Funcional entre los datos de entrada y salida.


Para trabajar en el reconocimiento de la papaya, debemos preocuparnos
primeramente de establecer el número margen en la escala de color (0-255) para
reconocer cuando la papaya está madura o no. Por lo tanto los datos de entrada estarán
analizados por medio de un histograma que mostrara el promedio del color de cada
columna de la matriz de pixeles y los datos de salida será la respuesta del sistema
(maduro- pre maduro).
Por lo tanto, para el reconocimiento de la madurez de la papaya, tendremos la
siguiente dependencia funcional (Fig. 10).
3.4 Resultado del Sistema:

4. Conclusiónes

 En el presente artículo hemos presentado un modelo simple de visión artificial el


cual puede ser aplicado a otros campos tales como la medicina, biología u otros.

 Este resultado no pudo haber sido posible sin un software que nos permita el
procesamiento de imágenes y colores, el mismo que nos ha permitido obtener el
promedio de color de las frutas, indicándonos su tipo y su estado.
5._ Referencias

[1] S.Watanabe, «Pattern Recognition: Human and Mechanical,» Wiley, New York, 1985.
[2] M. V. Hilera J, « Redes neuronales artificiales:,» Addison-Wesley Iberoamericana,
Madrid, 1995.
[3] L. A. Loayza, «Reconocimiento de patrones mediante redes,» San Marcos, Lima, Perú,
2012.
[4] G. RC, «Tratamiento digital de imágenes,» Addison-Wesley Publishing Co, ,
Washington, 1996.
[5] L. U. R. C. Dra. Nora La Serna, «Técnicas de Segmentacion en Procesamiento Digital
de Imágenes,» San
[6] G. RC, «Tratamiento digital de imágenes,» Addison-Wesley Publishing Co, ,
Washington, 1996.
[7] L. U. R. C. Dra. Nora La Serna, «Técnicas de Segmentacion en Procesamiento Digital
de Imágenes,» San Marcos, Lima, 2009.
[8] W. R. González R., «Digital Image Processing,» Prentice Hall, 2004..
[9] L. A, «Introductory Computer Vision and Image Processing,» de McGraww – Hill,
1991..
[10] V. W. Murray J. D., de The Encyclopedia of Graphics File Formats, 1996..
[11] A. M. M. P. A. M. Omid Omidi Arjenaki, ««A new method for estimating surface area
of cylindrical fruits (zucchini) using digital image,» Department of Agricultural Machinery
Engineering, Faculty of Agriculture, Urmia University, Urmia, P.O. Box:165, Iran, 2012.

Anda mungkin juga menyukai