Computadora o mdulo de proceso: es el sistema que analiza las imgenes recibidas por el sensor para extraer la informacin de inters en cada uno de los casos
implementando y ejecutando los algoritmos diseados para la obtencin de los objetivos.
Computadora (CPU o
mdulo de proceso)
Tarjeta
Adquisidora
Fuente de luz
(iluminacin)
Cmara
y lentes
Algoritmos de
procesamiento
Interfase
Actuadores
externos
del proceso
Fuentes de luz
La fuente de luz es un factor de vital importancia en los sistemas de visin artificial y afectan de forma crucial a los algoritmos de visin que se vayan a utilizar bajo esas condiciones. Una iluminacin arbitraria del entorno no suele ser aceptable ya que muy probablemente se obtengan imgenes con un bajo contraste, reflexiones especulares, adems
de sombras y detalles espurios. Los objetivos de una iluminacin adecuada son, bsicamente, independizar las condiciones del entorno y resaltar los rasgos de inters de una
determinada aplicacin.
Tipos de iluminacin
A continuacin slo se enuncian los diferentes tipos de iluminacin. En el apunte
Tipos de Iluminacin.pdf se pueden encontrar los detalles acerca de las tcnicas de iluminacin ms comunes y generalmente usadas.
Sensores de imagen
Los sensores de imagen son componentes sensibles a la luz que modifican su seal elctrica en funcin de la intensidad luminosa que perciben. La tecnologa ms habitual en
este tipo de sensores es el CCD (charge coupled devices o dispositivos de acoplamiento
de carga) donde se integra en un mismo chip los elementos fotosensibles y el conjunto de
puertas lgicas y circuitera de control asociada. En stos, la seal elctrica que transmiten los fotodiodos es funcin de la intensidad luminosa que reciben, su espectro, y el tiempo de integracin (tiempo durante el cual los fotodiodos son sensibles a la luz incidente).
Otra tecnologa que est empezando a extenderse son los sensores CMOS (complementary metal oxide semiconductor) dada las ventajas de stos sobre los CCD, y la reduccin
de precios de estos dispositivos. En cuanto al rango dinmico (rango de amplitud entre los
valores mximos y mnimos que un elemento puede producir, medido en decibeles) se pasa de los 70dB de los sensores CCD a los 120dB de los sensores CMOS, valor ms cercano a los 200dB del ojo humano, lo que facilita la autoadaptacin en el propio chip al brillo existente en el entorno. El sensor CMOS puede amplificar de forma individual la respuesta de los pxeles en funcin de sus respectivas condiciones de iluminacin. El acceso
multipxel permite configurar individualmente distintos intervalos de tiempo de integracin,
mejorando la calidad de imagen mediante la seleccin del mejor tiempo de exposicin de
cada pxel.
Resolucin
Existen diferentes arquitecturas de sensores. En primer lugar estn los sensores lineales. En stos, el sensor es una lnea de fotodiodos. Esta arquitectura permite la utilizacin
de sensores de 1x1024, 1x2048, 1x4096, e incluso 1x6000 pxeles, lo que la hace muy adecuada para trabajar con altas resoluciones sobre superficies en movimiento. Para condiciones de iluminacin muy exigentes o velocidades de trabajo muy altas existe la posibilidad del uso de sensores TDI (time delay integrated). Esta tecnologa consiste en el uso
de varias lneas de captura sobre la misma lnea del objeto, con el fin de sumar su carga y
obtener as una mayor sensibilidad. En segundo lugar estn los sensores de rea. Estos
alcanzan resoluciones habituales de 1024x1024, aunque existen en el mercado algunas
casas que disponen de cmaras especiales con resoluciones de hasta 3072x2048. En este caso existen tecnologas de adquisicin de imgenes, entrelazada y no entrelazada. El
mtodo entrelazado captura las lneas pares e impares que forman una imagen en instantes de tiempo diferentes. La tecnologa de no entrelazado (progressive scan) captura todas las lneas en el mismo instante de tiempo. Es ms costoso econmicamente, pero indispensable para trabajar con objetos en movimiento.
Cuantizacin
Independientemente de la arquitectura utilizada, existen otros aspectos importantes en
estos sensores. La cuantizacin (conversin analgica-digital) determina el nmero de
bits usados para representar la informacin capturada. Por ejemplo, usando un sistema
blanco y negro de 8 bits tenemos 256 niveles diferentes mientras que, usando un sistema
de 10 bits, obtendramos 1024 niveles de gris diferentes, lo que permite una mayor definicin.
La evolucin de las capacidades y caractersticas tcnicas de estos dispositivos ha seguido una tendencia muy favorable, potenciado en parte por el mayor uso industrial de estos sistemas. Por tanto, en el mercado existen hoy en da numerosos dispositivos para a-
bordar cualquier tipo de aplicacin, ya sea en blanco y negro o color, a las velocidades requeridas en los procesos de produccin.
Entre los avances ms significativos, adems de la utilizacin de puertos de comunicacin cada vez ms potentes y fiables, est una capacidad de proceso ms o menos relevante e integrada en la propia cmara. Por ejemplo, la cmara lineal OPSIS 5150ALC dispone de FPGA (Field-programmable gate array, matriz de puertas programable por campo) programable y de un microprocesador Motorola Power PC con sistema operativo en
tiempo real VxWorks que permite realizar procesamiento de imgenes. De esta forma se
puede transmitir la imagen, la imagen preprocesada, o los resultados del procesamiento
de la imagen a travs de los puertos de comunicacin de que dispone la cmara, haciendo innecesario el uso de tarjetas de captura.
Segmentacin
Clculo de
caractersticas
Clasificacin
Seleccin de
caractersticas
Diseo del
clasificador
Implementacin
Diseo
Filtrado o Pre-procesamiento
Cuando se adquiere una imagen mediante cualquier sistema de captura, por lo general
esta no es directamente utilizable por el sistema de visin. La aparicin de variaciones en
intensidad debidas al ruido, por deficiencias en la iluminacin, o la obtencin de imgenes
de bajo contraste, hace necesario un preprocesamiento de la imagen con el objetivo fundamental de corregir estos problemas, adems de aplicar aquellas transformaciones a la
imagen que acenten las caractersticas que se deseen extraer de las mismas, de manera
que se facilite las operaciones de las etapas posteriores. A este campo pertenecen las
tcnicas de transformaciones geomtricas, las basadas en el histograma, el filtrado espacial (apunte Filtrado Espacial.pdf) y el filtrado frecuencial (apunte Filtrado en el dominio de la frecuencia.pdf). Aunque existen lneas de investigacin abiertas, no es el
campo ms activo en ese sentido, y las tcnicas existentes son bastante tiles para la mayora de las aplicaciones.
Algunas de las tcnicas ms habituales son:
Transformaciones geomtricas: los objetivos de sta son la correccin de la perspectiva y la reconstruccin tridimensional de los objetos de la escena.
Transformacin del histograma: las transformaciones del histograma pueden facilitar la segmentacin de objetos de la imagen, aunque habitualmente slo sirve para
modificar el contraste de la imagen y el rango dinmico de los niveles de gris.
Filtrado espacial y frecuencial: dado que pueden suponer una importante modificacin de la imagen original, generalmente slo se consideran filtrados aquellas operaciones realizadas en el dominio espacial o frecuencial que suponen transformaciones pequeas de la imagen original.
Aplicacin de umbrales de niveles de gris (apunte Segmentacin por umbralizacin - Mtodo de Otsu.pdf).
Agrupacin por rasgos comunes.
Extraccin de bordes.
Sean discriminantes, es decir, tengan valores numricos diferentes para clases diferentes.
Sean fiables, es decir, tengan valores parecidos dentro de una misma clase.
Dado que las caractersticas relevantes son a menudo desconocidas a priori, habitualmente se introducen muchas caractersticas candidatas para intentar representar mejor
las clases, an cuando muchas de ellas puedan ser parcial o completamente redundantes
o irrelevantes. No obstante, existen unas tcnicas para mejorar las prestaciones del conjunto de caractersticas escogido inicialmente. stas estn ntimamente ligadas al reconocimiento de formas en su etapa de diseo del clasificador.
Reconocimiento de formas e inteligencia artificial
Normalmente, la visin artificial se utiliza para tomar decisiones a partir de la informacin proporcionada por el sistema de adquisicin de imgenes y las transformaciones y operaciones realizadas con ellas. La informacin extrada se puede considerar como un
vector que recoge las caractersticas o rasgos diferenciadores de la imagen analizada. En
el caso de que se trate de una aplicacin de medicin, este vector recoge todas aquellas
medidas que se deseaban obtener. En aplicaciones de inspeccin, y sobre todo, en aplicaciones de clasificacin, este vector es el conjunto de datos con los que ha de trabajar
un reconocedor o clasificador encargado de extraer las conclusiones posibles a partir del
vector de entrada. Para el diseo del clasificador es necesaria una etapa de seleccin de
caractersticas y una etapa de aprendizaje o entrenamiento. Generalmente, se usa el propio clasificador como evaluador del conjunto de caractersticas en prueba dado que el mtodo que proporciona la mayor fiabilidad, aunque sea el ms costoso temporalmente y de
menor generalidad o capacidad de aplicacin del clasificador a otros problemas. Respecto
a los mtodos clsicos de bsqueda secuencial, actualmente uno de los campos de investigacin abiertos es el uso de algoritmos genticos para la seleccin en paralelo de caractersticas.
En el reconocimiento de formas aplicado a la visin artificial se utilizan tcnicas de reconocimiento geomtrico de formas, como el aprendizaje supervisado (se conoce la clase
a la que pertenece cada vector) en condiciones estadsticas o algoritmos de clasificacin
no supervisados o clustering y, adems, las redes neuronales, siendo estas ltimas especialmente interesantes por su capacidad de aprendizaje adaptativo. Existen numerosos algoritmos para cada una de estas tcnicas y se investiga ampliamente el desarrollo de
nuevos algoritmos e implementaciones hardware de stos. El problema fundamental de
estas tcnica, es que cada una de ellas suele ser la ms adecuada para las caractersticas de un tipo especfico de problema no conocidas a priori, lo que dificulta la seleccin
de la tcnica con la que se desea abordar inicialmente el problema.
po real. Es, pues, la parte del sistema encargada de implementar las funciones y objetivos
para los que se haya diseado el sistema.
Los altos requerimientos computacionales de esta tecnologa no se pueden especificar
de una forma genrica. Un ejemplo demostrativo de estos requerimientos es el del reconocimiento automtico de matrculas mediante una cmara de 8 bits y una resolucin de
640x480 (307.200 pxeles). En esta aplicacin se necesita una etapa de filtrado, una binarizacin que convierta la imagen de 256 niveles de gris a slo 2, una de segmentacin
que asle cada caracter de la matrcula y una de clasificacin. Las operaciones necesarias
se resumen en la siguiente tabla:
Comparaciones
Sumas y restas
Multiplicaciones
Divisiones
Op. en coma
flotante
Total
Filtrado
Binarizacin
Segmentacin
Clasificacin
0
307.200
1.229.310
0
2.457.600
0
1.510
3.304
0
0
0
129.857
307.200
0
1.000
0
0 2.764.800
0
307.200
0 1.231.820
417
133.578
Total
1.536.510
2.462.414
129.857
308.200
417 4.437.398
Si se tiene en cuenta que el sistema ha de trabajar en tiempo real, capturando para ello 30 imgenes por segundo, se necesita una capacidad de clculo de 133.121.940 instrucciones por segundo (133 MIPS). Teniendo en cuenta que el ejemplo comentado es una aplicacin relativamente simple, podemos comprender los altos requerimientos computacionales para el uso de estas tcnicas.
Quizs sea este el campo que ms rpidamente ha evolucionado, debido al uso generalizado de este tipo de sistemas en todos los campos. La rpida evolucin de los procesadores de propsito general ha desbancado la utilizacin de procesadores especializados (ms caros y de una evolucin ms lenta por la demanda del mercado), excepto para
casos muy concretos. Por tanto, la potencia de los procesadores actuales, junto con las
arquitecturas hardware y software que soportan los sistemas multiprocesadores, permiten
el desarrollo de algoritmos complejos con tiempo de respuesta muy cortos y dentro de los
requerimientos de las aplicaciones en tiempo real.
Entre las mejoras ms destacadas podemos mencionar:
Sistemas de respuesta
Se trata de automatismos que responden electromecnicamente con el fin de corregir
o evitar, por ejemplo, en los sistemas de produccin, las causas generadoras de los problemas de deteccin. Otra de las funciones de estos sistemas es la generacin de estadsticas e informes de del proceso al que estn asociados, lo que permite disponer de una
informacin global de los procesos para facilitar la toma de decisiones.
En cuanto a los dispositivos electromecnicos utilizables en los sistemas de visin,
destacan los variadores de frecuencia para el control de motores y la comunicacin entre
las PCs y los autmatas programables que gestionan los distintos dispositivos mediante
redes de campo como Profibus o WorldFIP, y ms recientemente mediante Industrial
Ethernet, y protocolos Wireless. Estos buses permiten la integracin de los sistemas de
visin y sus acciones de respuesta dentro de la estructura CIM de las empresas, lo que
supone un ahorro econmico en los casos en que ya se disponga de esta estructura.
10
La fuente de luz, el difusor y la cmara se integraron mediante una estructura (campana) rgida. Para favorecer la difusin de la luz aportada por los LEDs, la estructura se pint interiormente de color blanco mate.
La primera estructura de iluminacin desarrollada fue complementada con un lente de
4mm instalado en la Smart-camera. Luego de observar las imgenes obtenidas con esta
estructura, se observ que sta no brindaba un iluminacin uniforme: era ms intensa en
el centro de las imgenes. Por este motivo se debi redisear la estructura eliminando las
terminaciones en ngulos rectos. En esta segunda estructura se observ una mejora en la
distribucin de luz.
La utilizacin de un lente de 4mm gener una importante deformacin geomtrica de
la imagen. Para reducir este efecto no deseado, se decidi su reemplazo por un lente de
8mm. El cambio de lente implic que la segunda estructura deba ser rediseada para una
nueva distancia cmara-objeto de 42.7cm, dando paso a la creacin de la tercera estructura de iluminacin.
En las imgenes captadas usando la tercera estructura se observ que las deformaciones geomtricas se redujeron notablemente. Esto fue sumamente beneficioso para lograr mayor simplicidad y robustez en la etapa de procesamiento.
A pesar de haberse obtenido unas imgenes muy adecuadas para el procesamiento,
esta tercera estructura debi ser rediseada una vez ms. Este cambio se debi a que,
por cuestiones operativas y de espacio, el tamao de la estructura (que se ubica sobre la
mesa de amasado de la blistera) debi ser reducido.
El diseo de la estructura definitiva tuvo en cuenta un sistema de montaje robusto para
la cmara, que la asle de los cambios de luz del entorno y la resguarde mecnicamente.
Software. Algoritmos de anlisis de imagen
El software est integrado por una lgica de control y anlisis y una interfase hombremquina.
Para el funcionamiento del sistema, el software requiere de la determinacin de varios
parmetros. Por ello, se configur de modo que como primera instancia, luego del arranque automtico, se carguen automticamente dichos parmetros desde un archivo de
configuracin almacenado en el disco de la Smart-camera.
Como se mencion, para el procesamiento y anlisis de las imgenes se eligieron las
funciones contenidas en la librera mvIMPACT-SDK de Matrix Vision.
En la figura 3, 4 y 5 se pueden ver diferentes diagramas de flujo que muestran esquemticamente la forma en que trabaja el software.
11
Encendido de la Smart-camera
Inicio automtico del sistema
Carga de la configuracin del sistema
Almacenamiento de la imagen con fondo blanco
Imagen en Vivo
Configurar
Analizar?
Configurar
Analizar
Captura de Imagen
Rutina
Configuracin
Rutina Anlisis
Carga configuracin
Graba
Configuracin
SI
Detener?
Rutina Anlisis
NO
Detecta
Pulso?
NO
Rutina Configuracin
SI
Captura Imagen
Realiza Anlisis
Genera / Actualiza
estadsticas
12
Imagen en Vivo
Captura Imagen
Compensacin de Iluminacin
Calcula Histograma
Segmenta Imagen
Procesa Imagen
Analizar Imagen
Guarda Configuracin
13
14
En base a las caractersticas de las fallas que se pretenden detectar, se comprob empricamente que este conjunto de parmetros otorgaba una gran confiabilidad requiriendo
un tiempo de procesamiento reducido.
Definicin de los parmetros:
rea (AREA): es el nmero de pxeles blancos en un objeto. El nmero de pxeles es
multiplicado por el valor del rea del pxel. Los agujeros no contribuyen para el rea.
Factor de forma (ROUDNESS): este valor es derivado del permetro y el rea de un
objeto. Este parmetro tiene un rango de valores de 0 a 1. Un objeto circular tiene el mximo valor del rango (1) y para objetos irregulares o alargados el parmetro tiende al mnimo valor del rango (0). Su ecuacin es:
4 . Area
Roudness =
Perimetro 2
Coordenadas del rectngulo perimetral (EXTREME_BOX): especifica la mxima y la
mnima coordenada de un objeto (bounding box). Las coordenadas son retornadas en dos
puntos en las unidades especificadas: el punto superior izquierdo (XMIN,YMIN) y el punto
inferior derecho (XMAX,YMAX). De modo que:
ancho = X Max X Min + 1
YMAX,YMIN
Guardo Configuracin: los parmetros extrados del anlisis de la imagen patrn son
guardados en un archivo en el disco de la cmara con extensin txt. Los datos que se
guardan son los siguientes: nmero de alvolos; rea mnima y mxima; factor de forma
mnimo y mximo; valor del umbral; flag de descarte por comprimido fallado, ausente y
manchado; tipo de fondo; coordenadas del rectngulo perimetral de cada alvolo; nmero
de calles; y posicin de las calles.
El valor del umbral se calcula en forma automtica y es un parmetro altamente afectado por las variaciones en la iluminacin. Por este motivo, es muy importante que el sistema de iluminacin implementado permita un aislamiento adecuado del sistema a las variaciones externas de la luz, y que a su vez otorgue una iluminacin constante y uniforme
sobre la zona de anlisis.
15
Imagen en Vivo
SI
Detener?
Carga Configuracin
NO
Detecta Pulso
Captura Imagen
Compensacin de Iluminacin
Segmenta Imagen
SI
ltimo?
Procesa Imagen
NO
Funcin Control
Descarte?
NO
SI
Genera Seal de Descarte
16
17
Resultados obtenidos
Durante las pruebas de funcionamiento, el sistema present una muy buena respuesta en la deteccin de comprimidos ausentes, manchados y calados.
18
A continuacin se presenta un ejemplo de la puesta a prueba del sistema con una tanda de blisteado en el que se forzaron diferentes casos de comprimidos defectuosos.
Total
Total
Total
Total
Total
Total
Total
comprimidos
comprimidos
comprimidos
comprimidos
comprimidos
comprimidos
comprimidos
analizados
OK
NoOK
ausentes
fallados
manchados
superpuestos
640
621
19
6
10
2
1
Referencias
1) AITEX Instituto Tecnolgico Textil, Anlisis de la tecnologa de visin artificial
aplicada al sector textil.
http://www.aitex.es/estudios/Vision_Artificial1.pdf
2) Iris Herrero, Control de Blisters mediante Visin Artificial, Informe del Proyecto
Final de la carrera de Ingeniera en Automatizacin y Control Industrial de la Universidad
Nacional de Quilmes.
Aspectos de un Sistema de Visin Artificial
19