Anda di halaman 1dari 59

Caracterizacin de Imgenes

Ing. Cristian Alejandro Torres Valencia


El reconocimiento de patrones u objetos dentro
de una imagen es una parte fundamental en el
procesamiento de imgenes, para dicha tarea de
clasificacin, es de vital importancia realizar una
correcta extraccin de caractersticas que
discriminen de la mejor manera cada objeto y
conlleven as al uso de clasificadores menos
robustos y costosos computacionalmente.
Hay infinidad de formas de realizar una
caracterizacin de objetos o regiones dentro de
una imagen, diversos enfoques, usando
caractersticas globales o locales del objeto, o la
combinacin de ambas. A continuacin se
presentan algunos tipos de caracterizacin de
objetos en imgenes.
La transformacin de una seal ofrece una
representacin alternativa, que revela caractersticas
que en el dominio original son muy difciles o
sencillamente imposibles de detectar. Aunque la
transformada de Fourier ha sido el soporte principal
en el procesamiento de imgenes basado en
transformada desde finales de 1950, otro tipo de
transformada llamada wavelet hace mucho ms fcil
analizar, transmitir y comprimir muchas imgenes.
En los aos 88 y 89, los trabajos de Daubechies,
que construy wavelets de soporte compacto, y
Mallat, que estableci la conexin con el
procesado discreto de la seal, determinaron la
gran difusin de la transformada wavelet en el
mbito del procesado de imgenes. Ms
adelante a comienzo de los 90 Coifman introduce
la transformada de paquete wavelets.
Desde el punto de vista del procesamiento de
imgenes se definen a los wavelets como funciones
que forman una clase general de filtros que cumplen
una serie de propiedades. Esto nos aproxima la
codificacin de wavelets a un tipo de codificacin
por sub-bandas, en la que una seal al aplicarle
distintos filtros, puede descomponerse en mltiples
bandas. De forma general los wavelets son funciones
generadas a partir de una funcin base, mediante
dilataciones y traslaciones de esta funcin que
satisface ciertos requisitos.
Anlogamente a la transformacin de Fourier, tambin para las
transformadas wavelet existen tres tipos posibles: transformada
continua wavelet (CWT), expansin en serie wavelet y
transformada discreta wavelet (DWT). Las funciones base de la
transformada wavelet puede o no ser ortonormales, a diferencia
de las otras transformadas normalmente tratadas. Esto conduce
a que la situacin posea un tratamiento ligeramente ms
complicado, ya que es posible que una funcin de ancho de
banda limitado sea representada por una expansin en serie de
wavelet de infinitos trminos. Puede adems presentarse el
caso que una transformada discreta wavelet necesite un nmero
de coeficientes superior al nmero de muestras de la funcin de
entrada.
Algunas propiedades son las siguientes:
1. Los wavelets son bloques constructores de
funciones.
2. Los Wavelets tienen localizacin espacial y
frecuencial.
3. Los algoritmos basados en wavelets son
rpidos.
La naturaleza del anlisis wavelet, al descomponer seales en
distintas bandas de frecuencia, es especialmente adecuado
cuando tratamos con imgenes porque:
1. Las imgenes naturales tienden a tener un espectro de
frecuencia ms uniforme, con la mayor parte de la energa
concentrada en las frecuencias ms bajas. De manera que se
consigue una alta compactacin de la energa.
2. De acuerdo con el sistema de visibilidad humano, la
visibilidad del ruido tiende a disminuir a altas frecuencias, lo
que permite ajustar el nivel de distorsin introducido por la
compresin.
Transformada Continua Wavelet
Si (x) es una funcin real cuyo espectro de Fourier (f) satisface el siguiente criterio de admisibilidad.
entonces (x) se denomina wavelet madre. Ntese que dado que la variable f est presente en el
denominador del integrando, se hace necesario que:
Adems, como ()=0, puede observarse que el espectro de una funcin que satisface el criterio de
admisibilidad se asemeja a la funcin de transferencia de un filtro pasabanda. De hecho, cualquier
filtro pasabanda con respuesta impulsiva media nula, que tienda a cero con suficiente rapidez para
frecuencias crecientes, puede emplearse como funcin wavelet madre.
Un conjunto de bases wavelet {ya,b(x)}, se genera mediante translaciones y
cambios de escala de la wavelet madre y(x) de acuerdo a la expresin
donde a>0 y b son nmero reales. La variable a determina la escala de la funcin
base, mientras que b especifica su posicin sobre el eje de las x. La transformada
wavelet continua de u(x) respecto de la wavelet madre y(x) se expresa mediante:
Los coeficientes de la transformada son, una vez ms, el resultado de un
producto interno entre la funcin a transformar y la funcin base considerada.
La expresin de la transformada wavelet continua inversa es:
Por medio del ejemplo siguiente puede observarse el
comportamiento de la CWT. Considrese la seal no estacionaria
de la Figura: est compuesta por cuatro componentes de
frecuencias 30 Hz, 20 Hz, 10 Hz y 5 Hz.
Ntese que los ejes del grfico de la transformada
wavelet continua son la translacin y la escala, y no
el tiempo y la frecuencia. De todas maneras es fcil
convencerse que la translacin est estrechamente
ligada al tiempo, por cuanto indica dnde se
encuentra localizada la wavelet madre. La escala por
su parte puede ser reconducida a la recproca de la
frecuencia, por lo que las escalas ms pequeas
corresponden a las frecuencias mayores y la
frecuencia disminuye con el aumento de escala.
La transformada continua wavelet W(a,b) de una funcin u(x) de una
dimensin, es una funcin de dos variables, una ms que la propia u(x).
Para cada incremento de una variable, la transformada aumenta su
dimensin en una unidad. Entonces, si u(x1,x2) es una funcin de dos
dimensiones, su transformada continua wavelet se expresar como:
Donde bx1 y bx2 indican las translaciones en las dos dimensiones.
DWT
El trmino Transformada Wavelet Discreta se
refiere a una clase de transformacin que difiere
no solo en las funciones de transformacin
empleadas, sino en la naturaleza fundamental de
esas funciones. La DWT abarca una variedad de
transformaciones nicas pero relacionadas.
En MATLAB podemos trabajar con la aplicacin
de wavelets al dominio 2D correspondiente a
imgenes utilizando diferentes tipos de wavelets
madre mediante la funcin wavedec2 que calcula
los coeficientes de descomposicin en las
diferentes escalas de la imagen utilizando las
diferentes wavelets madre wfilters
Las caractersticas que podemos utilizar a partir
de las wavelets son los coeficientes de
descomposicin que se obtienen de la imagen en
cada una de las direcciones en todas las escalas.
estos coeficientes pueden ser extrados
utilizando la funcin detcoef2 a partir de los
cuales podemos caracterizar regiones de la
imagen mediante mtricas que se apliquen a
dichos coeficientes.
Problemas asociados con el uso de diferentes sensores y de
conversores anlogo/digital (A/D), tienen un impacto en el
desempeo del sistema. Las discrepancias en ganancia y en
polarizacin de seales captadas por varios sensores y
conversores A/D es uno de los problemas que surgen y que a
menudo conllevan a consumir mucho tiempo en la calibracin,
adems de la posibilidad que existe que la estructura o la forma
de la seal captada cambie. Los objetivos de la transformada
SMQT son eliminar la disparidad entres sensores debido a la
ganancia y a la polarizacin; adicionalmente, la SMQT busca
extraer eficientemente la estructura de los datos, lo cual
permite, que la SMQT sea una forma rpida y robusta para
extraer caractersticas para su procesamiento posterior o
clasificacin
El Problema de la extraccin de la estructura puede ser visto
como el problema de compresin de rango dinmico. La
extraccin de estructuras de los datos ha sido realizada antes,
por ejemplo en el contexto de la Transformada Census, la cual
extrae una estructura binaria de una imagen; mas
recientemente la Transformada Census Modificada ha sido
aplicada en diversos sistemas de extraccin de caractersticas,
esta transformada es similar a una SMQT de primer nivel. De
cualquier forma, estas tcnicas revelan solo estructuras de un
bit, o ncleos de estructuras, mientras que la SMQT puede ser
utilizada para extender la representacin de la estructura a un
nmero arbitrario predefinido de bits en informacin arbitraria
dimensional.
Sea x un punto de dato y D(x) un conjunto de puntos de datos. El valor de
un punto ser denotado como v(x) . La forma de los puntos de datos es
arbitraria, esto quiere decir que D(x) podr ser un vector, una matriz o
alguna otra forma arbitraria. La SMQT tiene solo un parmetro de
entrada directo, el nivel L; indirectamente tambin tendr como entrada
importante el nmero de puntos de datos de D. El conjunto de salida de la
transformada es denotado por M(x), la cual tiene la misma forma del
conjunto de entrada. Si D(x) es una matriz, entonces M(x) ser tambin
una matriz del mismo tamao. La transformada SMQT de nivel L de D(x)
a M(x) ser denotada como
La SMQT
L
puede ser descrita en forma de un rbol binario en el
cual los vrtices son Unidades de Cuantizacin Media (MQUs).
Una MQU se realiza en tres pasos: Calculo del promedio, una
Cuantizacin y una divisin del conjunto de entrada. El primer
paso de la MQU encuentra el promedio de la informacin,
denotado como , como se observa a continuacin
Esto significa que V(x) ser el promedio del conjunto original
para todos los puntos de datos x.
El segundo paso usa el promedio para cuantizar los valores de los
puntos de datos entre [0 1]. Sea la funcin de comparacin definida
como
Y denotando cuantizacin, entonces:
Donde se denota el conjunto del promedio cuantizado. Esto quiere
decir que U(x) ser un conjunto construido por la funcin de
comparacin entre todos los datos y resultando en 1 o en 0 para cada
uno de los datos. El conjunto U(x) es la principal salida de una MQU.

El tercer paso divide el conjunto de entrada en


dos subconjuntos
Donde D0 se propaga a la izquierda y D1 se
propaga a la derecha en el rbol binario
La MQU constituye la principal unidad computacional para la
SMQT; el primer nivel de transformada, SMQT
1
, est basado en la
salida de una simple MQU, donde U es el conjunto de salida en el
nodo raz. Las salidas en el rbol binario. Sea el conjunto de salida
de una MQU en el rbol, denotado por U(l,n) donde l es el nivel
actual y n es el nmero de salida para la MQU al nivel l. Calculando
los valores de los puntos de datos en los conjuntos , la final SMQT
L
es encontrada aadiendo los resultados, la ponderacin es
realizada por 2
L-1
a cada nivel ; por lo tanto el resultado para la
SMQT puede ser encontrado como se muestra:
.
Ejemplo de la SQMT
sobre una imagen. (A)
Imagen Original. (B-I)
SQMT1 a SQMT8
La transformada de caractersticas invariante en escala
(SIFT) es probablemente el descriptor ms
comnmente utilizado en los ltimos aos y ha
probado ser robusto ante condiciones problemticas
en las escenas de adquisicin (rotacin, distorsin,
cambio de pose, cambio de iluminacin y cambios del
punto de vista). El principio fundamental de los
descriptores SIFT es la extraccin de caractersticas de
la imagen que son invariantes en diferentes escalas
para establecer el emparejamiento entre diferentes
vistas de un objeto en particular.
Las etapas fundamentales del procesamiento SIFT
para una imagen podemos enumerarlas como:
1. Scale-Space Extrema Detection
2. Keypoint Localization
3. OrientationAssignement
El primer paso del algoritmo SIFT es detectar
ubicaciones y escalas que pueden ser asignadas
repetitivamente bajo diferentes vistas del mismo
objeto. Detectar ubicaciones que son invariantes a
los cambios de escala de la imagen puede llevarse a
cabo buscando caractersticas estables a travs de
todas las escalas posibles usando una funcin de
escala continua llamada espacio de escala
El espacio de escala de una imagen es definido como una
funcin que es producida por la convolucin
de una Gaussiana variable en escala con una
imagen de entrada
Para establecer eficientemente las ubicaciones de puntos
clave en el espacio de escala se seleccionan las ubicaciones
en los mnimos y mximos de una funcin de diferencias de
dos Gaussianas de escalas cercanas separadas por un factor
k, aplicada en el espacio de escala.
( , , ) L x y
( , , ) G x y
( , ) I x y

( , , ) ( , , ) ( , , ) ( , ) D x y G x y k G x y I x y
Una aproximacin eficiente para la construccin de
se muestra en la Figura de la diapositiva
siguiente donde la imagen original es
incrementalmente convolucionada con Gaussianas
para producir imgenes separadas por un factor
constante k en el espacio de escala.
( , , ) D x y
Para detectar los puntos mximos de la funcin D, cada
punto de muestra se compara con sus ocho vecinos de la
imagen actual y con los 9 vecinos de la imagen una escala
superior y una escala inferior. El punto es seleccionado solo si
es menor o mayor que todos los otros 26 pxeles.
Los resultados experimentales obtenidos por Lowe, para la
escogencia del nmero de escalas por cada octavo se
muestran en la figura.
Una vez que un punto candidato ha sido encontrado mediante la
comparacin con sus vecinos, el siguiente paso es hacer un ajuste
detallado de la informacin cercana para la ubicacin, escala y radio
de las curvaturas principales. Esto se lleva a cabo evaluando la funcin
de diferencias de Gaussianas D en cada uno de los puntos de
muestreo, desplazando el origen hasta el punto que se esta
evaluando.
Para garantizar la estabilidad de los puntos, no basta
simplemente con rechazar aquellos puntos con bajo
contraste con la funcin D. las curvaturas principales pueden
ser calculadas de una matriz Hessiana 2x2 en la ubicacin y
escala de cada punto.
Mediante la asignacin de parmetros de orientacin a los
puntos clave, basado en las propiedades de la imagen, se
consigue que dichos puntos sean invariantes a la rotacin. Se
calculan entonces la magnitud del gradiente y su orientacin
para cada punto, teniendo en cuenta la escala en que el punto
fue muestreado.
Un histograma de orientaciones se forma de las
orientaciones del gradiente de los puntos de muestreo
con la regin a su alrededor. Los picos en el histograma
de orientaciones corresponden a las direcciones
dominantes del gradiente local y cualquier otro pico
que tengan un 80% del valor del pico ms grande, se
utiliza para crear un nuevo punto clave con esta
direccin aunque solo al 15% de los puntos se le
asignan mltiples orientaciones pero estos
contribuyen a la estabilidad final del emparejamiento.
Las operaciones previas le han asignado a los puntos
clave de la imagen ubicacin, escala y orientacin.
Estos parmetros imponen un sistema de coordenadas
2D en el cual se pueden describir regiones locales de la
imagen. Primero las orientaciones y las magnitudes del
gradiente son muestreadas alrededor del punto clave y
para conseguir la invariancia a las rotaciones, las
coordenadas del descriptor y de las orientaciones de
los gradientes son ponderadas con la orientacin del
punto clave.
Una funcin de peso Gaussiana con un igual a
del ancho de la ventana del descriptor es aplicada
para asignar un peso a la magnitud de cada punto
muestreado alrededor del punto clave. El propsito
de esta ventana Gaussiana es evitar cambios en el
descriptor causados por variaciones en la posicin
de la ventana y para darle menos peso a aquellas
magnitudes del gradiente que estn ms alejadas
del punto clave.
Se debe tener en cuenta cada gradiente de orientacin usando una
interpolacin para ponderar la contribucin del punto muestreado y
distribuirla en los histrogramas adyacentes. Es decir cada entrada es
multiplicada por un factor de peso (1-d).
Para construir el descriptor se forma un vector
conteniendo todos los valores de las entradas del
histograma de orientaciones, correspondientes a los
tamaos de los vectores con sus orientaciones
ponderadas. Finalmente el vector caracterstico es
modificado para reducir los efectos de la iluminacin
mediante una normalizacin del mismo y una posterior
umbralizacin. Teniendo en cuenta que el
emparejamiento se realizar debido a la forma de la
distribucin del histograma y no en cuanto a los
tamaos de los gradientes del histograma
Se ha realizado deteccin de objetos en imgenes
utilizando descriptores locales SIFT, donde se
compara la ocurrencia de ciertas caractersticas en
una imagen mediante el uso de agrupamientos de
las mismas para realizar una deteccin de un
determinado objeto. Se propone una cascada de
clasificadores que comparen estas caractersticas
para mejorar la eficiencia del tiempo de deteccin
del objeto.
En otra de las aplicaciones, se utiliza una reduccin
de las caractersticas SIFT que se extraen para ser
aplicadas al reconocimiento de objetos en sistemas
de vigilancia. esta reduccin de caractersticas se
lleva a cabo mediante la interseccin de los
histogramas de estas y mediante un umbral se
toma la decisin de descartar una de las
caractersticas.
SIFT tambin ha sido aplicado al reconocimiento
de expresiones faciales, donde se utiliza una
variacin llamada D-SIFT, donde se genera una
funcin de densidad para los vectores
caractersticos y se seleccionan las caractersticas
mas discriminativas mediante la divergencia de
Kullback Liebler de cada regin del rostro.
Posteriormente se realiza la tarea de clasificacin
de las caractersticas usando un clasificador WMV.
El emparejamiento de escenas ha sido tratado
mediante el uso de descriptores SIFT, aplicado al
registro de imgenes mediante sensores remotos
(imgenes satelitales). Primero se realiza una
reduccin de las bandas de la imagen aplicando PCA y
una segmentacin posterior mediante el umbralizado
de OTSU. Se aplican despus los descriptores a cada
regin segmentada y se compara con una imagen de
referencia de la escena que se desea registrar.
Estas caractersticas aplican para el alineamiento de
escenas, mediante el reconocimiento de objetos en
diferentes imgenes. Lo que se desea conseguir es el
emparejamiento de las mismas instancias de un objeto
(edificios, carros, nubes, etc). Se introduce un
concepto llamado flujo-SIFT, que permite emparejar
las caractersticas a travs de los vectores de flujo,
donde se tienen en cuenta la vecindad de una imagen
con respecto a las imgenes en la base de datos que
comparten una estructura local similar.
El seguimiento de objetos en secuencias de video
tambin ha sido abordado mediante el uso de SIFT,
se propone una metodologa similar a la del filtro
de partculas, que incluye dos modelos, el dinmico
y el de observacin. Se aplican los descriptores
SIFT en la regin donde se encuentra el objeto en
el frame anterior para despus buscar los puntos
clave en el frame actual.

Anda mungkin juga menyukai