Anda di halaman 1dari 31

Mejoramiento de la segmentación de

tumores en imagenes de resonancia


magnética utilizando optimización
bayesiana y graph cuts

Mauricio Castaño Aguirre

Universidad del Quindı́o


Ingenierı́a electrónica
Armenia Quindı́o, Colombia
2018
Mejoramiento de la segmentación de
tumores en imagenes de resonancia
magnética utilizando optimización
bayesiana y graph cuts

Mauricio Castaño Aguirre

Tesis o trabajo de grado presentado como requisito parcial para optar al tı́tulo de:
Ingeniero Electrónico

Director:
M.Sc. Hernán Felipe Garcı́a Arias

Lı́nea de Investigación:
Aprendizaje de máquina

Universidad del Quindı́o


Ingenierı́a electrónica
Armenia Quindı́o, Colombia
2018
A mi familia y profesores de la universidad del
Quindı́o
Agradecimientos
Agradecimientos a el profesor de la Universidad del Quindio M.Sc. Hernán Felipe Garcı́a
Arias por su constante asesorı́a en el desarrollo de este trabajo
ix

Resumen

El objetivo principal de este trabajo es desarrollar una metodologı́a para el mejoramiento de


la segmentación de tumores en imagenes de resonancia magnetica utilizando optimizacion
bayesiana y graph cuts. Por lo que este trabajo propone buscar una optimizacion de hiperpa-
rametros presentes en graph cuts por medio de optimizaicon bayesiana, para ello se analiza
el desempeño de esta estrategia en imagenes de resonancia magnetica del cerebro usando es-
pecificamente la base de datos del brats challenge 2015 [19]. Observando asi el desempeño de
esta estrategia en la complejidad de la segmentacion de tumores obteniendo reultados tales
como un coeficiente medio de Dice igual al 0.8624, resultado muy competitivo con respecto a
las estrategias presentes actualmente que reportan coeficientes de Dice de aproximadamente
0.9 [19].
Palabras clave: optimización bayesiana, segmentación de tumores en el cerebro,imáge-
nes de resonancia magnética .

Abstract
The main objective of this work is to develop a methodology for the improvement of tu-
mor segmentation in magnetic resonance imaging using Bayesian optimization and graph
cuts. So this work proposes to seek an optimization of hyperparameters present in graph
cuts by bayesian optimization, for this, the performance of this strategy is analyzed in mag-
netic resonance images using specifically the brats challenge 2015 database [19]. Observing
the performance of this strategy in the complexity of the tumor segmentation, obtaining
results such as an average Dice coefficient equal to 0.8624, a very competitive result with
respect to the present strategies that report Dice coefficients of approximately 0.9
Keywords: graph cuts , BraTS, brain tumor segmentation, Bayesian optimization
Contenido
Agradecimientos VII

Resumen IX

1. Introducción 2
1.1. Graph cuts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2. Optimización bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2. Materiales y métodos 7
2.1. Base de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.1. Imagenes de resonancia magnética . . . . . . . . . . . . . . . . . . . . 8
2.1.2. Secuencias de imágenes de resonancia magnética . . . . . . . . . . . . 9
2.2. Métricas para evaluar la segmentación de imagenes médicas . . . . . . . . . 10
2.2.1. Métricas de superposición . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2. Métricas de distancia superficial . . . . . . . . . . . . . . . . . . . . . 11
2.3. Graph cuts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4. Minimización de energia usando graph cuts . . . . . . . . . . . . . . . . . . . 12
2.4.1. Algoritmo de intercambio α − β . . . . . . . . . . . . . . . . . . . . . 12
2.4.2. Algoritmo de expansión α . . . . . . . . . . . . . . . . . . . . . . . . 13
2.5. Algoritmo de Boykov-Kolmogorov . . . . . . . . . . . . . . . . . . . . . . . . 13
2.5.1. Etapa de crecimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.5.2. Etapa de aumento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.5.3. Etapa de adopción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.6. Optimización bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.6.1. Procesos Gausianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.6.2. Funciones de adquisición . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.7. Esquema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

Bibliografı́a 20
1 Introducción
La importancia de la detección temprana de un tumor cerebral a tiempo es un factor de vida
o muerte; para ello se capturan imágenes detalladas del cerebro por medio de resonancias
magnéticas, estas resonancias magnéticas posteriormente deben ser analizadas por un ra-
diólogo, que evalúa si la resonancia posee anomalı́as, el problema principal radica en que la
disponibilidad de radiólogos actualmente no satisface el requerimiento actual de análisis de
imágenes de resonancias magnéticas, por lo que él solo análisis de una imagen de resonancia
magnética del cerebro podrı́a llegar a requerir de un tiempo muy valioso [19]
Los gliomas son el mal primario más común en el cerebro, con diferentes grados de agresi-
vidad, prognosis variable y diversas sub-regiones histológicas heterogéneas, es decir, edema
peri-tumoral, núcleo necrótico, núcleo tumoral potenciador y no potenciador. Esta hetero-
geneidad intrı́nseca de los gliomas también se retrata en su fenotipo de imagen (apariencia y
forma), ya que sus subregiones se describen por diferentes perfiles de intensidad diseminados
a través de exploraciones de MRI multimodales, lo que refleja propiedades tumorales varia-
bles. Debido a este aspecto y forma altamente heterogéneos, la segmentación de los tumores
cerebrales en las exploraciones MRI multimodales es una de las tareas más difı́ciles en el
análisis de imágenes médicas [22]
Existe un creciente cuerpo de literatura sobre algoritmos computacionales que abordan esta
importante tarea. Desafortunadamente, los conjuntos de datos abiertos para diseñar y probar
estos algoritmos no están actualmente disponibles y los conjuntos de datos privados difieren
tan ampliamente que es difı́cil comparar las diferentes estrategias de segmentación que se han
reportado hasta ahora. Los factores crı́ticos que conducen a estas diferencias incluyen, pero
no se limitan a, 1) las modalidades de imagen empleadas, 2) el tipo de tumor (GBM o LGG,
tumores primarios o secundarios, sólido o infiltrativo) y 3) el estado de la enfermedad (las
imágenes pueden no sólo ser adquiridas antes del tratamiento, sino también postoperatorias
y, por lo tanto, mostrar efectos de radioterapia y cavidades quirúrgicas)[22]
La detección de tumores en imágenes de resonancia magnética es un tema de investiga-
ción actualmente por lo que se buscan estrategias que mejoren los resultados obtenidos por
técnicas de segmentación comunes, a continuación se citaran diferentes métodos usados para
segmentar tumores en imágenes de resonancia magnética propuestas por diversos investiga-
dores
Maryam Taghizadeh Dehkordi et al [11]. propone en este método una función de energı́a que
recibe como parámetro de entrada, la salida de un filtro Gaussiano de múltiple escala aplicado
a la imagen, que determina la posibilidad de que cada pixel pertenezca a la estructura de
3

un tumor. La introducción de la salida de este filtro en la función de energı́a hace que el


modelo se vuelva robusto ante la falta de homogeneidad de la imagen. Toda esta propuesta
la hicieron dando el supuesto de que los tumores en las imágenes de resonancia magnética
poseen un color diferente al resto de regiones en el cerebro
Chee-Kong Chui et al [9]. introduce un método que usa diferentes tipos de imágenes de
resonancia magnética del mismo sujeto para la detección de pixeles que puedan pertenecer a
un tumor. Los datos se dividen en conjunto de entrenamiento y prueba. Posteriormente se usa
un diccionario de aprendizaje para transformar las caracterı́sticas de los pixeles en un espacio
de caracterı́sticas de alta dimensionalidad, donde sus similitudes no lineales son usadas para
generar códigos discriminativos (si el pixel pertenece o no a un tumor). El diccionario de
aprendizaje consiste en aprender el conjunto de entrenamiento dado inicialmente, Mediante la
extracción de caracterı́sticas, Este procedimiento busca representar cada muestra de un pixel
como una representación lineal de los vectores base obtenidos. Los vectores base provienen de
funciones de base radial o como comúnmente se citan en el estado del arte RBF (Radial Basis
Function). Este tipo de funciones tiene forma Gaussiana (tipo campana). El transformar los
pixeles a un espacio de caracterı́sticas de alta dimensionalidad hace que los datos estén más
separados entre sı́ por lo que clasificar si un pixel pertenece o no a un tumor se hace más
sencillo en este espacio.
C.Hemasundara Rao et al [23]. propone un método dividido en 3 etapas: segmentación inicial,
modelamiento de la función de energı́a y optimización de energı́a. La primera etapa consiste
en usar 2 tipos diferentes de imágenes del mismo sujeto, FlAIR y T1-ponderado; Usando la
información combinada de ambas para mejorar la estructura probabilı́stica de modo tal que
la región de segmentación sea más exacta. Para la etapa 2 y 3 se usa una función de potencia
descrita como una interacción local de un sistema de vecinos que se divide en la suma de
un potencial unitario y un potencial por parejas, donde la función de potencial unitario está
dada por una función sigmoidal y la función de potencial por parejas describe la interacción
de un pixel con su vecino usando el concepto de distancia Euclidea. El mà todoc incluye el
concepto de campo aleatorio condicional (CRF en inglés) usado para segmentar el conjunto
de datos mediante un modelo estocástico, que no es más que un modelo de selección aleatoria
de datos.
Sérgio Pereira et al [21], realiza un estudio preliminar de las ventajas que puede tener el uso
de redes neuronales convolucionales a la segmentación de tumores en imágenes resonancia
magnética, dando como justificación que la mayorı́a de segmentaciones actualmente solo
buscan segmentar completamente un tumor sin diferenciar cada componente de este. El
algoritmo busca lograr diferenciar diferentes componentes de un tumor como por ejemplo si
hay necrosis o edemas en algunas regiones del cerebro. Para el desarrollo de estos algoritmos
usaron la base de datos BRATS CHALLENGE 2013, Este artı́culo presenta un estudio
preliminar de la aplicación de las redes neuronales al mejoramiento de la segmentación de
tumores en MRI, por lo que todavı́a está en desarrollo el potencial que puede llegar a tener
una red neuronal en este tipo de aplicaciones.
4 1 Introducción

Neil Birkbeck et al [5], Propone un método interactivo de segmentación en 2D y 3D, que


se basa en una función de energı́a que incorpora las estadı́sticas de la región segmentada
inicialmente. La energı́a se minimiza eficientemente usando Graph Cuts. El uso de funciones
de energı́a en este tipo de segmentaciones es muy común ya que estas desempeñan una labor
idéntica a la que emplea un discriminante de Fisher [6] en problemas de clasificación, que es
llevar los datos a un espacio en el que sean fácilmente separables. Este método interactivo
permite realizar un balance en la segmentación automática, de forma manual, interactuando
directamente con la imagen, señalando las regiones del cerebro que posiblemente contienen
un tumor.

En la tabla 1-1 se muestran los resultados obtenidos en cada una de las estrategias, los
resultados dados en cuanto a precisión provienen de la comparación entre la segmentación
implementada en la estrategia propuesta y la segmentación manual realizada por expertos,
que es dada en las bases de datos de cada uno de las estrategias, ya que las bases de datos
provienen de BRATS CHALLENGE que contiene una base de datos con 4 tipos de MRI :
FLAIR, T1, T1c, T2. Y la segmentación manual denominada Ground Truth [19].

Tabla 1-1: Métodos implementados para segmentar tumores en MRI


Nombre Estrategias usadas Precision Autonomia
Un nuevo modelo de
-Filtro Gausiano multi-escala
contorno para la 0.9986 Si
-Minimizacion de funcion de energia
segmentacion de tumores
Segmentación automática
de tumores usando diccionarios -Diccionario de aprendizaje
0.8110 Si
de aprendizaje y caracterı́sticas -Generacion de super-pixeles
de súper-pixeles
Detección y segmentación de tumores
-Minimizacion de funcion de energia
usando campos aleatorios
-Funciones sigmoides 0.8804 Si
condicionales
-Distancia Euclidea
(CRF)
Segmentación jerárquica de tumores
cerebrales en MRI usando redes
-Redes neuronales convolucionales 0.8092 Si
neuronales convolucionales:
un estudio preliminar
Un método interactivo de graph cut -Minimizacion de funcion de energia
para segmentación de tumores en el obtenida de region del cerebro 0.9367 No
cerebro seleccionada de forma manual.

Desde el punto de vista de la Ingenierı́a se presentan grandes problemas respecto a la efi-


ciencia puesto que, al ser una técnica de segmentación de imágenes se dispone de algunos
1.1 Graph cuts 5

limitantes como son la calidad de la imagen a analizar, ya que de ella depende el pronóstico
acertado debido a que en la imagen se debe tener una alta calidad para lograr diferenciar
sustancias grises de tumores. En el mundo del aprendizaje de maquina se busca desarrollar
modelos probabilı́sticos que revelen información sobre una determinada función; estos mode-
los probabilı́sticos tienen como base ciertos parámetros que deben ser sintonizados o variados
dependiendo del tipo de función de la que se desea obtener información, la efectividad en
la información obtenida por estos modelos depende totalmente de la adecuada sintonización
de estos parámetros. La optimización bayesiana es un método iterativo que busca la opti-
mización global de funciones, aplicada a la optimización de hiperparámetros. Consiste en
desarrollar un modelo estadı́stico de la función desde valores de hiperparámetros hasta el
objetivo evaluado en un conjunto de validación, lo que resuelve de cierto modo el problema
presentado anteriormente [25]
para este proyecto se plantearon los siguientes objetivos:

Desarrollar una estrategia para la segmentación de tumores en imágenes de resonancia


magnética utilizando graph cuts.

Entrenar un modelo de optimización bayesiana a partir de la construcción de una


función de optimización que permita mejorar la segmentación a partir de los hiperpa-
rametros generados en el modelo de graph cuts.

Contrastar la segmentación de Graph cuts mas optimización bayesiana con técnicas


comúnmente utilizadas en el estado del arte.

1.1. Graph cuts


El método de Graph Cut es una área de investigación activa. Ademas de encontrar nuevas
aplicaciones, en los últimos años los investigadores han descubierto enlaces interesantes que
conectan Graph cut con otros algoritmos combinatorios.[7, 14]
Graph Cut ha demostrado ser una útil herramienta de optimización multidimensional que
puede reforzar la suavidad en algunas partes de la imagen o volumen y preservar las discon-
tinuidades agudas en ciertas regiones, por lo que es una gran estrategia de segmentación ya
que preserva algunas caracterı́sticas de contorno de la zona que se desea segmentar por lo que
hace posible obtener un mayor desempeño comparado con otras estrategias de segmentación
que no conservan discontinuidades [27]

1.2. Optimización bayesiana


Un problema de optimización general puede definirse especificando [1] el conjunto de todas
las posibles soluciones al problema y [18] una medida para evaluar la calidad de cada solución
6 1 Introducción

candidata. La tarea es encontrar la solución de mayor calidad. A pesar de la existencia de


técnicas especializadas para resolver clases de problemas altamente restringidos de manera
eficiente, como la programación lineal y cuadrática, podrı́a ser imposible (o poco práctico)
aplicar estas técnicas por dos razones. En primer lugar, el problema que estamos tratando de
resolver podrı́a no ajustarse a ninguna de las clases restringidas de problemas para las cuales
se conocen soluciones. En segundo lugar, incluso si el problema pertenece a una de estas
clases restringidas, podrı́a ser intratable o poco práctico adquirir el conocimiento suficiente
para clasificar el problema adecuadamente. Esto da lugar al creciente interés en el diseño
de técnicas de optimización adaptativa capaces de descubrir y explotar automáticamente las
regularidades problemáticas para lograr una optimización eficiente y escalable de una amplia
clase de problemas importantes del mundo real [20].
2 Materiales y métodos

2.1. Base de datos


La base de datos corresponde al BRATS CHALLENGE 2015. Inicialmente la base de datos
se divide en 2, una parte con propósitos de entrenamiento y otra de validación. La parte de
validación posee dos divisiones una contiene imágenes de resonancia de tumores malignos
(HGG) y la otra con tumores benignos (LGG). Para el caso de los tumores malignos se tienen
220 pacientes y para tumores benignos se tienen 54 pacientes. La parte de validación tiene 110
pacientes en los cuales se tiene tanto HGG como LGG. En el conjunto de entrenamiento cada
paciente tiene 5 tipos de imágenes, FLAIR, T1, T1c, T2, y OT (ground truth, Anotaciones
manuales). En el conjunto de validación cada paciente tiene FLAIR, T1, T1c y T2. En la
figura 2-1 se muestra un diagrama del contenido de la base de datos.

BRATS CHALLENGE
DATASET

Conjunto de entrenamiento Conjunto de validacion

HGG LGG HGG-LGG

220 pacientes 54 pacientes 110 pacientes

Flair,T1,T1c,T2,OT Flair,T1,T1c,T2,OT Flair,T1,T1c,T2

Figura 2-1: Contenido BRATS CHALLENGE 2015 DATASET.

En la figura 2-2 se muestran los diferentes tipos de imágenes disponibles en la base de datos
de brats challenge [19], como se puede observar cada imagen presenta diferentes tipos de
intensidades que hacen que cada imagen tenga una utilidad diferente en cuanto a detección
de partes del tumor se refiere, las anotaciones manuales disponibles en la base de datos
(brats challenge [19]) contienen 5 tipos diferentes de categorı́as representando las categorias
internas del tumor [19, 17]:

0 todo lo demás.
8 2 Materiales y métodos

1 necrosis

2 edema.

3 tumor no agudo.

4 tumor agudo.

(a) (b)

(c) (d)

Figura 2-2: Diferentes tipos de secuencias presentes en [19]. (a) secuencia flair, (b) secuencia
t2, (c) secuencia t1, (d)secuencia t1c

En cada tipo de imagen se facilita mas la deteccion de una parte del tumor que en otras,
para la detección del tumor completo se facilita en las secuencias flair y t2, en la secuencia
t2 se facilita mas la detección del núcleo tumoral, por lo que la selección correcta del tipo
de MRI es un factor determinante en el desempeño de la segementación [19].

2.1.1. Imagenes de resonancia magnética


La resonancia magnética se basa en las propiedades de magnetización de los núcleos atómicos.
Se emplea un campo magnético externo potente y uniforme para alinear los protones que
normalmente están orientados al azar dentro de los núcleos de agua del tejido que se está
examinando. Esta alineación (o magnetización) es luego perturbada o interrumpida por
la introducción de una energı́a de radiofrecuencia (RF) externa. Los núcleos vuelven a su
2.1 Base de datos 9

alineamiento en reposo a través de diversos procesos de relajación y, al hacerlo, emiten energı́a


de RF. Después de un cierto perı́odo despues de la RF inicial, se miden las señales emitidas.
La transformada de Fourier se usa para convertir la información de frecuencia contenida
en la señal de cada ubicación en el plano representado en imágenes a niveles de intensidad
correspondientes, que luego se muestran como tonos de gris en una disposición de matriz de
pı́xeles. Al variar la secuencia de pulsos de RF aplicados y recopilados, se crean diferentes
tipos de imágenes [4].

2.1.2. Secuencias de imágenes de resonancia magnética


En las imágenes de resonancia magnética existen dos tiempos esenciales,El Tiempo de Re-
petición (TR) que es la cantidad de tiempo entre sucesivas secuencias de pulso aplicadas
al mismo corte y el tiempo de eco (TE) que es el tiempo transcurrido entre la entrega del
impulso de RF y la recepción de la señal de eco [4].
Las secuencias de MRI más comunes son T1 y T2. Las imágenes en T1 se producen utilizan-
do tiempos cortos en TR y TE. El contraste y el brillo de la imagen están determinados por
las propiedades T1 del tejido. Por el contrario las imágenes T2 se obtienen con tiempos TR
y TE más largos, en estas imágenes, el contraste y el brillo están determinados por las pro-
piedades T2 del tejido. Otra secuencia comúnmente utilizada es la Recuperación de inversión
atenuada de fluidos (FLAIR). La secuencia FLAIR es muy similar a una imagen ponderada
en T2.Excepto que los tiempos TR y TE son muy largos. Al hacerlo, las anomalı́as siguen
siendo brillantes, pero el lı́quido cerebro-espinal normal se atenúa y se oscurece. Esta secuen-
cia es muy sensible a la patologı́a y hace que la diferenciación entre fluido cerebro-espinal y
una anormalidad sea mucho más visible [4].

En la tabla 2-1 se muestran los diferentes tiempos de repetición y eco para las secuencias
mas comunes de MRI

Tabla 2-1: Tiempos de repetición y eco para de secuencias comunes en MRI [4]
Secuencias TR TE
MRI (ms) (ms)
T1 500 14
T2 4000 90
Flair 9000 114
10 2 Materiales y métodos

2.2. Métricas para evaluar la segmentación de imagenes


médicas
La segmentación de imágenes médicas es un paso importante de procesamiento de imágenes.
Comparar las imágenes para evaluar la calidad de la segmentación es una parte esencial para
medir el progreso en esta área de investigación. Uno de los desafós en la evaluación de la
segmentación médica son: la selección de métricas [26].

2.2.1. Métricas de superposición


Coeficiente de Sorensen-Dice.
También llamado ı́ndice de superposición, es la métrica más utilizada para validar las
segmentaciones de volúmenes médicos.El coeficiente de Dice se calcula como métrica de
rendimiento. Esta medida determina la similitud entre las anotaciones clı́nicas (ground
truth) y la segmentación de salida. Esta metrica es comunmente usada para medir
reproducibilidad y repetibilidad [26].

2 |A ∩ B| 2T P
DC = = (2-1)
|A| + |B| 2T P + F P + F N

Indice de Jaccard.
El indice de Jaccard entre dos conjuntos esta definido como la interseccion entre ellos
dividida por su unión

|A ∩ B| TP
J(A, B) = = (2-2)
|A ∪ B| TP + FP + FN

Eso significa que ambas métricas (Dice,Jaccard) miden los mismos aspectos y propor-
cionan la misma clasificación del sistema. Por lo tanto, no proporciona información
adicional para seleccionar a ambos juntos como métricas de validación

Métrica de verdaderos positivos (TPR:True Positive Rate) y métrica de verdaderos


negativos (TNR:True Negative Rate).

TP
TPR = (2-3)
TP + FN

TN
T NR = (2-4)
TN + FP

TPR, también llamado sensibilidad, mide la porción de vóxeles positivos en la ano-


tacion manual que también se identifican como positivos por la segmentación que se
2.3 Graph cuts 11

evalúa.Análogamente, TNR, también llamada Especificidad, mide la porción de vóxe-


les negativos (fondo) en la anotacion manual (ground truth) que también se identifican
como negativos por la segmentación que se evalúa. Sin embargo, estas dos medidas
no son comunes como medidas de evaluación de la segmentación de imágenes médicas
debido a su sensibilidad al tamaño de los segmentos, es decir, penalizan los errores en
segmentos pequeños más que en segmentos grandes [26].

2.2.2. Métricas de distancia superficial


Distancia de Hausdorff.
La distancia de Hausdorff entre dos conjuntos (A,B) esta definida por

HD(A, B) = max(h(A, B), h(B, A)) (2-5)

donde h(A, B) es llamada la distancia directa de Hausdorff y esta dada por

h(A, B) = maxmin ka − bk (2-6)


aA bB

donde ka − bk es algun tipo de norma (distancia Euclidea).La distancia de Hausdorff


suele tener sencibilidad ante discontinuidades o valores atipicos [26]. Por lo que la dis-
tancia maxima calcula podria no reflejar muy bien el desempeño de la segmentación
que se esta evaluando. por lo que en [13] se propone el método del cuantil de Haus-
dorff.la distancia de Hausdorff se define como el q − esimo quantil de distancias en
lugar del máximo, por lo que se excluyen posibles valores atı́picos, donde se selecciona
q según la aplicación y la naturaleza de los conjuntos de puntos medidos.En el caso de
la segmentación de tumores en MRI se reporta el cuantil 95 [19].

Distancia superficial media.


Esto nos dice cuánto, en promedio, la superficie varı́a entre la segmentación y el GT
(en mm) [26]
ns0
ns
!
1 X X
M SD = d(p, S 0 ) + d(p0 , S) (2-7)
ns + n0s p=1 0
p =1

2.3. Graph cuts


El objetivo de la segmentación de imágenes es agrupar pı́xeles en regiones de imágenes salien-
tes, es decir, regiones correspondientes a superficies individuales, objetos o partes naturales
de objetos. Cada uno de los pı́xeles en una región es similar con respecto a alguna carac-
terı́stica o propiedad calculada, como el color, la intensidad o la textura.
12 2 Materiales y métodos

2.4. Minimización de energia usando graph cuts


La segmentacion de imagenes puede ser modelada como una minimizacion de energia que
busca un etiquetado f que minimize la energia [8],

E(f ) = Esmooth (f ) + Edata (f ) (2-8)

En este contexto Esmooth (f ) es una medidad de la suavidad por partes del etiquetado f ,
mientras que Edata (f ) mide la discrepancia entre f y los datos observados.

La forma de Edata (f ) en [8, 12] es,


X
Edata (f ) = Dp (fp ) (2-9)
pP

Donde Dp mide que tan bien la etiqueta fp se ajusta al pixel p, por lo genral se evalua esto
usando una norma cuadratica,que puede sser dada por (fp − ip )2 donde ip es la intensidad
original del pixel.
El costo de suavidad (Esmooth (f )) es un regularizador estandar en el campo de visión de
computadora, en [12] este costo esta modelado por,
X
Esmooth (f ) = Vp,q (fp , fq ) (2-10)
p,qN

Donde cada Vp,q penaliza todos los fp 6= fq de alguna manera. Este termino suma una fun-
cion potencial sobre todos los vecinos. Un uso simple de esta funcion puede ser dado por
Vp,q (fp , fq ) = K · |fp − fq | (con K siendo una constante arbitraria). Si cada Vpq define una
métrica, entonces la minimizacion de (2-8) se conoce como el problema de etiquetado métrico
y puede ser optimizado efectivamente con el algoritmo de la expansión alpha (α-expansion)
como se muestra en [12].
Los métodos de segmentación basados en energias lo que intentan es modelar algunas pro-
piedades globales de la imagen que no pueden capturar, por ejemplo, mediante técnicas de
correlacion locales. El problema principal, sin embargo, radica en que las energias algunas
vecces son dificiles de minimizar, como es el caso de minimización de funciones de energia
de multiples etiquetas [8].
Por lo tanto, para encontrar una solución aproximada en [8] se propusieron dos algoritmos
llamados, intercambio α − β y expansión α.

2.4.1. Algoritmo de intercambio α − β


Comenzamos con un etiquetado inicial tomado de las semillas proporcionadas por el usuario
o calculadas a partir de algún algoritmo. Ahora, para cada par de etiquetas encontramos
un etiquetado que es un intercambio α − β lejos del etiquetado actual de tal manera que
2.5 Algoritmo de Boykov-Kolmogorov 13

tendrá una energı́a mı́nima entre todos los etiquetados que están a un intercambio α − β
del etiquetado actual. En este paso, algunos pı́xeles que están etiquetados con anterioridad
como α pueden cambiar sus etiquetas a β(y viceversa), pero los pı́xeles cuyas etiquetas no
son α o β continuarán manteniendo su etiqueta anterior. Si este valor (de energı́a mı́nima) es
menor que el mı́nimo anterior (calculado para pares anteriores de etiquetas), establecemos
el indicador de éxito en 1. Este indicador indica que durante la iteración sobre pares de
etiquetas hemos encontrado otro etiquetado mı́nimo sobre el etiquetado mı́nimo anterior,
por lo que necesitamos iterar nuevamente sobre todos los pares de etiquetas [8].

2.4.2. Algoritmo de expansión α


El algoritmo de expansión es muy similar al algoritmo de intercambio con una diferencia
de que en cada iteración (para cada etiqueta) tratamos de encontrar el etiquetado que es
una expansión α del etiquetado actual. En la expansión α, algunos pı́xeles cuya etiqueta es
distinta de α (la etiqueta sobre la que estamos iterando) pueden cambiar sus etiquetas a
α, pero los pı́xeles cuya etiqueta es α no cambian su etiqueta. Por lo tanto, la expansion α
puede pensarse como un caso especial de intercambio α − β, donde β es una colección de
todas las etiquetas distintas de α y se permite el movimiento de solo β a α.

2.5. Algoritmo de Boykov-Kolmogorov


Cuando se resuelve la minimizacion de energia en graph cuts el paso principal es hallar el
corte minimo que separe el primer plano del fondo (en un contexto binario), en la figura 2-3
(b) se muestra un ejemplo de un grafico de dos terminales usado para minimizar la energia
en una imagen 3x3 con dos etiquetas.En la figura 2-3 (c) se muestra el corte realizado en
las terminales S/T . Cada pixel de la imagen esta asignado a una de las dos terminales S/T
14 2 Materiales y métodos

Figura 2-3: Ejemplo de proceso de graph cut [8]

En el árbol S, todos los bordes de cada nodo padre a sus hijos no están saturados, mientras
que en el árbol T, los bordes de los hijos a sus padres no están saturados1 . Los nodos que
no están en S o T se llaman libres. Los nodos en los árboles de búsqueda S y T pueden ser
activos o pasivos. Los nodos activos representan el borde exterior en cada árbol mientras que
los nodos pasivos son internos. Ahora, los nodos activos permiten que los árboles crezcan
mediante la adquisición de nuevos hijos (a lo largo de bordes no saturados) desde un conjunto
de nodos libres. Se encuentra una ruta de aumento tan pronto como un nodo activo en uno
de los árboles detecta un nodo vecino que pertenece al otro árbol.
El algoritmo de Boykov-kolmogorov tiene 3 etapas:

Etapa de crecimiento:los árboles de búsqueda S y T crecen hasta que tocan un camino


1
cuando se hace referencia a la saturacion de los nodos es una asignacion de un peso elevado para que
posteriormente en los algoritmos de expansion no ocurra un crecimiento desde la fuente hacia ella misma,
por ello se asignan pesos saturados a las dos terminales principales(para que el algoritmo no genere
caminos hacia si mismo)
2.5 Algoritmo de Boykov-Kolmogorov 15

s −→ t.

Etapa de aumento:la ruta encontrada es aumentada,los árboles de búsqueda se rompen


en bosques.

Etapa de adopción:los árboles S y T son restaurados

2.5.1. Etapa de crecimiento


En la etapa de crecimiento, los nodos activos exploran los bordes adyacentes no saturados
y adquieren nuevos hijos del conjunto de nodos libres. Ahora, los nodos recién adquiridos
se convertirán en miembros activos de los árboles de búsqueda correspondientes. Cuando
se exploran todos los vecinos de un nodo activo, se vuelve pasivo. La etapa de crecimiento
finaliza si un nodo activo encuentra un nodo vecino que pertenece al árbol opuesto. En este
caso,se detecta una ruta desde la fuente (S) al sumidero (T), como se muestra en la Figura
2-4 [8].

2.5.2. Etapa de aumento


La etapa de aumento incrementa el camino encontrado en la etapa de crecimiento. A medida
que estamos impulsando el flujo máximo posible a través del camino de aumento, algunos
bordes se saturarán. Entonces, cuando eliminamos ese borde, algunos de los nodos en los
árboles S y T pueden quedar huérfanos ya que los bordes que los unen a sus padres ya no
son válidos.Esta etapa efectúa la división de los árboles de búsqueda S y T en bosques. La
fuente(S) y el sumidero(T) siguen siendo las raı́ces de dos de los árboles, mientras que los
huérfanos forman las raı́ces de todos los demás árboles [8].

2.5.3. Etapa de adopción


Esta etapa es el aspecto más importante de todo el algoritmo. El objetivo de esta etapa
es restaurar la estructura de árbol único de los conjuntos S y T con raı́ces en la fuente y
el sumidero. En esta etapa, tratamos de encontrar padres válidos para huúrfanos creados
en la etapa de aumento. Un padre nuevo debe pertenecer al mismo conjunto, S o T, que
el huérfano. Un padre también debe estar conectado a través de un borde no saturado. Si
no hay un padre calificado, eliminamos al huérfano de S o T y lo convertimos en un nodo
libre. Después de que se completa la etapa de adopción, el algoritmo regresa a la etapa de
crecimiento. El algoritmo finaliza cuando los árboles de búsqueda S y T no pueden crecer
(no hay nodos activos) y los árboles están separados por bordes saturados. Esto implica que
se logra un flujo máximo [8].
16 2 Materiales y métodos

Figura 2-4: Ejemplo de árboles de busqueda S (nodos rojos) y T (nodos azules) [8]

2.6. Optimización bayesiana


El objetivo principal de una optimización en general es determinar los valores de las variables
que intervienen en un proceso o sistema para que el resultado sea el mejor posible.Pero lo que
hace especial a la optimización Bayesiana con respecto a otros métodos de optimización es
que esta construye un modelo probabilı́stico para la función que se desea optimizar y luego
explota el modelo para tomar decisiones sobre los siguientes valores a evaluar, al mismo
tiempo que integra la incertidumbre [25].
El lema principal de este método es usar toda la información previa disponible en las evalua-
ciones anteriores y no simplemente confiar en gradientes locales y aproximaciones Hessianas
que solo usan métodos de diferenciación con la evaluación anterior, por lo que se llega al pro-
blema de llegar a un mı́nimo local y no a la solución mı́nima global. Esto da como resultado
un procedimiento que encuentra el mı́nimo de funciones no convexas complejas con una can-
tidad relativamente baja de evaluaciones, a costa de realizar más cálculos para determinar
el siguiente punto a probar [25].
Hay dos decisiones importantes a tomar cuando se realiza una optimización Bayesiana: La
primera es seleccionar un prior sobre las funciones a evaluar, esto supondrá el comportamien-
to estadı́stico de la función a evaluar.Para esto, la mejor elección son los procesos Gausianos,
debido al teorema del lı́mite central que dice que cualquier distribución de probabilidad en
un experimento puede tender a una distribución normal o Gaussiana si se tiene un número
suficiente de experimentos, es decir cualquier distribución tiende a una distribución normal
conforme el número de muestras tienda a infinito [2]. La segunda, es escoger una función de
adquisición, la cual es usada para construir una función de utilidad desde el modelo posterior,
lo que nos permite determinar el siguiente punto a evaluar.

2.6.1. Procesos Gausianos


Un proceso Gaussiano es una generalización de la distribución de probabilidad Gaussiana.
Un proceso Gaussiano esta completamente especificado por su función de media y función
2.6 Optimización bayesiana 17

de covarianza. en [24] se define la funcion de media m(x) y función de varianza k(x, x0 ) de


un proceso real f (x) como

m(x) = E [f (x)] (2-11)

k(x, x0 ) = E [(f (x) − m(x))(f (x0 ) − m(x0 ))] (2-12)

y el proceso gaussiano es definido como

f (x) = GP(m(x), k(x, x0 )) (2-13)

Un proceso Gaussiano esta definido como un conjunto de variables aleatorias.Por lo tanto,


la definición automaticamente implica un requerimiento de consistencia, el cual es conocido
como una propiedad de marginalización. esto quiere decir que si el proceso Gaussiano tiene
asociadas las variables (y1 , y2 ) ∼ N (µ, Σ) debe especificar tambien y1 ∼ N (µ1 , Σ11 ) donde
Σ11 es una submatriz relevante de Σ. Todo esto ascociado especificamente a la propiedad
i.i.d (independientes e identicamente distribuidas) [24].

Limitaciones
Es importante tener en cuenta que los procesos Gaussianos no son apropiados para todos
los problemas. Por ejemplo, si se cree que la función que se está modelando tiene una dis-
continuidad en algún lugar desconocido no se puede expresar en términos de un proceso
gaussiano. Las funciones cuyo grado de suavidad o escala de variación varı́an en función de
las entradas, de manera desconocida, también son problemáticas.
Una forma de abordar estos problemas consiste en abandonar los procesos gaussianos a
favor de modelos basados en distribuciones estables no gaussianas, que pueden aproximarse
mediante redes neuronales [25].
Sin embargo, también se puede seguir usando un proceso gaussiano en el nivel más bajo del
modelo, pero introducir hiperparámetros en la función de media o de covarianza del proceso
gaussiano, de modo que se genere un proceso gaussiano no estacionario, es decir, la media y
la varianza no son constantes [25].

2.6.2. Funciones de adquisición


Suponemos que la función f (x) se extrae de un proceso Gaussiano y que nuestras observacio-
 N
nes son de la forma xn , yn n=1 , donde yn ∼ N (f (xn ), ν) y ν es la varianza del ruido introdu-
cido en las observaciones de la función.Esta asunción y estos datos inducen un posterior sobre
las funciones; la función de adquisición, que denotamos por a : X → R+ , determina que punto
en X debe evaluarse a continuación a través de una optimización xsiguiente = argmaxx a(x),
donde se han propuesto diferentes tipos de funciones. En general estas funciones de adqui-
sición dependen de las observaciones previas y de los hiperparametros de GP; denotamos
18 2 Materiales y métodos

esta dependencia como a(x; {xn , yn }, θ). Las funciones de adquisicion bajo el concepto de un
proceso gaussiano tienen una dependencia del modelo unicamente a través de su funcion de
media µ(x; {xn , yn }, θ) y la función de varianza σ 2 (x; {xn , yn }, θ).Para efectos prácticos se
denotara el mejora valor actual como xbest = argminxn f (xn ) [25].

Probabilidad de mejora
Una estrategia intuitiva es mejorar la probabilidad de mejora sobre el mejor valor actual,
bajo un proceso gaussiano puede ser computado analiticamente como

f (xbest ) − µ(x; {xn , yn }, θ)


aP I (x; {xn , yn }, θ) = Φ(γ(x)), γ(x) = (2-14)
σ(x; {xn , yn }, θ)

Mejora esperada
Alternativamente, uno podrı́a elegir maximizar la mejora esperada (EI ) sobre el mejor actual.
Esto también tiene forma cerrada bajo un proceso gaussiano

aEI (x; {xn , yn }, θ) = σ(x; {xn , yn }, θ)(γ(x)Φ(γ(x))) + N (γ(x); 0, 1) (2-15)

2.7. Esquema
En la figura 2-7 se muestra el procedimiento propuesto para optimizar los hiperparámetros
de graph cuts, se divide en 3 bloques principales, graph cuts, calculo del indice de desempeño,
y optimización bayesiana

Graph Cuts
Volumen(.mha)
Ω : [Ω1, Ω2, Ω3] T

Figura 2-5: Diagrama de caja negra de graph cuts

Indice de desempeño
T (Etiquetado)
J(T, T̂ ) f (J)

Figura 2-6: Diagrama de caja negra de Indice de desempeño


2.7 Esquema 19

Graph Cuts
Volumen(.mha) e
Ω : [Ω1, Ω2, Ω3] J(T, T̂ )

θ̂

f (Ω)
OptimizacionBayesiana

Figura 2-7: Diagrama de optimizacion bayesiana de hiperparametros de graph cuts

Graph cuts
para la implementación de graph cuts se implementó la estrategia usada en [15] que es
una estrategia basade en [12].

Cálculo del indice de desempeño


para el cálculo de los indices de desempeño se usó la libreria ITK [16] que tiene disponi-
bles 5 metricas de superposicion y 5 metricas de distancia superficial para la evaluación
de segmentacion de volumenes

Optimización Bayesiana
En [3] hay disponible una libreria de optimizacion bayesiana desarrollada en python
que permite ejecutar algunas estrategias presentes en [25].
El bloque de graph cuts tiene como hiperparametros

El bloque de graph cuts tiene como hiperparametros

Semilla de primer plano foreground (xf , yf , zf )

Semilla del fondo background (xb , yb , zb )

α (constante del algoritmo de expansión alpha)

componentes de modelo de mezcla de gaussinas usada en [12] para calcular la verosi-


militud (likelihood) que permite reducir la complejidad del algoritmo, es un modelo
no supervisado que permite la extraccion de caracteristicas de la imagen por medio de
inferencias gaussianas, que agrupa ciertos pixeles como en (k-neighbors [10])
Bibliografı́a
[1] In: Ackley, David H.: An empirical study of bit vector function optimization, p. 170–
204

[2] Alvarado Martinez, Hugo ; Retamal Perez, Lidia: Dificultades de comprension


del teorema central del limite en estudiantes universitarios. En: Educacion matematica
24 (2012), 12, p. 151 – 171. – ISSN 1665–5826

[3] authors, The G. GPyOpt: A Bayesian Optimization framework in python. http:


//github.com/SheffieldML/GPyOpt. 2016

[4] Baselice, F. ; Ferraioli, G. ; Pascazio, V.: Relaxation time estimation in MRI.


En: 2012 IEEE Nuclear Science Symposium and Medical Imaging Conference Record
(NSS/MIC), 2012. – ISSN 1082–3654, p. 3975–3978

[5] Birkbeck, N. ; Cobzas, D. ; Jagersand, M. ; Murtha, A. ; Kesztyues, T.: An


interactive graph cut method for brain tumor segmentation. En: 2009 Workshop on
Applications of Computer Vision (WACV), 2009. – ISSN 1550–5790, p. 1–7

[6] Bishop, Christopher M.: Pattern Recognition and Machine Learning (Information
Science and Statistics). Berlin, Heidelberg : Springer-Verlag, 2006. – ISBN 0387310738

[7] Boykov, Y. ; Veksler, O. ; Zabih, R.: Fast approximate energy minimization via
graph cuts. En: IEEE Transactions on Pattern Analysis and Machine Intelligence 23
(2001), Nov, Nr. 11, p. 1222–1239. – ISSN 0162–8828

[8] Boykov, Yuri ; Funka-Lea, Gareth: Graph Cuts and Efficient N-D Image Segmen-
tation. En: International Journal of Computer Vision 70 (2006), p. 109–131

[9] Chen, Xuan ; Nguyen, B. P. ; Chui, Chee-Kong ; Ong, Sim-Heng: Automated brain
tumor segmentation using kernel dictionary learning and superpixel-level features. En:
2016 IEEE International Conference on Systems, Man, and Cybernetics (SMC), 2016,
p. 002547–002552

[10] Cover, T. ; Hart, P.: Nearest Neighbor Pattern Classification. En: IEEE Trans. Inf.
Theor. 13 (2006), September, Nr. 1, p. 21–27. – ISSN 0018–9448
Bibliografı́a 21

[11] Dehkordi, M. T.: A new active contour model for tumor segmentation. En: 2017 3rd
International Conference on Pattern Recognition and Image Analysis (IPRIA), 2017, p.
233–236

[12] Delong, Andrew ; Osokin, Anton ; Isack, Hossam N. ; Boykov, Yuri: Fast Appro-
ximate Energy Minimization with Label Costs. En: Int. J. Comput. Vision 96 (2012),
Januar, Nr. 1, p. 1–27. – ISSN 0920–5691

[13] Huttenlocher, D. P. ; Klanderman, G. A. ; Rucklidge, W. J.: Comparing images


using the Hausdorff distance. En: IEEE Transactions on Pattern Analysis and Machine
Intelligence 15 (1993), Sep, Nr. 9, p. 850–863. – ISSN 0162–8828

[14] Ishikawa, H.: Exact optimization for Markov random fields with convex priors. En:
IEEE Transactions on Pattern Analysis and Machine Intelligence 25 (2003), Oct, Nr.
10, p. 1333–1336. – ISSN 0162–8828

[15] Jiřı́k, M. ; Lukes, V. ; Svobodova, M. ; Železný, M.: Image Segmentation in


Medical Imaging via Graph-Cuts., 2013

[16] Johnson, Hans J. ; McCormick, M. ; Ibáñez, L. ; Consortium, The Insight S.:


The ITK Software Guide. Third. Kitware, Inc., 2013. – In press

[17] Kistler, Michael ; Bonaretti, Serena ; Pfahrer, Marcel ; Niklaus, Roman ;


Büchler, Philippe: The Virtual Skeleton Database: An Open Access Repository for
Biomedical Research and Collaboration. En: J Med Internet Res 15 (2013), Nov, Nr.
11, p. e245

[18] McLay, Laura A. ; Goldberg, David E.: Efficient Genetic Algorithms Using Discre-
tization Scheduling. En: Evolutionary Computation 13 (2005), Nr. 3, p. 353–385

[19] Menze, B. H. ; Jakab, A. ; Bauer, S. ; Kalpathy-Cramer, J. ; Farahani, K.


; Kirby, J. ; Burren, Y. ; Porz, N. ; Slotboom, J. ; Wiest, R. ; Lanczi, L. ;
Gerstner, E. ; Weber, M. A. ; Arbel, T. ; Avants, B. B. ; Ayache, N. ; Buen-
dia, P. ; Collins, D. L. ; Cordier, N. ; Corso, J. J. ; Criminisi, A. ; Das, T. ;
Delingette, H. ; Demiralp, Ç. ; Durst, C. R. ; Dojat, M. ; Doyle, S. ; Festa, J.
; Forbes, F. ; Geremia, E. ; Glocker, B. ; Golland, P. ; Guo, X. ; Hamamci, A.
; Iftekharuddin, K. M. ; Jena, R. ; John, N. M. ; Konukoglu, E. ; Lashkari, D.
; Mariz, J. A. ; Meier, R. ; Pereira, S. ; Precup, D. ; Price, S. J. ; Raviv, T. R. ;
Reza, S. M. S. ; Ryan, M. ; Sarikaya, D. ; Schwartz, L. ; Shin, H. C. ; Shotton,
J. ; Silva, C. A. ; Sousa, N. ; Subbanna, N. K. ; Szekely, G. ; Taylor, T. J. ;
Thomas, O. M. ; Tustison, N. J. ; Unal, G. ; Vasseur, F. ; Wintermark, M. ;
Ye, D. H. ; Zhao, L. ; Zhao, B. ; Zikic, D. ; Prastawa, M. ; Reyes, M. ; Leemput,
K. V.: The Multimodal Brain Tumor Image Segmentation Benchmark (BRATS). En:
22 Bibliografı́a

IEEE Transactions on Medical Imaging 34 (2015), Oct, Nr. 10, p. 1993–2024. – ISSN
0278–0062

[20] Pelikan, Martin: Bayesian Optimization Algorithm: From Single Level to Hierarchy.
2002. – Informe de Investigación

[21] Pereira, S. ; Oliveira, A. ; Alves, V. ; Silva, C. A.: On hierarchical brain tumor


segmentation in MRI using fully convolutional neural networks: A preliminary study.
En: 2017 IEEE 5th Portuguese Meeting on Bioengineering (ENBENG), 2017, p. 1–4

[22] Perelman, School of M. CLINICALl RELEVANCE. http://www.med.upenn.edu/


sbia/brats2017/clinical-relevance.html. 2017

[23] Rao, C. H. ; Naganjaneyulu, P. V. ; Prasad, K. S.: Brain Tumor Detection and


Segmentation Using Conditional Random Field. En: 2017 IEEE 7th International Ad-
vance Computing Conference (IACC), 2017, p. 807–810

[24] Rasmussen, Carl E. ; Williams, Christopher K. I.: Gaussian Processes for Machine
Learning (Adaptive Computation and Machine Learning). The MIT Press, 2005. – ISBN
026218253X

[25] Snoek, Jasper ; Larochelle, Hugo ; Adams, Ryan P.: Practical Bayesian Opti-
mization of Machine Learning Algorithms. En: Proceedings of the 25th International
Conference on Neural Information Processing Systems - Volume 2. USA : Curran As-
sociates Inc., 2012 (NIPS’12), p. 2951–2959

[26] Taha, Abdel A. ; Hanbury, Allan: Metrics for Evaluating 3D Medical Image Segmen-
tation: Analysis, Selection, and Tool., 2015, p. 15:29

[27] Zhu, S. ; Gao, W. ; Zhang, Y. ; Zheng, J. ; Liu, Z. ; Yuan, G.: 3D automatic MRI
level set segmentation of inner ear based on statistical shape models prior. En: 2017
10th International Congress on Image and Signal Processing, BioMedical Engineering
and Informatics (CISP-BMEI), 2017, p. 1–6

Anda mungkin juga menyukai