Tesis o trabajo de grado presentado como requisito parcial para optar al tı́tulo de:
Ingeniero Electrónico
Director:
M.Sc. Hernán Felipe Garcı́a Arias
Lı́nea de Investigación:
Aprendizaje de máquina
Resumen
Abstract
The main objective of this work is to develop a methodology for the improvement of tu-
mor segmentation in magnetic resonance imaging using Bayesian optimization and graph
cuts. So this work proposes to seek an optimization of hyperparameters present in graph
cuts by bayesian optimization, for this, the performance of this strategy is analyzed in mag-
netic resonance images using specifically the brats challenge 2015 database [19]. Observing
the performance of this strategy in the complexity of the tumor segmentation, obtaining
results such as an average Dice coefficient equal to 0.8624, a very competitive result with
respect to the present strategies that report Dice coefficients of approximately 0.9
Keywords: graph cuts , BraTS, brain tumor segmentation, Bayesian optimization
Contenido
Agradecimientos VII
Resumen IX
1. Introducción 2
1.1. Graph cuts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2. Optimización bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2. Materiales y métodos 7
2.1. Base de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.1. Imagenes de resonancia magnética . . . . . . . . . . . . . . . . . . . . 8
2.1.2. Secuencias de imágenes de resonancia magnética . . . . . . . . . . . . 9
2.2. Métricas para evaluar la segmentación de imagenes médicas . . . . . . . . . 10
2.2.1. Métricas de superposición . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2. Métricas de distancia superficial . . . . . . . . . . . . . . . . . . . . . 11
2.3. Graph cuts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4. Minimización de energia usando graph cuts . . . . . . . . . . . . . . . . . . . 12
2.4.1. Algoritmo de intercambio α − β . . . . . . . . . . . . . . . . . . . . . 12
2.4.2. Algoritmo de expansión α . . . . . . . . . . . . . . . . . . . . . . . . 13
2.5. Algoritmo de Boykov-Kolmogorov . . . . . . . . . . . . . . . . . . . . . . . . 13
2.5.1. Etapa de crecimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.5.2. Etapa de aumento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.5.3. Etapa de adopción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.6. Optimización bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.6.1. Procesos Gausianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.6.2. Funciones de adquisición . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.7. Esquema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Bibliografı́a 20
1 Introducción
La importancia de la detección temprana de un tumor cerebral a tiempo es un factor de vida
o muerte; para ello se capturan imágenes detalladas del cerebro por medio de resonancias
magnéticas, estas resonancias magnéticas posteriormente deben ser analizadas por un ra-
diólogo, que evalúa si la resonancia posee anomalı́as, el problema principal radica en que la
disponibilidad de radiólogos actualmente no satisface el requerimiento actual de análisis de
imágenes de resonancias magnéticas, por lo que él solo análisis de una imagen de resonancia
magnética del cerebro podrı́a llegar a requerir de un tiempo muy valioso [19]
Los gliomas son el mal primario más común en el cerebro, con diferentes grados de agresi-
vidad, prognosis variable y diversas sub-regiones histológicas heterogéneas, es decir, edema
peri-tumoral, núcleo necrótico, núcleo tumoral potenciador y no potenciador. Esta hetero-
geneidad intrı́nseca de los gliomas también se retrata en su fenotipo de imagen (apariencia y
forma), ya que sus subregiones se describen por diferentes perfiles de intensidad diseminados
a través de exploraciones de MRI multimodales, lo que refleja propiedades tumorales varia-
bles. Debido a este aspecto y forma altamente heterogéneos, la segmentación de los tumores
cerebrales en las exploraciones MRI multimodales es una de las tareas más difı́ciles en el
análisis de imágenes médicas [22]
Existe un creciente cuerpo de literatura sobre algoritmos computacionales que abordan esta
importante tarea. Desafortunadamente, los conjuntos de datos abiertos para diseñar y probar
estos algoritmos no están actualmente disponibles y los conjuntos de datos privados difieren
tan ampliamente que es difı́cil comparar las diferentes estrategias de segmentación que se han
reportado hasta ahora. Los factores crı́ticos que conducen a estas diferencias incluyen, pero
no se limitan a, 1) las modalidades de imagen empleadas, 2) el tipo de tumor (GBM o LGG,
tumores primarios o secundarios, sólido o infiltrativo) y 3) el estado de la enfermedad (las
imágenes pueden no sólo ser adquiridas antes del tratamiento, sino también postoperatorias
y, por lo tanto, mostrar efectos de radioterapia y cavidades quirúrgicas)[22]
La detección de tumores en imágenes de resonancia magnética es un tema de investiga-
ción actualmente por lo que se buscan estrategias que mejoren los resultados obtenidos por
técnicas de segmentación comunes, a continuación se citaran diferentes métodos usados para
segmentar tumores en imágenes de resonancia magnética propuestas por diversos investiga-
dores
Maryam Taghizadeh Dehkordi et al [11]. propone en este método una función de energı́a que
recibe como parámetro de entrada, la salida de un filtro Gaussiano de múltiple escala aplicado
a la imagen, que determina la posibilidad de que cada pixel pertenezca a la estructura de
3
En la tabla 1-1 se muestran los resultados obtenidos en cada una de las estrategias, los
resultados dados en cuanto a precisión provienen de la comparación entre la segmentación
implementada en la estrategia propuesta y la segmentación manual realizada por expertos,
que es dada en las bases de datos de cada uno de las estrategias, ya que las bases de datos
provienen de BRATS CHALLENGE que contiene una base de datos con 4 tipos de MRI :
FLAIR, T1, T1c, T2. Y la segmentación manual denominada Ground Truth [19].
limitantes como son la calidad de la imagen a analizar, ya que de ella depende el pronóstico
acertado debido a que en la imagen se debe tener una alta calidad para lograr diferenciar
sustancias grises de tumores. En el mundo del aprendizaje de maquina se busca desarrollar
modelos probabilı́sticos que revelen información sobre una determinada función; estos mode-
los probabilı́sticos tienen como base ciertos parámetros que deben ser sintonizados o variados
dependiendo del tipo de función de la que se desea obtener información, la efectividad en
la información obtenida por estos modelos depende totalmente de la adecuada sintonización
de estos parámetros. La optimización bayesiana es un método iterativo que busca la opti-
mización global de funciones, aplicada a la optimización de hiperparámetros. Consiste en
desarrollar un modelo estadı́stico de la función desde valores de hiperparámetros hasta el
objetivo evaluado en un conjunto de validación, lo que resuelve de cierto modo el problema
presentado anteriormente [25]
para este proyecto se plantearon los siguientes objetivos:
BRATS CHALLENGE
DATASET
En la figura 2-2 se muestran los diferentes tipos de imágenes disponibles en la base de datos
de brats challenge [19], como se puede observar cada imagen presenta diferentes tipos de
intensidades que hacen que cada imagen tenga una utilidad diferente en cuanto a detección
de partes del tumor se refiere, las anotaciones manuales disponibles en la base de datos
(brats challenge [19]) contienen 5 tipos diferentes de categorı́as representando las categorias
internas del tumor [19, 17]:
0 todo lo demás.
8 2 Materiales y métodos
1 necrosis
2 edema.
3 tumor no agudo.
4 tumor agudo.
(a) (b)
(c) (d)
Figura 2-2: Diferentes tipos de secuencias presentes en [19]. (a) secuencia flair, (b) secuencia
t2, (c) secuencia t1, (d)secuencia t1c
En cada tipo de imagen se facilita mas la deteccion de una parte del tumor que en otras,
para la detección del tumor completo se facilita en las secuencias flair y t2, en la secuencia
t2 se facilita mas la detección del núcleo tumoral, por lo que la selección correcta del tipo
de MRI es un factor determinante en el desempeño de la segementación [19].
En la tabla 2-1 se muestran los diferentes tiempos de repetición y eco para las secuencias
mas comunes de MRI
Tabla 2-1: Tiempos de repetición y eco para de secuencias comunes en MRI [4]
Secuencias TR TE
MRI (ms) (ms)
T1 500 14
T2 4000 90
Flair 9000 114
10 2 Materiales y métodos
2 |A ∩ B| 2T P
DC = = (2-1)
|A| + |B| 2T P + F P + F N
Indice de Jaccard.
El indice de Jaccard entre dos conjuntos esta definido como la interseccion entre ellos
dividida por su unión
|A ∩ B| TP
J(A, B) = = (2-2)
|A ∪ B| TP + FP + FN
Eso significa que ambas métricas (Dice,Jaccard) miden los mismos aspectos y propor-
cionan la misma clasificación del sistema. Por lo tanto, no proporciona información
adicional para seleccionar a ambos juntos como métricas de validación
TP
TPR = (2-3)
TP + FN
TN
T NR = (2-4)
TN + FP
En este contexto Esmooth (f ) es una medidad de la suavidad por partes del etiquetado f ,
mientras que Edata (f ) mide la discrepancia entre f y los datos observados.
Donde Dp mide que tan bien la etiqueta fp se ajusta al pixel p, por lo genral se evalua esto
usando una norma cuadratica,que puede sser dada por (fp − ip )2 donde ip es la intensidad
original del pixel.
El costo de suavidad (Esmooth (f )) es un regularizador estandar en el campo de visión de
computadora, en [12] este costo esta modelado por,
X
Esmooth (f ) = Vp,q (fp , fq ) (2-10)
p,qN
Donde cada Vp,q penaliza todos los fp 6= fq de alguna manera. Este termino suma una fun-
cion potencial sobre todos los vecinos. Un uso simple de esta funcion puede ser dado por
Vp,q (fp , fq ) = K · |fp − fq | (con K siendo una constante arbitraria). Si cada Vpq define una
métrica, entonces la minimizacion de (2-8) se conoce como el problema de etiquetado métrico
y puede ser optimizado efectivamente con el algoritmo de la expansión alpha (α-expansion)
como se muestra en [12].
Los métodos de segmentación basados en energias lo que intentan es modelar algunas pro-
piedades globales de la imagen que no pueden capturar, por ejemplo, mediante técnicas de
correlacion locales. El problema principal, sin embargo, radica en que las energias algunas
vecces son dificiles de minimizar, como es el caso de minimización de funciones de energia
de multiples etiquetas [8].
Por lo tanto, para encontrar una solución aproximada en [8] se propusieron dos algoritmos
llamados, intercambio α − β y expansión α.
tendrá una energı́a mı́nima entre todos los etiquetados que están a un intercambio α − β
del etiquetado actual. En este paso, algunos pı́xeles que están etiquetados con anterioridad
como α pueden cambiar sus etiquetas a β(y viceversa), pero los pı́xeles cuyas etiquetas no
son α o β continuarán manteniendo su etiqueta anterior. Si este valor (de energı́a mı́nima) es
menor que el mı́nimo anterior (calculado para pares anteriores de etiquetas), establecemos
el indicador de éxito en 1. Este indicador indica que durante la iteración sobre pares de
etiquetas hemos encontrado otro etiquetado mı́nimo sobre el etiquetado mı́nimo anterior,
por lo que necesitamos iterar nuevamente sobre todos los pares de etiquetas [8].
En el árbol S, todos los bordes de cada nodo padre a sus hijos no están saturados, mientras
que en el árbol T, los bordes de los hijos a sus padres no están saturados1 . Los nodos que
no están en S o T se llaman libres. Los nodos en los árboles de búsqueda S y T pueden ser
activos o pasivos. Los nodos activos representan el borde exterior en cada árbol mientras que
los nodos pasivos son internos. Ahora, los nodos activos permiten que los árboles crezcan
mediante la adquisición de nuevos hijos (a lo largo de bordes no saturados) desde un conjunto
de nodos libres. Se encuentra una ruta de aumento tan pronto como un nodo activo en uno
de los árboles detecta un nodo vecino que pertenece al otro árbol.
El algoritmo de Boykov-kolmogorov tiene 3 etapas:
s −→ t.
Figura 2-4: Ejemplo de árboles de busqueda S (nodos rojos) y T (nodos azules) [8]
Limitaciones
Es importante tener en cuenta que los procesos Gaussianos no son apropiados para todos
los problemas. Por ejemplo, si se cree que la función que se está modelando tiene una dis-
continuidad en algún lugar desconocido no se puede expresar en términos de un proceso
gaussiano. Las funciones cuyo grado de suavidad o escala de variación varı́an en función de
las entradas, de manera desconocida, también son problemáticas.
Una forma de abordar estos problemas consiste en abandonar los procesos gaussianos a
favor de modelos basados en distribuciones estables no gaussianas, que pueden aproximarse
mediante redes neuronales [25].
Sin embargo, también se puede seguir usando un proceso gaussiano en el nivel más bajo del
modelo, pero introducir hiperparámetros en la función de media o de covarianza del proceso
gaussiano, de modo que se genere un proceso gaussiano no estacionario, es decir, la media y
la varianza no son constantes [25].
esta dependencia como a(x; {xn , yn }, θ). Las funciones de adquisicion bajo el concepto de un
proceso gaussiano tienen una dependencia del modelo unicamente a través de su funcion de
media µ(x; {xn , yn }, θ) y la función de varianza σ 2 (x; {xn , yn }, θ).Para efectos prácticos se
denotara el mejora valor actual como xbest = argminxn f (xn ) [25].
Probabilidad de mejora
Una estrategia intuitiva es mejorar la probabilidad de mejora sobre el mejor valor actual,
bajo un proceso gaussiano puede ser computado analiticamente como
Mejora esperada
Alternativamente, uno podrı́a elegir maximizar la mejora esperada (EI ) sobre el mejor actual.
Esto también tiene forma cerrada bajo un proceso gaussiano
2.7. Esquema
En la figura 2-7 se muestra el procedimiento propuesto para optimizar los hiperparámetros
de graph cuts, se divide en 3 bloques principales, graph cuts, calculo del indice de desempeño,
y optimización bayesiana
Graph Cuts
Volumen(.mha)
Ω : [Ω1, Ω2, Ω3] T
Indice de desempeño
T (Etiquetado)
J(T, T̂ ) f (J)
Graph Cuts
Volumen(.mha) e
Ω : [Ω1, Ω2, Ω3] J(T, T̂ )
θ̂
f (Ω)
OptimizacionBayesiana
Graph cuts
para la implementación de graph cuts se implementó la estrategia usada en [15] que es
una estrategia basade en [12].
Optimización Bayesiana
En [3] hay disponible una libreria de optimizacion bayesiana desarrollada en python
que permite ejecutar algunas estrategias presentes en [25].
El bloque de graph cuts tiene como hiperparametros
[6] Bishop, Christopher M.: Pattern Recognition and Machine Learning (Information
Science and Statistics). Berlin, Heidelberg : Springer-Verlag, 2006. – ISBN 0387310738
[7] Boykov, Y. ; Veksler, O. ; Zabih, R.: Fast approximate energy minimization via
graph cuts. En: IEEE Transactions on Pattern Analysis and Machine Intelligence 23
(2001), Nov, Nr. 11, p. 1222–1239. – ISSN 0162–8828
[8] Boykov, Yuri ; Funka-Lea, Gareth: Graph Cuts and Efficient N-D Image Segmen-
tation. En: International Journal of Computer Vision 70 (2006), p. 109–131
[9] Chen, Xuan ; Nguyen, B. P. ; Chui, Chee-Kong ; Ong, Sim-Heng: Automated brain
tumor segmentation using kernel dictionary learning and superpixel-level features. En:
2016 IEEE International Conference on Systems, Man, and Cybernetics (SMC), 2016,
p. 002547–002552
[10] Cover, T. ; Hart, P.: Nearest Neighbor Pattern Classification. En: IEEE Trans. Inf.
Theor. 13 (2006), September, Nr. 1, p. 21–27. – ISSN 0018–9448
Bibliografı́a 21
[11] Dehkordi, M. T.: A new active contour model for tumor segmentation. En: 2017 3rd
International Conference on Pattern Recognition and Image Analysis (IPRIA), 2017, p.
233–236
[12] Delong, Andrew ; Osokin, Anton ; Isack, Hossam N. ; Boykov, Yuri: Fast Appro-
ximate Energy Minimization with Label Costs. En: Int. J. Comput. Vision 96 (2012),
Januar, Nr. 1, p. 1–27. – ISSN 0920–5691
[14] Ishikawa, H.: Exact optimization for Markov random fields with convex priors. En:
IEEE Transactions on Pattern Analysis and Machine Intelligence 25 (2003), Oct, Nr.
10, p. 1333–1336. – ISSN 0162–8828
[18] McLay, Laura A. ; Goldberg, David E.: Efficient Genetic Algorithms Using Discre-
tization Scheduling. En: Evolutionary Computation 13 (2005), Nr. 3, p. 353–385
IEEE Transactions on Medical Imaging 34 (2015), Oct, Nr. 10, p. 1993–2024. – ISSN
0278–0062
[20] Pelikan, Martin: Bayesian Optimization Algorithm: From Single Level to Hierarchy.
2002. – Informe de Investigación
[24] Rasmussen, Carl E. ; Williams, Christopher K. I.: Gaussian Processes for Machine
Learning (Adaptive Computation and Machine Learning). The MIT Press, 2005. – ISBN
026218253X
[25] Snoek, Jasper ; Larochelle, Hugo ; Adams, Ryan P.: Practical Bayesian Opti-
mization of Machine Learning Algorithms. En: Proceedings of the 25th International
Conference on Neural Information Processing Systems - Volume 2. USA : Curran As-
sociates Inc., 2012 (NIPS’12), p. 2951–2959
[26] Taha, Abdel A. ; Hanbury, Allan: Metrics for Evaluating 3D Medical Image Segmen-
tation: Analysis, Selection, and Tool., 2015, p. 15:29
[27] Zhu, S. ; Gao, W. ; Zhang, Y. ; Zheng, J. ; Liu, Z. ; Yuan, G.: 3D automatic MRI
level set segmentation of inner ear based on statistical shape models prior. En: 2017
10th International Congress on Image and Signal Processing, BioMedical Engineering
and Informatics (CISP-BMEI), 2017, p. 1–6