Selección objetiva de secuencias de resonancia magnética relevantes para el diagnóstico de cáncer de mama utilizando MKL y SWM

View/ Open
QRCode
Share this
Date
2019Author
Advisor
Publisher
Instituto Tecnológico MetropolitanoCitation
Metadata
Show full item recordPDF Documents
Abstract
El cáncer de mama es el segundo más común entre todos los tipos de cáncer, y es también el más diagnosticado en mujeres, tanto en países desarrollados como en países en vías de desarrollo. En Colombia, el número de casos nuevos se incrementa sustancialmente cada año, y en muchas ocasiones sólo logra ser detectado en estados avanzados de desarrollo. Debido a la gran importancia que ha adquirido el estudio del cáncer de mama, se han propuesto diferentes métodos de tamizaje por medio de imágenes diagnósticas, que permiten detectar y estudiar esta enfermedad, siendo las imágenes de resonancia magnética (MRI por las siglas en inglés de Magnetice Resonance Imaging) una de las herramientas más prometedoras en cuanto a la información útil que proporcionan para realizar diagnósticos precisos y confiables. Sin embargo, el uso de MRI encuentra un gran obstáculo para su implementación, al ser más costoso que otros métodos, debido principalmente a la gran cantidad de imágenes agrupadas por secuencias que deben ser adquiridas e interpretadas. En los últimos años, se han desarrollado trabajos que buscan reducir el número de secuencias de MRI que deben ser implementadas para el diagnóstico de cáncer de mama, aunque estos trabajos encuentran un limitante, debido a que son completamente subjetivos y, por lo tanto, están ligados a la apreciación y criterio de los radiólogos especialistas y a los centros médicos en donde han sido realizados. Por otro lado, el uso de sistemas computacionales para apoyar los procesos de diagnóstico ha mostrado ser de gran utilidad en el área médica; además, desde el área de aprendizaje de máquina ha destacado el método de aprendizaje por múltiples kernels (MKL por las siglas en inglés de Múltiple Kernel Learning) debido a que permite integrar múltiples fuentes de información en una sola tarea, mostrando un buen desempeño y resultados fáciles de interpretar. En este proyecto se propone un método basado en el uso de MKL y máquinas de vectores de soporte (SVM por las siglas en inglés de Support Vector Machines), para seleccionar de forma objetiva y automática las secuencias de MRI más relevantes para el diagnóstico de cáncer de mama, mediante la penalización de los pesos asociados a cada una de las matrices kernel que representan las secuencias de MRI. Inicialmente, se generan características perceptuales y radiómicas a partir de cada una de las secuencias de MRI, luego se calculan y sintonizan los kernel s utilizando tres algoritmos diferentes basados en la técnica de escalamiento local. finalmente, La información de los kernels es llevada a una SVM, obteniendo como salida definitiva los pesos entrenados que son empleados como medidas de relevancia de las fuentes de información y las etiquetas predichas para los ejemplos procesados. Los resultados obtenidos demuestran que el método propuesto es estable en cuanto a las fuentes que son seleccionadas como fuentes relevantes, también indican que las fuentes de información correspondientes a las secuencias de Fases 2, 3, 4 y 5 son relevantes para la tarea de clasificación, cuando se diferencian lesiones positivas de negativas en estudios de resonancia magnética de mama. Al comparar el desempeño del método propuesto con dos métodos clásicos de selección de características del estado del arte, teniendo en cuenta que la selección de características es la analogía más próxima a la selección de fuentes, se puede identificar que el método propuesto supera a los métodos evaluados del estado del arte respecto a la selección objetiva y eficaz de las fuentes de información relevantes.
Abstract
Breast cancer is these cond most common among all cancer types and isalso the most diagnosed in women, both in developed and in developing countries. In Colombia, the number of new cases increases substantially very year,and inmany,it only can be detected in advanced stag of development. Due to the great importance that the study of breast cancer has acquired, different medical image-based screening methods that allow to detect and study this disease have been developed, being the magnetic resonance imaging (MRI) one of the most promising tools in terms of the useful information that provide to make sensible and reliable diagnoses. However, the massive use of MRI is restricted because it is more expensive than other methods, mainly due to the large number of images grouped by sequences that must be acquired and interpreted. Atrecent years,some work shave been developed seeking to reduce the number of MRI sequences that must be implemented for the diagnosis of breast cancer. However,these work shave limitations, because the sequence selection is completely subjective, and therefore they are linked to the appreciation and criteria of the radiologists and the medical centers where they have been performed.On the other hand,the use of computer systems to support diagnostic processes has proven to be very useful in the medical field; In addition, the machine learning area has highlighted the method of multiple kernel learning (MKL) because it allows to integrate multiple information sources in a single task,showing Good performance and easy to interpret results. In this project, a method based on the use of MKL and support vector machines (SVM) is proposed to objectively and automatically select the most relevant MRI sequences for the diagnosis of breast cancer, through the penalty of the weights associated with each one of the kernel matrices that represent the MRI sequences. Initially, perceptual and radiological features are generated from each MRI sequence,then the kernels are calculated and tuned using three different algorithms based on the locals caling technique. Finally,the information of the kernels feedsan SVM,obtainin gas final out put the train edweights, which are used as measures of relevance ofthe information sources,and the predicted labels for the processed examples. The obtained results show that the proposed method is stable in terms of the sources that are selected as relevant, they also indicate that the information sources corresponding to the sequences of Phases 2, 3, 4 and 5 are clearly relevant for the classification task, when differ positive lesions from negatives in breast MRI studies. When comparing the performance of the proposed method with two classical feature selection methods of the state of the art, taking into account that the feature selection is the closest analogy to the souce selection, it can be identified that the proposed method outperform the evaluated methods of the state of the art regarding the objective and effective selection of relevant information sources