Evolutionary Machine Learning in Radiomics: A Case Study on Breast Cancer

Carvalho, Catarina Alexandra Almeida

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/96041

Title:	Evolutionary Machine Learning in Radiomics: A Case Study on Breast Cancer
Other Titles:	Aprendizagem Computacional Evolucionária na Radiómica: Um Estudo de Caso Sobre o Cancro da Mama
Authors:	Carvalho, Catarina Alexandra Almeida
Orientador:	Vanneschi, Leonardo Papanikolaou, Nikolaos Lourenço, Nuno António Marques
Keywords:	DENSER; Aprendizagem Computacional; Cancro da Mama; DENSER; Machine Learning; Breast Cancer
Issue Date:	18-Oct-2021
Project:	info:eu-repo/grantAgreement/FCT/3599-PPCDT/150361/PT
Serial title, monograph or event:	Evolutionary Machine Learning in Radiomics: A Case Study on Breast Cancer
Place of publication or event:	Centre for Informatics and Systems of the University of Coimbra
Abstract:	A mortalidade e incidência do cancro em todo o mundo vem a aumentar todos os anos, resultando num incentivo para o desenvolvimento de novas tecnologias de rastreio e diagnóstico. Uma técnica de rastreio é a imagiologia médica, como por exemplo a mamografia de raio-X. Esta técnica recolhe imagens que são posteriormente analisadas e avaliadas por um radiologista. No entanto, esta análise depende dos protocolos e da perícia do radiologista, estando sujeita a uma grande variação. Para melhorar os resultados de diagnóstico, e reduzir a variabilidade, pode-se recorrer a métodos computacionais, como por exemplo a Radiómica. A Radiómica é o processo que transforma as imagens médicas em características radiómicas, que podem depois ser utilizadas para treinar algoritmos de Aprendizagem Computacional (AC) para executar tarefas automaticamente. Contudo, o aumento da complexidade dos problemas, torna o AC tradicional ineficaz quando se lida com tarefas complexas como o diagnóstico do cancro. Portanto, para ultrapassar este problema, podemos recorrer a algoritmos de Aprendizagem Profunda (AP), que permite a extração e aprendizagem automática de uma grande quantidade de caracterisiticas. Os modelos AP podem ser construídos de raiz ou através da reutilização de modelos treinados para outros problemas. Ambos os métodos têm alguns problemas ao lidarem com pequenos conjuntos de dados, como por exemplo os dados de imagens médicas, o que pode originar um desempenho inferior ou sobreajustamento. Tendo isto em conta, há necessidade de recorrer a novas abordagens para construir modelos leves de AP. Uma abordagem inovadora e possível é utilizar o DENSER, que combina abordagens de AC e Computação Evolucionária, para projetar automaticamente modelos de AP e selecionar o melhor com base numa métrica de qualidade.Neste documento, exploramos a aplicação do DENSER num conjunto de dados de mamografia digital de rastreio. Duas experiências foram realizadas utilizando diferentes níveis de informação. Numa utilizámos imagens recortadas de 90x90 pixels e na outra utilizámos imagens recortadas com mais informação envolvente (250x250 pixels). Cada experiência inclui três estudos, nos quais as redes foram desenvolvidas ao longo de 150 ou 300 gerações, com ou sem aumento de dados. Depois, e considerando as melhores redes desenvolvidas pelo DENSER, foi implementado um mapa de calor de atenção para obter uma interpretação de como o modelo funcionava. Finalmente, realizámos um estudoutilizando a junção das 4, 3, ou 2 redes mais adequadas.Os nossos resultados mostraram que a implementação de 300 gerações e aumento de dados obteve as redes mais leves e os melhores resultados, com uma precisão de teste de 73.81% na primeira experiência (90x90 imagens) e 71.96% na segunda (250x250 imagens). Além disso, a junção das 4 redes mais adequadas resultou numa maior precisão e numadiminuição do número de casos mal classificados. Para o caso das imagens 90x90, obtivemos um aumento de 2.38% no valor da precisão de teste e menos 9 casos mal classificados, enquanto que para as imagens 250x250 os valores foram 2.64% e menos 10 casos mal classificados.Os nossos resultados superam os mencionados na literatura obtendo um aumento de 2.62% na precisão, utilizando menos tempo de treino, menos épocas, e não requerendo domínio ou conhecimento especializado. Finalmente, a eficácia do DENSER no tratamento de pequenos conjuntos de dados é um resultado notável. The mortality and incidence of cancer rates around the world are increasing every year, resulting in a push for new screening and diagnostic technologies. One screening technique is medical imaging, such as X-ray mammography. This method collects images that are later analysed and evaluated by a radiologist. Nevertheless, this analysis depended on the protocols and expertise of the radiologist and is subject to high variance. To improve the diagnostic results, and reduce the variability associated with it, one can resort to computational methods, such as Radiomics. Radiomics is the process that transforms medical images into radiomic features, which can afterwards be used to train Machine Learning (ML) algorithms to perform tasks automatically. However, the increase of the problems complexity, makes traditional Machine Learning ineffective when dealing with complex tasks such as cancer diagnostic. Therefore, to overcome this problem we can resort to Deep Learning (DL) algorithms, which allow the extraction and learning of a large amount of features automatically. DL models can be constructed from scratch orreusing models trained on other problems. Both the methods have some problems when dealing with small datasets, such as medical imaging datasets, which can lead to poor performance or overfitting. Taking this into account, there is a necessity to resort to new approaches to construct lightweight DL models. One novel and promising approach is to use DENSER, a rencently defined algorithm that combines Machine Learning and Evolutionary Computation approaches, to automatically design Deep Learning models and select the best one based on a quality metric.In this work, we explore the application of DENSER in a digital screening mammography dataset. Two experiments were performed using different levels of information. In one we used cropped images of 90x90 pixels and in the other we used cropped images with more surrounding information (250x250 pixels). Each experiment includes three studies, in which the networks were evolved through 150 or 300 generations, with or without data augmentation. After, and considering the best networks evolved by DENSER, an attention heat map was implemented to get an interpretation of how the model worked. Finally, we conducted a study using an ensemble of the 4, 3, or 2 fittest networks.Our results show that the implementation that uses 300 generations and data augmentation obtained the lightest networks and the best results, with a test accuracy of 73.81% in the first experiment (90x90 images) and 71.96% in the second (250x250 images). Furthermore, the assembling of the 4 fittest networks resulted in increased accuracy and a decrease in the number of misclassification cases. For the case of the 90x90 images, we got an increase of 2.38% in the test accuracy value and 9 fewer misclassification cases, whilst for the 250x250 images the values were 2.64% and 10 fewer misclassified.Our results outperform the state of the art obtaining an increase of 2.62% in accuracy, using less training time, fewer epochs, and not requiring domain or expert knowledge. Finally, the effectiveness of DENSER in handling small datasets is a remarkable outcome.
Description:	Dissertação de Mestrado Integrado em Engenharia Física apresentada à Faculdade de Ciências e Tecnologia
URI:	https://hdl.handle.net/10316/96041
Rights:	openAccess
Appears in Collections:	UC - Dissertações de Mestrado

Files in This Item:

File	Description	Size	Format
Catarina Carvalho 2016223380.pdf		9.59 MB	Adobe PDF	View/Open

Show full item record

Page view(s)

256

checked on Aug 13, 2024

Download(s)

202

checked on Aug 13, 2024

Google Scholar^TM

Check

This item is licensed under a Creative Commons License

Files in This Item:

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM