Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/93896
Title: Evaluation and Prediction of Multiple Sclerosis Disease Progression
Other Titles: Avaliação e previsão da progressão de Esclerose Múltipla
Authors: Oliveira, Hugo Duarte
Orientador: Teixeira, César Alexandre Domingues
Pinto, Mauro Filipe da Silva
Keywords: Esclerose Múltipla; Machine Learning; Previsão da progressão da doença; Multiple Sclerosis; Machine Learning; Disease progression prediction
Issue Date: 27-Oct-2020
Serial title, monograph or event: Evaluation and Prediction of Multiple Sclerosis Disease Progression
Place of publication or event: CISUC
Abstract: Avaliar e prever a progressão de doentes com Esclerose Múltipla pode ser uma tarefa árdua devido à heterogeneidade de sintomas associada à doença. No presente trabalho foi usada uma base de dados do Centro Hospitalar e Universitário de Coimbra, contendo dados clínicos dos doentes, com o intuito de prever a progressão da doença. Embora a base de dados contivesse uma grande variedade de dados clinicos, foram usados apenas dados relativos à identificação, visitas e ataques sofridos pelos doentes, já que os demais continham bastante informação em falta. Os primeiros anos de informação da base de dados foram usados para prever o subtipo e a severidade da doença, avaliada através de uma escala de quantificação da condição neurológica (EDSS). Para tal, houve necessidade de proceder a uma seleção dos doentes para cada uma das previsões efetuadas, de forma a incluir apenas doentes com informação suficiente e um subtipo de Esclerose Múltipla de interesse. Para cada uma das base de dados efectou-se um processo de engenharia de features, no qual foram extraídas diversas outras características através dos campos da base de dados. Para tal, procedeu-se à aplicação de uma segmentação anual que permitiu aumentar significativamente a quantidade de informação disponivel. A cada conjunto de preditores constituintes de cada base de dados, foram aplicados algoritmos de machine learning, incluindo um balanceamento dos dados, a imputação dos valores em falta e a seleção dos preditores mais importantes, bem como uma avaliação da performance obtida com cada classificador. Os resultados obtidos foram avaliados e comparados com resultados de estudos existentes, usando como métricas a área debaixo da curva ROC, a sensibilidade, a especificidade, a G-mean e o F1-Score. Para além disto foram ainda construidos perfis de distribuição das features, de forma a identificar quais as features responsáveis por uma severidade mais acentuada da doença e por cada um dos subtipos de Esclerose Múltipla. Desta forma foi possivel comparar as performances usando várias definições de severidade da Esclerose Múltipla, bem como criar um modelo capaz de prever tanto casos mais severos como casos identificativos de um subtipo de Esclerose Múltipla progressivo. Em termos das features de um subtipo de Esclerose Múltipla foram identificados a via piramidal, o valor atribuído ao sistema funcional piramidal, o impacto nas atividades do dia a dia, a via do intestino e bexiga e o valor EDSS como era expectável, embora tenham sido identificadas outras features não esperadas tais como as vias sensoriais, cerebral, cerebelar e tronco cerebral. No que concerne à previsão da severidade, foram identificadas várias features esperadas, de entre as quais o valor de EDSS e vários sistemas funcionais.
Assessing and predicting the progression of patients with Multiple Sclerosis can be a difficult task due to the heterogeneity of symptoms associated with the disease. In this work, a database from the Centro Hospitalar e Universitário de Coimbra, containing clinical data of the MS patients, was used to predict the progression of the patients. Although the database contained a wide variety of clinical data, only data related to the identification, visits and relapses were used since the remaining contained a lot of missing data. The first years of information from the database were used to predict the patients' Multiple Sclerosis subtype and the disease severity, assessed using a neurological condition quantification scale (EDSS). For this, it was necessary to select patients for each of the predictions made, to include only patients with sufficient information and a subtype of Multiple Sclerosis of interest. For each of the databases, a feature engineering process was carried out, in which several other characteristics were extracted through the fields of the database. To this end, an annual segmentation was applied, which significantly increased the amount of information available. Machine learning algorithms were applied to each set of features of each database, including several steps such as balance of data, the imputation of missing values and the selection of the most important features, as well as an evaluation of the performance obtained with each classifier. The results obtained were evaluated and compared with results of existing studies, using as metrics the area under the ROC curve, sensitivity, specificity, G-mean and F1-Score. Besides, features distribution profiles were also constructed to identify those features responsible for a more severe case and each of the Multiple Sclerosis subtypes. In this way, it was possible to compare the performances using several definitions of Multiple Sclerosis severity, as well as to create a model capable of predicting more severe cases and identifying cases of a progressive Multiple Sclerosis subtype. In terms of features of a Multiple Sclerosis subtype, the pyramidal pathway, the Score pyramidal, the impact in activities of daily living and bowel and bladder pathway were identified as expected, although other unexpected features such as sensory, cerebral, cerebellar and brainstem related features have been identified. Regarding the severity prediction, several expected features were identified, among which the EDSS value and several functional systems.
Description: Trabalho de Projeto do Mestrado Integrado em Engenharia Biomédica apresentado à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/93896
Rights: openAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat
Projeto_de_tese_Hugo_Oliveira_2020.pdf11.41 MBAdobe PDFView/Open
Show full item record

Page view(s)

140
checked on Apr 16, 2024

Download(s)

90
checked on Apr 16, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons