Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/107956
Title: Bio-Inspired Automatic Feature Engineering for Audiology
Other Titles: Bio-Inspired Automatic Feature Engineering for Audiology
Authors: Rabuge, Miguel André Lourenço
Orientador: Lourenço, Nuno António Marques
Keywords: Aprendizagem Computacional Automática; Computação Evolucionária; Evolução Gramatical; Engenharia de Atributos; Perda Auditiva; Automated Machine Learning; Evolutionary Computation; Grammatical Evolution; Feature Engineering; Hearing Loss
Issue Date: 20-Jul-2023
Serial title, monograph or event: Bio-Inspired Automatic Feature Engineering for Audiology
Place of publication or event: DEI-FCTUC
Abstract: A perda de audição é um problema cada vez mais sério na sociedade. Em Fevereiro de 2023, a Organização Mundial da Saúde (OMS) afirmou que 5% da população mundial (430 milhões de pessoas) necessita de reabilitação para tratar da sua perda auditiva [WHO - Hearing Loss]. À medida que dados médicos vão sendo gerados e armazenados digitalmente, engenheiros e ciêntistas de dados procuram ajudar a resolver problemas na área da medicina, de forma automatizada.Deste modo, um método que consiga prever preemptivamente perda auditiva é de extrema importância.Dada a tendência atual onde dados de vários tipos estão a ser obtidos de diversas fontes, surge a necessidade de selecionar e combinar esta informação com vista a maximizar a deteção de perda auditiva.Feature Engineering é uma tarefa demorada e propensa a erros, dado que geralmente é realizada por especialistas humanos. A framework examinada neste trabalho tem como objetivo aumentar automaticamente o desempenho dos modelos de Machine Learning, aprimorando os atributos originais através de métodos evolucionários de seleção e construção de atributos. Este trabalho propõe FEDORA, uma framework evolucionária de Automated Machine Learning para Feature Engineering. A framework proposta será comparada com técnicas estado-da-arte de Feature Engineering e analisada em termos de desempenho e de seleção e construção de atributos. O melhor resultado da framework é de 76,2% Balanced Accuracy, usando 9 atributos (5 originais, 2 Engineered e 2 complexos) dos 60 originais. A framework foi capaz de gerar uma transformação que alcançou uma pontuação de 72,8% Balanced Accuracy com 1 único atributo complexo. Os resultados apontam para a framework ser capaz de reduzir a dimensionalidade dos dados enquanto estatisticamente mantém performance.
Hearing Loss (HL) is becoming a concerning problem in modern society. In February 2023, the World Health Organization (WHO) stated that over 5% of the world’s population (430 million people) requires rehabilitation to address HL [WHO - Hearing Loss]. As more medical data is being produced and stored digitally, data scientists and engineers are trying to help solve medical field-related problems in an automated manner. Therefore, a method to preemptively predict HL is of utter importance.Given the current trend where information of varied types is being collected from multiple sources, a need to select and combine these pieces of information arises when aiming to maximize the prediction of HL.Feature Engineering (FE) is a time-consuming and error-prone task as it is usually made by human experts. The framework examined in this work aims to automatically boost Machine Learning (ML) models’ performance by enhancing original features through evolutionary Feature Selection (FS) and Feature Construction (FC) methods.This work proposes FEDORA, an Evolutionary Automated Machine Learning (AutoML) framework for FE. The proposed framework will be compared with state-of-the-art FE techniques and analysed in terms of performance and of FE. The best result of the framework is 76.2% balanced accuracy, using 9 total features (5 Original, 2 Engineered and 2 Complex) out of the 60 original ones. FEDORA was able to engineer a transformation that achieved a score of 72,8% balanced accuracy with 1 single complex feature. Results point to FEDORA being able to reduce the dimensionality of the data while statistically maintaining performance.
Description: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/107956
Rights: openAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File SizeFormat
TeseMiguelRabuge.pdf3.07 MBAdobe PDFView/Open
Show full item record

Page view(s)

85
checked on Apr 30, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons