Utilize este identificador para referenciar este registo: https://hdl.handle.net/10316/110562
Título: Visualization of Machine Learning Algorithms
Outros títulos: Visualização de Algoritmos de Machine Learning
Autor: Silva, Eduarda Jorge da
Orientador: Maçãs, Catarina Sofia Henriques
Lourenço, Nuno António Marques
Palavras-chave: Visualização de Dados; Random forest; Árvores de decisão; Features; Data Visualization; Random forest; Decision trees; Features
Data: 27-Set-2023
Título da revista, periódico, livro ou evento: Visualization of Machine Learning Algorithms
Local de edição ou do evento: DEI-FCTUC
Resumo: We live in an era in which Artificial Intelligence (AI) techniques are increasingly requested in several domains , especially taking into account the the technological progresses and data availability. The Digital Marketing area, is no exception, and is suffering a profound transformationdriven by the rapid changes in society itself, leading to the need to develop modern and competitive solutions. In an area where interaction with the customer is so frequent and essential, it is necessary to find ways to identify the best approach to increase customer satisfaction. In this scope AI techniques, specially Machine Learning (ML) can assist in the analysis and classification of different customer profiles. However, the task of analyzing/interpret the results obtained by an ML model is not simple, specially in the case of black-box models, with a high degree of complexity. In this work , we propose the use of Data Visualization (DV) techniques to interpret ML algorithms. Visualization allows the communication of complex relationships between data in an interpretable way. In the context of this dissertation, the visualization techniques, that aim to represent decision tree ensembles, can be accessed through a web application, allowing its users to analyze and improve the ML model in a more efficient way. When visualizing ML models, interactivity is a fundamental aspect in the interpretation of the model.After analyzing and interpreting the data, we studied various tree-based visualization techniques. We decided on the radial tree technique to represent the random forest and the sunburst technique to represent decision trees. Instead of representing the random forest through several trees, we chose to do it through a single tree whose nodes reveal the most important features at each depth level and the trees that contain them. The importance of the features is assessed according to the number of trees in the random forest in which they appear. To test this solution, we developed a web application called RaVi, which we evaluated through a questionnaire. Based on the participants' responses, we were able not only to assess which aspects of the visualizations work best but also what needs to be improved to guarantee the best user experience. In this document, we present the entire work process, from developing the concept to implementing and validating the visualizations and the web application.
Vivemos numa era em que as técnicas de Inteligência Artificial (IA) são cada vez mais requisitadas em diversos domínios, sobretudo tendo em conta os avanços tecnológicos e a disponibilidade de dados. A área de Marketing Digital não é exceção, e está a sofrer uma profunda transformação impulsionada pelas rápidas mudanças da própria sociedade, levando à necessidade de desenvolver soluções modernas e competitivas. Numa área onde a interação com o cliente é tão frequente e essencial, é necessário encontrar formas de identificar a melhor abordagem para aumentar a satisfação do cliente. Neste âmbito, as técnicas de IA, nomeadamente o Machine Learning (ML), podem auxiliar na análise e classificação dos diferentes perfis de clientes. No entanto, a tarefa de analisar/interpretar os resultados obtidos por um modelo de ML não é simples, especialmente no caso de modelos black box, com alto grau de complexidade.Neste trabalho, propomos a utilização de técnicas de Visualização de Dados (VD) para interpretar algoritmos de ML. A visualização permite a comunicação de relações complexas entre dados de uma forma interpretável. No contexto desta dissertação, as técnicas de visualização, que visam representar conjuntos de árvores de decisão, podem ser acedidas através de uma aplicação web, permitindo aos seus utilizadores analisar e melhorar o modelo de ML de uma forma mais eficiente. Na visualização de modelos de ML, a interatividade é um aspeto fundamental na interpretação do modelo.Depois de analisar e interpretar os dados, estudámos várias técnicas de visualização baseadas em árvores. Decidimos pela técnica da árvore radial para representar a random forest e pela técnica do sunburst para representar as árvores de decisão. Em vez de representar a random forest através de várias árvores, optámos por fazê-lo através de uma única árvore cujos nós revelam as características mais importantes em cada nível de profundidade e as árvores que as contêm. A importância das características é avaliada consoante o número de árvores da floresta aleatória em que elas aparecem. Para testar esta solução, desenvolvemos uma aplicação Web denominada RaVi, que avaliámos através de um questionário. Com base nas respostas dos participantes, foi possível avaliar não só quais os aspetos das visualizações que funcionam melhor, mas também o que precisa de ser melhorado para garantir a melhor experiência do utilizador. Neste documento, apresentamos todo o processo de trabalho, desde o desenvolvimento do conceito até à implementação e validação das visualizações e da aplicação Web.
Descrição: Dissertação de Mestrado em Design e Multimédia apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/110562
Direitos: openAccess
Aparece nas coleções:UC - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro TamanhoFormato
Dissertation-Eduarda-Silva.pdf32.43 MBAdobe PDFVer/Abrir
Mostrar registo em formato completo

Visualizações de página

19
Visto em 8/mai/2024

Google ScholarTM

Verificar


Este registo está protegido por Licença Creative Commons Creative Commons