Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/110562
Title: Visualization of Machine Learning Algorithms
Other Titles: Visualização de Algoritmos de Machine Learning
Authors: Silva, Eduarda Jorge da
Orientador: Maçãs, Catarina Sofia Henriques
Lourenço, Nuno António Marques
Keywords: Visualização de Dados; Random forest; Árvores de decisão; Features; Data Visualization; Random forest; Decision trees; Features
Issue Date: 27-Sep-2023
Serial title, monograph or event: Visualization of Machine Learning Algorithms
Place of publication or event: DEI-FCTUC
Abstract: We live in an era in which Artificial Intelligence (AI) techniques are increasingly requested in several domains , especially taking into account the the technological progresses and data availability. The Digital Marketing area, is no exception, and is suffering a profound transformationdriven by the rapid changes in society itself, leading to the need to develop modern and competitive solutions. In an area where interaction with the customer is so frequent and essential, it is necessary to find ways to identify the best approach to increase customer satisfaction. In this scope AI techniques, specially Machine Learning (ML) can assist in the analysis and classification of different customer profiles. However, the task of analyzing/interpret the results obtained by an ML model is not simple, specially in the case of black-box models, with a high degree of complexity. In this work , we propose the use of Data Visualization (DV) techniques to interpret ML algorithms. Visualization allows the communication of complex relationships between data in an interpretable way. In the context of this dissertation, the visualization techniques, that aim to represent decision tree ensembles, can be accessed through a web application, allowing its users to analyze and improve the ML model in a more efficient way. When visualizing ML models, interactivity is a fundamental aspect in the interpretation of the model.After analyzing and interpreting the data, we studied various tree-based visualization techniques. We decided on the radial tree technique to represent the random forest and the sunburst technique to represent decision trees. Instead of representing the random forest through several trees, we chose to do it through a single tree whose nodes reveal the most important features at each depth level and the trees that contain them. The importance of the features is assessed according to the number of trees in the random forest in which they appear. To test this solution, we developed a web application called RaVi, which we evaluated through a questionnaire. Based on the participants' responses, we were able not only to assess which aspects of the visualizations work best but also what needs to be improved to guarantee the best user experience. In this document, we present the entire work process, from developing the concept to implementing and validating the visualizations and the web application.
Vivemos numa era em que as técnicas de Inteligência Artificial (IA) são cada vez mais requisitadas em diversos domínios, sobretudo tendo em conta os avanços tecnológicos e a disponibilidade de dados. A área de Marketing Digital não é exceção, e está a sofrer uma profunda transformação impulsionada pelas rápidas mudanças da própria sociedade, levando à necessidade de desenvolver soluções modernas e competitivas. Numa área onde a interação com o cliente é tão frequente e essencial, é necessário encontrar formas de identificar a melhor abordagem para aumentar a satisfação do cliente. Neste âmbito, as técnicas de IA, nomeadamente o Machine Learning (ML), podem auxiliar na análise e classificação dos diferentes perfis de clientes. No entanto, a tarefa de analisar/interpretar os resultados obtidos por um modelo de ML não é simples, especialmente no caso de modelos black box, com alto grau de complexidade.Neste trabalho, propomos a utilização de técnicas de Visualização de Dados (VD) para interpretar algoritmos de ML. A visualização permite a comunicação de relações complexas entre dados de uma forma interpretável. No contexto desta dissertação, as técnicas de visualização, que visam representar conjuntos de árvores de decisão, podem ser acedidas através de uma aplicação web, permitindo aos seus utilizadores analisar e melhorar o modelo de ML de uma forma mais eficiente. Na visualização de modelos de ML, a interatividade é um aspeto fundamental na interpretação do modelo.Depois de analisar e interpretar os dados, estudámos várias técnicas de visualização baseadas em árvores. Decidimos pela técnica da árvore radial para representar a random forest e pela técnica do sunburst para representar as árvores de decisão. Em vez de representar a random forest através de várias árvores, optámos por fazê-lo através de uma única árvore cujos nós revelam as características mais importantes em cada nível de profundidade e as árvores que as contêm. A importância das características é avaliada consoante o número de árvores da floresta aleatória em que elas aparecem. Para testar esta solução, desenvolvemos uma aplicação Web denominada RaVi, que avaliámos através de um questionário. Com base nas respostas dos participantes, foi possível avaliar não só quais os aspetos das visualizações que funcionam melhor, mas também o que precisa de ser melhorado para garantir a melhor experiência do utilizador. Neste documento, apresentamos todo o processo de trabalho, desde o desenvolvimento do conceito até à implementação e validação das visualizações e da aplicação Web.
Description: Dissertação de Mestrado em Design e Multimédia apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/110562
Rights: openAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File SizeFormat
Dissertation-Eduarda-Silva.pdf32.43 MBAdobe PDFView/Open
Show full item record

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons