Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/88059
Title: Reconhecimento Automático de Emoções em Texto com recurso a emojis
Other Titles: Emotion Recognition form Portuguese Texts with emojis
Authors: Duarte, Luís Carlos Fernandes
Orientador: Oliveira, Hugo Ricardo Gonçalo
Macedo, Luís Miguel Machado Lopes
Keywords: Deteção de Emoções; Twitter; Língua Portuguesa; Emojis; Aprendizagem Computacional; Emotion Detection; Twitter; Portuguese language; Emojis; Machine Learning
Issue Date: 12-Sep-2019
Serial title, monograph or event: Reconhecimento Automático de Emoções em Texto com recurso a emojis
Place of publication or event: DEI-FCTUC
Abstract: A deteção automática de emoções é utilizada em várias aplicações, na tentativa de resolver problemas relevantes e atuais, nomeadamente nas áreas da saúde, de marketing e de interação humana com o computador. Tem sido feito com recurso a inúmeros métodos, sendo que os primeiros passos dados nesta área foram através de câmaras de vídeo. Hoje em dia, com o número crescente de utilizadores e a utilização diária das redes sociais, a deteção de emoções com base em texto, assume cada vez maior importância e melhores resultados.Textos que os utilizadores publicam nestas redes contêm novas características, que os textos comuns não continham até agora, tais como os hashtags ou os emojis. Estas características permitem mais facilmente identificar o estado emocional do autor na altura da sua escrita, ou seja, são características a ter em conta no desenvolvimento de modelos para a deteção e classificação automática de emoções, apenas com recurso a texto. A língua inglesa tem sido objeto de estudo neste domínio. Já para o português o trabalho neste âmbito é escasso e particularmente inexistente no que toca à consideração de emojis.Tendo isto em conta, este trabalho abordará o desenvolvimento de modelos de aprendizagem computacional que permitam a classificação de emoções em pequenos textos portugueses. Tais modelos foram baseados em arquiteturas com bons resultados para tarefas de classificação de texto. Exemplos destes modelos são o Naive Bayes, SVM, e ainda redes neuronais LSTM. Esta escolha deve-se ao facto de cada um deles recorrer a formas distintas de efetuar a classificação de dados. Para cumprir este objetivo, foi recolhido um conjunto de textos curtos a partir da rede social Twitter, anotados automaticamente com base na presença emojis. Estes dados foram aplicados ao treino de modelos, para a classificação das emoções expressas no texto. Com os modelos desenvolvidos efetuamos uma série de experiências para verificar qual o modelo mais adequado para esta tarefa. Com as várias experiências aos modelos desenvolvidos retirou-se diversas conclusões sobre a utilização de emojis e dos conteúdos partilhados nas redes sociais.
Automatic emotion detection is used in a variety of applications to address relevant and current issues, particularly in the areas of health, marketing and human interaction with the computer. It has been done using numerous methods, and the first steps taken in this area were through camcorders. Today, with the growing number of users and daily use of social networks, text-based emotion detection is becoming increasingly important with improving results.Texts that users post on these networks contain new features, which common texts did not contain so far, such as hashtags or emojis. These characteristics make it easier to identify the author's emotional state at the time of his writing, ie, characteristics to be considered when developing models for the automatic detection and classification of emotions, using text only. The English language has been the subject of study in this field. For Portuguese, however, work in this area is scarce and particularly non-existent regarding the consideration of emojis.Taking this into account, this paper will address the development of computational learning models that allow the classification of emotions in small Portuguese texts. Such models were based on architectures with good results for text classification tasks. Examples of these models are Naive Bayes, SVM, and even LSTM neural networks. This choice is due to the fact that each uses different ways of classifying data.To accomplish this goal, we collected a set of short texts from Twitter, annotated automatically based on the presence of emojis. These data were applied to model training for the classification of emotions expressed in the text. With the developed models we carried out a series of experiments to verify which model is best suited for this task. With the various experiences of the developed models, several conclusions were drawn about the use of emojis and shared content in social networks.
Description: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/88059
Rights: openAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat
Tese_LuisDuarteFinal.pdf4.03 MBAdobe PDFView/Open
Show full item record

Page view(s)

364
checked on Apr 23, 2024

Download(s)

431
checked on Apr 23, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons