Utilize este identificador para referenciar este registo: https://hdl.handle.net/10316/88059
Título: Reconhecimento Automático de Emoções em Texto com recurso a emojis
Outros títulos: Emotion Recognition form Portuguese Texts with emojis
Autor: Duarte, Luís Carlos Fernandes
Orientador: Oliveira, Hugo Ricardo Gonçalo
Macedo, Luís Miguel Machado Lopes
Palavras-chave: Deteção de Emoções; Twitter; Língua Portuguesa; Emojis; Aprendizagem Computacional; Emotion Detection; Twitter; Portuguese language; Emojis; Machine Learning
Data: 12-Set-2019
Título da revista, periódico, livro ou evento: Reconhecimento Automático de Emoções em Texto com recurso a emojis
Local de edição ou do evento: DEI-FCTUC
Resumo: A deteção automática de emoções é utilizada em várias aplicações, na tentativa de resolver problemas relevantes e atuais, nomeadamente nas áreas da saúde, de marketing e de interação humana com o computador. Tem sido feito com recurso a inúmeros métodos, sendo que os primeiros passos dados nesta área foram através de câmaras de vídeo. Hoje em dia, com o número crescente de utilizadores e a utilização diária das redes sociais, a deteção de emoções com base em texto, assume cada vez maior importância e melhores resultados.Textos que os utilizadores publicam nestas redes contêm novas características, que os textos comuns não continham até agora, tais como os hashtags ou os emojis. Estas características permitem mais facilmente identificar o estado emocional do autor na altura da sua escrita, ou seja, são características a ter em conta no desenvolvimento de modelos para a deteção e classificação automática de emoções, apenas com recurso a texto. A língua inglesa tem sido objeto de estudo neste domínio. Já para o português o trabalho neste âmbito é escasso e particularmente inexistente no que toca à consideração de emojis.Tendo isto em conta, este trabalho abordará o desenvolvimento de modelos de aprendizagem computacional que permitam a classificação de emoções em pequenos textos portugueses. Tais modelos foram baseados em arquiteturas com bons resultados para tarefas de classificação de texto. Exemplos destes modelos são o Naive Bayes, SVM, e ainda redes neuronais LSTM. Esta escolha deve-se ao facto de cada um deles recorrer a formas distintas de efetuar a classificação de dados. Para cumprir este objetivo, foi recolhido um conjunto de textos curtos a partir da rede social Twitter, anotados automaticamente com base na presença emojis. Estes dados foram aplicados ao treino de modelos, para a classificação das emoções expressas no texto. Com os modelos desenvolvidos efetuamos uma série de experiências para verificar qual o modelo mais adequado para esta tarefa. Com as várias experiências aos modelos desenvolvidos retirou-se diversas conclusões sobre a utilização de emojis e dos conteúdos partilhados nas redes sociais.
Automatic emotion detection is used in a variety of applications to address relevant and current issues, particularly in the areas of health, marketing and human interaction with the computer. It has been done using numerous methods, and the first steps taken in this area were through camcorders. Today, with the growing number of users and daily use of social networks, text-based emotion detection is becoming increasingly important with improving results.Texts that users post on these networks contain new features, which common texts did not contain so far, such as hashtags or emojis. These characteristics make it easier to identify the author's emotional state at the time of his writing, ie, characteristics to be considered when developing models for the automatic detection and classification of emotions, using text only. The English language has been the subject of study in this field. For Portuguese, however, work in this area is scarce and particularly non-existent regarding the consideration of emojis.Taking this into account, this paper will address the development of computational learning models that allow the classification of emotions in small Portuguese texts. Such models were based on architectures with good results for text classification tasks. Examples of these models are Naive Bayes, SVM, and even LSTM neural networks. This choice is due to the fact that each uses different ways of classifying data.To accomplish this goal, we collected a set of short texts from Twitter, annotated automatically based on the presence of emojis. These data were applied to model training for the classification of emotions expressed in the text. With the developed models we carried out a series of experiments to verify which model is best suited for this task. With the various experiences of the developed models, several conclusions were drawn about the use of emojis and shared content in social networks.
Descrição: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/88059
Direitos: openAccess
Aparece nas coleções:UC - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato
Tese_LuisDuarteFinal.pdf4.03 MBAdobe PDFVer/Abrir
Mostrar registo em formato completo

Visualizações de página

365
Visto em 30/abr/2024

Downloads

435
Visto em 30/abr/2024

Google ScholarTM

Verificar


Este registo está protegido por Licença Creative Commons Creative Commons