Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/87937
Title: Reconhecimento Automático de Humor Verbal
Other Titles: Automatic Humor Recognition
Authors: Clemêncio, André David Fernandes
Orientador: Oliveira, Hugo Ricardo Gonçalo
Keywords: Processamento de Linguagem Natural; Classificação Automática de Texto; Reconhecimento de Humor; Inteligência Artificial; Natural Language Processing; Text Classification; Humor Recognition; Artificial Intellegence
Issue Date: 10-Sep-2019
Serial title, monograph or event: Reconhecimento Automático de Humor Verbal
Place of publication or event: DEI-FCTUC
Abstract: Existem cada vez mais sistemas inteligentes desenvolvidos com o objetivo de executar várias tarefas, que são normalmente associadas ao ser humano. O processamento de linguagem humana e o uso da mesma para comunicar é uma dessas tarefas. Aqui pode incluir-se o reconhecimento de humor que será mais um passo para que exista cada vez uma melhor comunicação entre máquinas e humanos. Este trabalho propõe implementar um modelo computacional que, através de técnicas de Processamento de Linguagem Natural e de Classificação Automática de Texto, consiga reconhecer humor na língua portuguesa, um tema para o qual não conhecemos.Para isso, foram estudadas as abordagens seguidas por diferentes autores no reconhecimento de humor em inglês. Posteriormente foram organizados alguns conjuntos de dados com textos curtos humorísticos e não-humorísticos, que nos permitiram começar a testar e a analisar os primeiros resultados para o reconhecimento de humor em português. O objetivo será ainda identificar e extrair características da linguagem que sejam relevantes no nosso problema. Optou-se por uma abordagem de aprendizagem computacional supervisionada, onde os modelos criados tiraram partido, não só de características lexicais, mas também de características específicas do humor. Obtiveram-se resultados que chegaram a 88% de accuracy e de F1 para alguns conjuntos de dados o que nos leva a querer que conseguimos chegar a um modelo devidamente diferenciador e que consegue identificar instâncias humorísticas de tipos específicos.
There are more and more intelligent systems developed with the purpose of performing various tasks which are usually associated with the human being. Human language processing and its usage for communication purposes is one of those tasks. Here we can include humor recognition, that would be one more step to ensure better communication between machines and humans. The purpose of this work is to develop a computational model that, through Natural Language Processing and Text Classification techniques, can recognize humor written in the Portuguese language, for which we do not know any other specific work on this topic. Towards this goal, approaches proposed by different authors for the task of humor recognition, in English, were first studied. Later, some datasets were built, containing humorous and non-humorous instances, which allowed us to start testing a baseline approach and analyzing the first results for humor recognition in Portuguese. Besides (binary) humor recognition we will also tackle the goal of identifying and extracting language features that are relevant to our main problem. We opted for a supervised computational learning approach where the created models took advantage, not only of lexical characteristics but also of specific characteristics of humor. We obtained results that reached 88% for both accuracy and F1-score for some datasets which means that we managed to build a properly differentiator model that can identify humorous instances of specific types.
Description: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/87937
Rights: openAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat
Relatorio.pdf1.01 MBAdobe PDFView/Open
Show full item record

Page view(s)

204
checked on Apr 9, 2024

Download(s)

236
checked on Apr 9, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons