Utilize este identificador para referenciar este registo: https://hdl.handle.net/10316/87937
Título: Reconhecimento Automático de Humor Verbal
Outros títulos: Automatic Humor Recognition
Autor: Clemêncio, André David Fernandes
Orientador: Oliveira, Hugo Ricardo Gonçalo
Palavras-chave: Processamento de Linguagem Natural; Classificação Automática de Texto; Reconhecimento de Humor; Inteligência Artificial; Natural Language Processing; Text Classification; Humor Recognition; Artificial Intellegence
Data: 10-Set-2019
Título da revista, periódico, livro ou evento: Reconhecimento Automático de Humor Verbal
Local de edição ou do evento: DEI-FCTUC
Resumo: Existem cada vez mais sistemas inteligentes desenvolvidos com o objetivo de executar várias tarefas, que são normalmente associadas ao ser humano. O processamento de linguagem humana e o uso da mesma para comunicar é uma dessas tarefas. Aqui pode incluir-se o reconhecimento de humor que será mais um passo para que exista cada vez uma melhor comunicação entre máquinas e humanos. Este trabalho propõe implementar um modelo computacional que, através de técnicas de Processamento de Linguagem Natural e de Classificação Automática de Texto, consiga reconhecer humor na língua portuguesa, um tema para o qual não conhecemos.Para isso, foram estudadas as abordagens seguidas por diferentes autores no reconhecimento de humor em inglês. Posteriormente foram organizados alguns conjuntos de dados com textos curtos humorísticos e não-humorísticos, que nos permitiram começar a testar e a analisar os primeiros resultados para o reconhecimento de humor em português. O objetivo será ainda identificar e extrair características da linguagem que sejam relevantes no nosso problema. Optou-se por uma abordagem de aprendizagem computacional supervisionada, onde os modelos criados tiraram partido, não só de características lexicais, mas também de características específicas do humor. Obtiveram-se resultados que chegaram a 88% de accuracy e de F1 para alguns conjuntos de dados o que nos leva a querer que conseguimos chegar a um modelo devidamente diferenciador e que consegue identificar instâncias humorísticas de tipos específicos.
There are more and more intelligent systems developed with the purpose of performing various tasks which are usually associated with the human being. Human language processing and its usage for communication purposes is one of those tasks. Here we can include humor recognition, that would be one more step to ensure better communication between machines and humans. The purpose of this work is to develop a computational model that, through Natural Language Processing and Text Classification techniques, can recognize humor written in the Portuguese language, for which we do not know any other specific work on this topic. Towards this goal, approaches proposed by different authors for the task of humor recognition, in English, were first studied. Later, some datasets were built, containing humorous and non-humorous instances, which allowed us to start testing a baseline approach and analyzing the first results for humor recognition in Portuguese. Besides (binary) humor recognition we will also tackle the goal of identifying and extracting language features that are relevant to our main problem. We opted for a supervised computational learning approach where the created models took advantage, not only of lexical characteristics but also of specific characteristics of humor. We obtained results that reached 88% for both accuracy and F1-score for some datasets which means that we managed to build a properly differentiator model that can identify humorous instances of specific types.
Descrição: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/87937
Direitos: openAccess
Aparece nas coleções:UC - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato
Relatorio.pdf1.01 MBAdobe PDFVer/Abrir
Mostrar registo em formato completo

Visualizações de página

255
Visto em 16/out/2024

Downloads

273
Visto em 16/out/2024

Google ScholarTM

Verificar


Este registo está protegido por Licença Creative Commons Creative Commons