Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/92486
DC FieldValueLanguage
dc.contributor.advisorOliveira, Hugo Ricardo Gonçalo-
dc.contributor.authorMendes, Rui Pedro Pereira-
dc.date.accessioned2021-01-14T23:00:26Z-
dc.date.available2021-01-14T23:00:26Z-
dc.date.issued2020-07-23-
dc.date.submitted2021-01-14-
dc.identifier.urihttps://hdl.handle.net/10316/92486-
dc.descriptionDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia-
dc.description.abstractDentro da Inteligência Artificial, a área da Criatividade Computacional tem recebido cada vez mais atenção. Dentro desta, a sub-área Criatividade Linguística está na moda, visto que se têm revelado novas soluções para a geração de linguagem, também suportada por avanços recentes na área do Processamento de Linguagem Natural. O trabalho descrito nesta tese situa-se no âmbito das áreas já mencionadas. Desenvolveu um sistema que, dado um texto curto como input, e.g. um título de notícia, é capaz de analisar o seu contexto. Subsequentemente, o sistema tem duas tarefas principais: (i)~seleccionar uma expressão, e.g. um provérbio ou um título de filme, de modo a que seja a mais adequada para o contexto do input} (ii)~gerar uma nova expressão através de métodos de adaptação, de modo a aproximar a expressão ao contexto do input} A maior parte dos sistemas actuais focam-se maioritariamente na língua Inglesa, e o sistema desenvolvido no âmbito desta tese, chamado TECo: Texto Em Contexto, dedica-se inteiramente à língua Portuguesa e, mais especificamente, ao uso de linguagem figurativa.Considerando a primeira tarefa, diversas abordagens foram exploradas, desde métricas mais simples como o coeficiente de Jaccard, até representações mais populares e tradicionais como Word Embeddings, e ainda representações contextuais do estado-da-arte baseadas em Transformers, almejando tirar conclusões em relação à qualidade das expressões seleccionadas.A segunda tarefa requereu uma investigação e desenvolvimento de novas metodologias para adaptar texto baseado no contexto do input. Três novos métodos foram criados, implementados, e testados, de modo a tirar conclusões acerca dos diferentes desafios propostos pela língua Portuguesa.Os resultados obtidos mostram que as expressões geradas tiveram sucesso em termos de se aproximarem do contexto do texto dado, produzindo conteúdo novo e original, ainda que existam melhorias a implementar no futuro, particularmente a nível de humor.por
dc.description.abstractWithin Artificial Intelligence, the cluster of Computational Creativity has been receiving more attention as of late. In addition, its sub-field of Linguistic Creativity is trending with novel solutions for language generation, also supported by recent advances in Natural Language Processing. The work of this thesis is in the scope of the previous areas. It studies the development of a system that, given a short-text, e.g. a news headline, analyses its context for further utilization. Subsequently, the system aimed to achieve success in two different tasks: (i)~the selection of an expression, e.g. a proverb or a movie title, which is most adequate for the given input's context; (ii)~the generation of an expression, through adaptation methods, in such a way that it is semantically related to the input's context. As most of current systems dedicate their focus mainly to the English language, the system developed in the scope of this thesis, named TECo: Texto Em Contexto (Text in Context), is dedicated entirely to the Portuguese language, and, more specifically, to the usage of figurative language.Considering the first task, several approaches were explored, from simpler metrics such as the Jaccard coefficient, to the popular and traditional Word Embeddings, to state-of-the-art contextual embeddings based on Transformers, aiming to draw conclusions regarding the quality of the selected proverbs. The second challenge required the research and development of new methodologies to adapt text based on a context. Three new methods were designed, implemented and tested, in order to draw conclusions on the different challenges proposed by the Portuguese language.The obtained results show that the generated expressions were successful in terms of approximating to the input's context, producing novel and original content, despite some improvements that should be implemented in future endeavours, particularly concerning humour.eng
dc.language.isoeng-
dc.rightsopenAccess-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/-
dc.subjectCriatividade Computacionalpor
dc.subjectGeração de Linguagem Naturalpor
dc.subjectCriatividade Linguísticapor
dc.subjectSimilaridade Semânticapor
dc.subjectProcessamento de Linguagem Naturalpor
dc.subjectComputational Creativityeng
dc.subjectNatural Language Generationeng
dc.subjectLinguistic Creativityeng
dc.subjectSemantic Similarityeng
dc.subjectNatural Language Processingceng
dc.titleTECo: Automatic Selection and Adaptation of Creative Text in Contexteng
dc.title.alternativeTECo: Automatic Selection and Adaptation of Creative Text in Contextpor
dc.typemasterThesis-
degois.publication.locationDEI-FCTUC-
degois.publication.titleTECo: Automatic Selection and Adaptation of Creative Text in Contexteng
dc.peerreviewedyes-
dc.identifier.tid202521230-
thesis.degree.disciplineInformática-
thesis.degree.grantorUniversidade de Coimbra-
thesis.degree.level1-
thesis.degree.nameMestrado em Engenharia Informática-
uc.degree.grantorUnitFaculdade de Ciências e Tecnologia - Departamento de Engenharia Informática-
uc.degree.grantorID0500-
uc.contributor.authorMendes, Rui Pedro Pereira::0000-0002-7654-5969-
uc.degree.classification19-
uc.degree.presidentejuriCabral, Bruno Miguel Brás-
uc.degree.elementojuriOliveira, Hugo Ricardo Gonçalo-
uc.degree.elementojuriArrais, Joel Perdiz-
uc.contributor.advisorOliveira, Hugo Ricardo Gonçalo-
item.openairetypemasterThesis-
item.languageiso639-1en-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.cerifentitytypePublications-
item.grantfulltextopen-
item.fulltextCom Texto completo-
crisitem.advisor.researchunitCISUC - Centre for Informatics and Systems of the University of Coimbra-
crisitem.advisor.parentresearchunitFaculty of Sciences and Technology-
crisitem.advisor.orcid0000-0002-5779-8645-
Appears in Collections:UC - Dissertações de Mestrado
Files in This Item:
File Description SizeFormat
Tese_RuiMendes_final.pdf2.27 MBAdobe PDFView/Open
Show simple item record

Page view(s)

81
checked on Mar 26, 2024

Download(s)

191
checked on Mar 26, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons