Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/110703
DC FieldValueLanguage
dc.contributor.advisorSilva, Catarina Helena Branco Simões da-
dc.contributor.advisorOliveira, Hugo Ricardo Gonçalo-
dc.contributor.authorPais, Francisco Moita-
dc.date.accessioned2023-11-23T23:08:53Z-
dc.date.available2023-11-23T23:08:53Z-
dc.date.issued2023-09-20-
dc.date.submitted2023-11-23-
dc.identifier.urihttps://hdl.handle.net/10316/110703-
dc.descriptionDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia-
dc.description.abstractOs Sistemas de diálogo têm testemunhado um crescimento notável no uso quotidiano, simplificando uma variedade extensa de tarefas. Seja para ações simples como verificar o tempo para o dia seguinte ou para processos mais complexos como a reserva de voos para destinos específicos em horários determinados, tornando-se estes sistemas indispensáveis. Para executar essas tarefas de forma eficaz, é crucial que os sistemas de diálogo normalmente monitorizem o contexto em que operam. Tal monitorização pode ser efetuada através do Rastreio do Estado do Diálogo (DST), um processo que acompanha o desenvolvimento de uma conversa enquanto mantém uma representação atualizada do seu estado. O DST é vital para os sistemas de diálogo, uma vez que permite a incorporação do contexto da conversa ao aplicar técnicas de Processamento de Linguagem Natural (NLP) e gerar respostas adequadas. Embora o DST tenha sido principalmente aplicado ao idioma inglês, neste trabalho estendemos a sua aplicação a diálogos em português. Pelo que sabemos, esta é a primeira vez que tal extensão foi realizada. O trabalho envolveu a criação de um conjunto de dados de diálogos, orientado a tarefas para português, adaptado do amplamente utilizado conjunto de dados MultiWOZ. Um componente crucial do DST é a Extração de Informação (IE), que preenche slots com informações específicas com base em restrições definidas pelo utilizador. Alcançou-se isso através de uma abordagem inovadora baseada em Perguntas e Respostas (QA), que extrai uma resposta baseada em uma pergunta e um contexto (frase do utilizador). Neste estudo, três modelos de QA foram testados para esse propósito: BERT-base, BERTlarge e T5. Concluímos que o modelo T5 apresentou o desempenho mais fraco. Os outros dois modelos geraram resultados semelhantes. A escolha entre estas duas alternativas dependerá da tarefa específica que o utilizador deseja realizar. Ambos (BERT-base e BERT-large) mostraram ser promissores em resolver tarefas na língua portuguesa. Adicionalmente, observamos que a inclusão de métodos como Detecção de Intenção e Pós-Processamento melhorou significativamente o desempenho de cada modelo. Essas descobertas não só contribuem para o desenvolvimento do DST em comunidades lusófonas, mas também abrem novas possibilidades para a implementação de sistemas de diálogo inovadores baseados no conjunto de dados criado.por
dc.description.abstractDialogue systems have witnessed remarkable growth in everyday use, significantly simplifying a broad range of tasks. Whether it involves simple actions like checking the next morning’s weather or more complex processes like booking flights to specific destinations at designated times, these systems have become indispensable. To perform these tasks successfully, dialogue systems usually need to monitor context. This can be accomplished through Dialogue State Tracking (DST), a process that involves tracking the progress of a conversation while maintaining a representation of the current state. DST is essential for dialogue systems, as it allows them to consider the context of the conversation through the application of Natural Language Processing (NLP) techniques, and respondappropriately. While DST has been mainly applied to English, in this work, it is applied to Portuguese dialogues. To our knowledge, it is the first time that DST is applied to Portuguese. To make it possible, the work included the creation of a dataset of task-oriented dialogues in Portuguese, based on the adaptation of the widely-used MultiWOZ dataset. A key component of DST is Information Extraction (IE), where specific information is extracted and filled into slots based on user-defined constraints. This was achieved using a novel approach based onQuestion-Answering (QA), which extracts an answer based on a provided question and context (user’s utterance). In this work, three available QA models were tested for this purpose: BERT-base, BERT-large, and T5. We concluded that the model with the poorest performance was T5. The other two models yielded similar results. The choice between these two alternatives depends on the specific task the user aims to accomplish. Both (BERT-base, BERT-large) have demonstrated promise in solving tasks in the Portuguese language. Additionally, we found that the addition of methods such as Intent Detection and Post-Processing significantly improves the performance of each model. These findings not only contribute to the advancement of DST in Portuguese-speaking communities but also open new avenues for the implementation of new dialogue systems based on the dataset created.eng
dc.description.sponsorshipUniversidade de Coimbra - This work is funded by the project POWER (grant number POCI-01-0247-FEDER- 070365), co-financed by the European Regional Development Fund (FEDER), through Portugal 2020 (PT2020), and by the Competitiveness and Internation- alization Operational Programme (COMPETE 2020).-
dc.language.isoeng-
dc.rightsopenAccess-
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/-
dc.subjectSistemas de Diálogopor
dc.subjectRastreio do Estado do Diálogopor
dc.subjectProcessamento de Linguagem Naturalpor
dc.subjectExtração de Informaçãopor
dc.subjectPerguntas e Respostaspor
dc.subjectDialogue Systemseng
dc.subjectDialogue State Trackingeng
dc.subjectNatural Language Processingeng
dc.subjectInformation Extractioneng
dc.subjectQuestion-Answeringeng
dc.titleContext Monitoring for Dialogues in Portugueseeng
dc.title.alternativeMonitorização do Contexto para Diálogos em Portuguêspor
dc.typemasterThesis-
degois.publication.locationDEI-FCTUC-
degois.publication.titleContext Monitoring for Dialogues in Portugueseeng
dc.peerreviewedyes-
dc.identifier.tid203397720-
thesis.degree.disciplineInformática-
thesis.degree.grantorUniversidade de Coimbra-
thesis.degree.level1-
thesis.degree.nameMestrado em Engenharia Informática-
uc.degree.grantorUnitFaculdade de Ciências e Tecnologia - Departamento de Engenharia Informática-
uc.degree.grantorID0500-
uc.contributor.authorPais, Francisco Moita::0009-0006-9529-2887-
uc.degree.classification18-
uc.degree.presidentejuriCorreia, António Dourado Pereira-
uc.degree.elementojuriOliveira, Hugo Ricardo Gonçalo-
uc.degree.elementojuriMacedo, Luís Miguel Machado Lopes-
uc.contributor.advisorSilva, Catarina Helena Branco Simões da-
uc.contributor.advisorOliveira, Hugo Ricardo Gonçalo-
item.grantfulltextopen-
item.cerifentitytypePublications-
item.languageiso639-1en-
item.openairetypemasterThesis-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.fulltextCom Texto completo-
Appears in Collections:UC - Dissertações de Mestrado
Files in This Item:
File SizeFormat
thesis_francisco_pais.pdf2.96 MBAdobe PDFView/Open
Show simple item record

Page view(s)

31
checked on May 8, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons