Context Monitoring for Dialogues in Portuguese

Pais, Francisco Moita

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/110703

DC Field	Value	Language
dc.contributor.advisor	Silva, Catarina Helena Branco Simões da	-
dc.contributor.advisor	Oliveira, Hugo Ricardo Gonçalo	-
dc.contributor.author	Pais, Francisco Moita	-
dc.date.accessioned	2023-11-23T23:08:53Z	-
dc.date.available	2023-11-23T23:08:53Z	-
dc.date.issued	2023-09-20	-
dc.date.submitted	2023-11-23	-
dc.identifier.uri	https://hdl.handle.net/10316/110703	-
dc.description	Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia	-
dc.description.abstract	Os Sistemas de diálogo têm testemunhado um crescimento notável no uso quotidiano, simplificando uma variedade extensa de tarefas. Seja para ações simples como verificar o tempo para o dia seguinte ou para processos mais complexos como a reserva de voos para destinos específicos em horários determinados, tornando-se estes sistemas indispensáveis. Para executar essas tarefas de forma eficaz, é crucial que os sistemas de diálogo normalmente monitorizem o contexto em que operam. Tal monitorização pode ser efetuada através do Rastreio do Estado do Diálogo (DST), um processo que acompanha o desenvolvimento de uma conversa enquanto mantém uma representação atualizada do seu estado. O DST é vital para os sistemas de diálogo, uma vez que permite a incorporação do contexto da conversa ao aplicar técnicas de Processamento de Linguagem Natural (NLP) e gerar respostas adequadas. Embora o DST tenha sido principalmente aplicado ao idioma inglês, neste trabalho estendemos a sua aplicação a diálogos em português. Pelo que sabemos, esta é a primeira vez que tal extensão foi realizada. O trabalho envolveu a criação de um conjunto de dados de diálogos, orientado a tarefas para português, adaptado do amplamente utilizado conjunto de dados MultiWOZ. Um componente crucial do DST é a Extração de Informação (IE), que preenche slots com informações específicas com base em restrições definidas pelo utilizador. Alcançou-se isso através de uma abordagem inovadora baseada em Perguntas e Respostas (QA), que extrai uma resposta baseada em uma pergunta e um contexto (frase do utilizador). Neste estudo, três modelos de QA foram testados para esse propósito: BERT-base, BERTlarge e T5. Concluímos que o modelo T5 apresentou o desempenho mais fraco. Os outros dois modelos geraram resultados semelhantes. A escolha entre estas duas alternativas dependerá da tarefa específica que o utilizador deseja realizar. Ambos (BERT-base e BERT-large) mostraram ser promissores em resolver tarefas na língua portuguesa. Adicionalmente, observamos que a inclusão de métodos como Detecção de Intenção e Pós-Processamento melhorou significativamente o desempenho de cada modelo. Essas descobertas não só contribuem para o desenvolvimento do DST em comunidades lusófonas, mas também abrem novas possibilidades para a implementação de sistemas de diálogo inovadores baseados no conjunto de dados criado.	por
dc.description.abstract	Dialogue systems have witnessed remarkable growth in everyday use, significantly simplifying a broad range of tasks. Whether it involves simple actions like checking the next morning’s weather or more complex processes like booking flights to specific destinations at designated times, these systems have become indispensable. To perform these tasks successfully, dialogue systems usually need to monitor context. This can be accomplished through Dialogue State Tracking (DST), a process that involves tracking the progress of a conversation while maintaining a representation of the current state. DST is essential for dialogue systems, as it allows them to consider the context of the conversation through the application of Natural Language Processing (NLP) techniques, and respondappropriately. While DST has been mainly applied to English, in this work, it is applied to Portuguese dialogues. To our knowledge, it is the first time that DST is applied to Portuguese. To make it possible, the work included the creation of a dataset of task-oriented dialogues in Portuguese, based on the adaptation of the widely-used MultiWOZ dataset. A key component of DST is Information Extraction (IE), where specific information is extracted and filled into slots based on user-defined constraints. This was achieved using a novel approach based onQuestion-Answering (QA), which extracts an answer based on a provided question and context (user’s utterance). In this work, three available QA models were tested for this purpose: BERT-base, BERT-large, and T5. We concluded that the model with the poorest performance was T5. The other two models yielded similar results. The choice between these two alternatives depends on the specific task the user aims to accomplish. Both (BERT-base, BERT-large) have demonstrated promise in solving tasks in the Portuguese language. Additionally, we found that the addition of methods such as Intent Detection and Post-Processing significantly improves the performance of each model. These findings not only contribute to the advancement of DST in Portuguese-speaking communities but also open new avenues for the implementation of new dialogue systems based on the dataset created.	eng
dc.description.sponsorship	Universidade de Coimbra - This work is funded by the project POWER (grant number POCI-01-0247-FEDER- 070365), co-financed by the European Regional Development Fund (FEDER), through Portugal 2020 (PT2020), and by the Competitiveness and Internation- alization Operational Programme (COMPETE 2020).	-
dc.language.iso	eng	-
dc.rights	openAccess	-
dc.rights.uri	http://creativecommons.org/licenses/by/4.0/	-
dc.subject	Sistemas de Diálogo	por
dc.subject	Rastreio do Estado do Diálogo	por
dc.subject	Processamento de Linguagem Natural	por
dc.subject	Extração de Informação	por
dc.subject	Perguntas e Respostas	por
dc.subject	Dialogue Systems	eng
dc.subject	Dialogue State Tracking	eng
dc.subject	Natural Language Processing	eng
dc.subject	Information Extraction	eng
dc.subject	Question-Answering	eng
dc.title	Context Monitoring for Dialogues in Portuguese	eng
dc.title.alternative	Monitorização do Contexto para Diálogos em Português	por
dc.type	masterThesis	-
degois.publication.location	DEI-FCTUC	-
degois.publication.title	Context Monitoring for Dialogues in Portuguese	eng
dc.peerreviewed	yes	-
dc.identifier.tid	203397720	-
thesis.degree.discipline	Informática	-
thesis.degree.grantor	Universidade de Coimbra	-
thesis.degree.level	1	-
thesis.degree.name	Mestrado em Engenharia Informática	-
uc.degree.grantorUnit	Faculdade de Ciências e Tecnologia - Departamento de Engenharia Informática	-
uc.degree.grantorID	0500	-
uc.contributor.author	Pais, Francisco Moita::0009-0006-9529-2887	-
uc.degree.classification	18	-
uc.degree.presidentejuri	Correia, António Dourado Pereira	-
uc.degree.elementojuri	Oliveira, Hugo Ricardo Gonçalo	-
uc.degree.elementojuri	Macedo, Luís Miguel Machado Lopes	-
uc.contributor.advisor	Silva, Catarina Helena Branco Simões da	-
uc.contributor.advisor	Oliveira, Hugo Ricardo Gonçalo	-
item.openairetype	masterThesis	-
item.fulltext	Com Texto completo	-
item.languageiso639-1	en	-
item.grantfulltext	open	-
item.cerifentitytype	Publications	-
item.openairecristype	http://purl.org/coar/resource_type/c_18cf	-
Appears in Collections:	UC - Dissertações de Mestrado