Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/92293
Title: Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas
Other Titles: Disambiguation in ANSA: Implementation of Disambiguation Methods for a Natural Language Interface for Search Analytics
Authors: Mourão, Cátia Craveiro
Orientador: Cardoso, Alberto Jorge Lebre
Keywords: Processamento de Linguagem Natura; Interface de Linguagem Natural para Pesquisas Analíticas; Ambiguidade; Desambiguação ao Nível da Palavra; Natural Language Processing; Natural Language Interface for Search Analytics; Ambiguity; Word Sense Disambiguation
Issue Date: 15-Sep-2020
Serial title, monograph or event: Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas
Place of publication or event: Critical Software, S.A.
Abstract: ANSA is a natural language interface for search analytics. This is a program that allows a user to do queries in natural language in a database, where the answer is given with the most appropriate visualization. Natural language interfaces for search analytics have a large component of naturallanguage processing, where ambiguity is one of the challenges present in this area. Ambiguity can arise at various stages of natural language processing. However, this work will only focus on ambiguity at the word level. In ANSA, there is no mechanism to deal with ambiguities at the word level yet. Thus, this internship aims to study and implement approaches for disambiguation at the word level for the queries asked in ANSA. These approaches are divided into disambiguation of words with user interaction and withoutuser interaction. In ANSA, disambiguation at the word level implies choosing the bestinterpretation for the word with the available data.The interactive approach allows the user to participate in the process of disambiguation, through visual and interactive elements that allow the user to choose and view theinterpretation chosen for the words of the query. The approaches without user interaction process information about the context of the target word, using machine learning methodsto obtain the most adequate interpretations for a target word written by the user. During this internship, approaches were developed for the two disambiguation components with and without user interaction, which are inspired by existing systems. One of the challenges during the construction of systems for disambiguation without user interactionwas the lack of data since the datasets have to be adapted to ANSA. This was reflected inthe results, where models that need more data got worse results.
O ANSA é uma interface de linguagem natural para pesquisas analíticas. Este é um programa que permite fazer pesquisas em linguagem natural para uma base de dados, onde a resposta é dada com a visualização mais adequada. As interfaces de linguagem natural para pesquisas analíticas têm uma grande componente de processamento linguagem natural, onde a ambiguidade é um dos desafios desta área. A ambiguidade pode surgir nas várias etapas do processamento de linguagem natural.No entanto, o presente trabalho será apenas focado na resolução da ambiguidade ao níveldas palavras das perguntas do utilizador. No ANSA, ainda não existe um mecanismo para lidar com as ambiguidades ao nível da palavra. Assim, este estágio tem como objectivo oestudo e implementação de abordagens para a desambiguação ao nível da palavra para asperguntas feitas no ANSA. Estas abordagens são divididas em desambiguação das palavrascom interação do utilizador e sem interação do utilizador. No ANSA, a desambiguação aonível da palavra implica a escolha da melhor interpretação para a palavra com os dados disponíveis. As abordagens com interação permitem ao utilizador participar no processo de desam-biguação, através de elementos visuais e interactivos que permitem ao utilizador escolhere visualizar a interpretação da sua pergunta no ANSA. As abordagens sem interação doutilizador processam informação sobre o contexto da pergunta do utilizador, com recurso a métodos de aprendizagem computacional, e obtém as interpretações mais adequadas para uma palavra alvo escrita pelo utilizador.Durante este estágio foram desenvolvidas abordagens para as duas componentes de desambiguação com e sem interação do utilizador, sendo estas inspiradas por sistemas jáexistentes. Um dos desafios durante a construção dos sistemas para desambiguação sem interação do utilizador, foi a falta de recursos, pois os conjunto de dados a usar tem que ser adaptado ao ANSA. Isto refletiu-se nos resultados, onde os modelos que precisam de mais recursos obtiveram resultados piores.
Description: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/92293
Rights: embargoedAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat Login
Ansa_Final_v5.pdf3.68 MBAdobe PDFEmbargo Access    Request a copy
Show full item record

Page view(s)

123
checked on Apr 17, 2024

Download(s)

7
checked on Apr 17, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons