Utilize este identificador para referenciar este registo: https://hdl.handle.net/10316/92293
Título: Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas
Outros títulos: Disambiguation in ANSA: Implementation of Disambiguation Methods for a Natural Language Interface for Search Analytics
Autor: Mourão, Cátia Craveiro
Orientador: Cardoso, Alberto Jorge Lebre
Palavras-chave: Processamento de Linguagem Natura; Interface de Linguagem Natural para Pesquisas Analíticas; Ambiguidade; Desambiguação ao Nível da Palavra; Natural Language Processing; Natural Language Interface for Search Analytics; Ambiguity; Word Sense Disambiguation
Data: 15-Set-2020
Título da revista, periódico, livro ou evento: Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas
Local de edição ou do evento: Critical Software, S.A.
Resumo: ANSA is a natural language interface for search analytics. This is a program that allows a user to do queries in natural language in a database, where the answer is given with the most appropriate visualization. Natural language interfaces for search analytics have a large component of naturallanguage processing, where ambiguity is one of the challenges present in this area. Ambiguity can arise at various stages of natural language processing. However, this work will only focus on ambiguity at the word level. In ANSA, there is no mechanism to deal with ambiguities at the word level yet. Thus, this internship aims to study and implement approaches for disambiguation at the word level for the queries asked in ANSA. These approaches are divided into disambiguation of words with user interaction and withoutuser interaction. In ANSA, disambiguation at the word level implies choosing the bestinterpretation for the word with the available data.The interactive approach allows the user to participate in the process of disambiguation, through visual and interactive elements that allow the user to choose and view theinterpretation chosen for the words of the query. The approaches without user interaction process information about the context of the target word, using machine learning methodsto obtain the most adequate interpretations for a target word written by the user. During this internship, approaches were developed for the two disambiguation components with and without user interaction, which are inspired by existing systems. One of the challenges during the construction of systems for disambiguation without user interactionwas the lack of data since the datasets have to be adapted to ANSA. This was reflected inthe results, where models that need more data got worse results.
O ANSA é uma interface de linguagem natural para pesquisas analíticas. Este é um programa que permite fazer pesquisas em linguagem natural para uma base de dados, onde a resposta é dada com a visualização mais adequada. As interfaces de linguagem natural para pesquisas analíticas têm uma grande componente de processamento linguagem natural, onde a ambiguidade é um dos desafios desta área. A ambiguidade pode surgir nas várias etapas do processamento de linguagem natural.No entanto, o presente trabalho será apenas focado na resolução da ambiguidade ao níveldas palavras das perguntas do utilizador. No ANSA, ainda não existe um mecanismo para lidar com as ambiguidades ao nível da palavra. Assim, este estágio tem como objectivo oestudo e implementação de abordagens para a desambiguação ao nível da palavra para asperguntas feitas no ANSA. Estas abordagens são divididas em desambiguação das palavrascom interação do utilizador e sem interação do utilizador. No ANSA, a desambiguação aonível da palavra implica a escolha da melhor interpretação para a palavra com os dados disponíveis. As abordagens com interação permitem ao utilizador participar no processo de desam-biguação, através de elementos visuais e interactivos que permitem ao utilizador escolhere visualizar a interpretação da sua pergunta no ANSA. As abordagens sem interação doutilizador processam informação sobre o contexto da pergunta do utilizador, com recurso a métodos de aprendizagem computacional, e obtém as interpretações mais adequadas para uma palavra alvo escrita pelo utilizador.Durante este estágio foram desenvolvidas abordagens para as duas componentes de desambiguação com e sem interação do utilizador, sendo estas inspiradas por sistemas jáexistentes. Um dos desafios durante a construção dos sistemas para desambiguação sem interação do utilizador, foi a falta de recursos, pois os conjunto de dados a usar tem que ser adaptado ao ANSA. Isto refletiu-se nos resultados, onde os modelos que precisam de mais recursos obtiveram resultados piores.
Descrição: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/92293
Direitos: embargoedAccess
Aparece nas coleções:UC - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato Entrar
Ansa_Final_v5.pdf3.68 MBAdobe PDFAcesso Embargado    Pedir uma cópia
Mostrar registo em formato completo

Visualizações de página

123
Visto em 17/abr/2024

Downloads

7
Visto em 17/abr/2024

Google ScholarTM

Verificar


Este registo está protegido por Licença Creative Commons Creative Commons