Utilize este identificador para referenciar este registo:
https://hdl.handle.net/10316/101048
Título: | AIA-BDE: um Corpo de Perguntas, Variações e outras Anotações | Autor: | Oliveira, Hugo Gonçalo Alves, Ana Oliveira |
Palavras-chave: | corpora; FAQs,; resposta a perguntas; paráfrases; similaridade semântica; classificação de texto; copora; FAQs; question answering; paraphrases; semantic similarity; text classification | Data: | 2021 | Projeto: | Projeto AIA, “Apoio Inteligente a empreendedores (chatbots)”, financiado pela FCT, através da iniciativa INCoDe 2030 | Título da revista, periódico, livro ou evento: | Linguamatica | Volume: | 13 | Número: | 2 | Resumo: | Apresentamos neste artigo o corpo AIA-BDE, que
tem como principal objetivo a avalia¸c˜ao de sistemas
que procuram associar necessidades de informa¸c˜ao expressas
em linguagem natural a perguntas com resposta
conhecida (i.e., FAQ). Este corpo inclui v´arias
perguntas no dom´ınio da Administra¸c˜ao P´ublica em
Portugal e respetivas respostas. A 855 dessas perguntas
foram adicionadas, manual e automaticamente,
formas alternativas de as fazer, a que chamamos varia
¸c˜oes, e que podem ser utilizadas para simular intera
¸c˜oes de humanos. Essas perguntas encontramse
classificadas de acordo com a sua origem, com
quatro valores poss´ıveis, e tˆem ainda associado um
tipo, atribu´ıdo com base na opini˜ao de cinco anotadores.
Para al´em de apresentar o AIA-BDE, ilustramos
como pode ser utilizado atrav´es de trˆes experiˆencias,
com resultados que podem ser vistos como base para
melhorias futuras: associa¸c˜ao de varia¸c˜oes `as respetivas
perguntas; identifica¸c˜ao autom´atica da origem
das varia¸c˜oes; e classifica¸c˜ao autom´atica das perguntas
quanto ao seu tipo. We present the AIA-BDE corpus, which has as main goal the evaluation of computational systems that attempt at assigning questions with known answers (i.e., FAQs) to information needs, expressed in natural language. This corpus includes several questions in the domain of the Portuguese Public Administration and their answers. To 855 of those questions, alternative ways of making them were manually and automatically added. We call them variations and they can be used in the simulation of human user interactions. Such questions are classified according to their source, with four possible values, and have also a question type, based on the opinion of five human annotators. Besides presenting AIABDE, we illustrate how it can be used through three experiments, with results that might be seen as the baselines for future improvements, namely: variation assignment to the original questions; automatic automatic identification of the questions according to their source; and automatic classification of the questions according to their type. |
URI: | https://hdl.handle.net/10316/101048 | ISSN: | 1647-0818 | DOI: | 10.21814/lm.13.2.350 | Direitos: | openAccess |
Aparece nas coleções: | I&D CISUC - Artigos em Revistas Internacionais |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
AIABDE-a-corpus-of-Portuguese-Questions-Variations-and-other-AnnotationsLinguamatica.pdf | 425.95 kB | Adobe PDF | Ver/Abrir |
Visualizações de página
135
Visto em 23/out/2024
Downloads
68
Visto em 23/out/2024
Google ScholarTM
Verificar
Altmetric
Altmetric
Este registo está protegido por Licença Creative Commons