Please use this identifier to cite or link to this item:
https://hdl.handle.net/10316/101048
Title: | AIA-BDE: um Corpo de Perguntas, Variações e outras Anotações | Authors: | Oliveira, Hugo Gonçalo Alves, Ana Oliveira |
Keywords: | corpora; FAQs,; resposta a perguntas; paráfrases; similaridade semântica; classificação de texto; copora; FAQs; question answering; paraphrases; semantic similarity; text classification | Issue Date: | 2021 | Project: | Projeto AIA, “Apoio Inteligente a empreendedores (chatbots)”, financiado pela FCT, através da iniciativa INCoDe 2030 | Serial title, monograph or event: | Linguamatica | Volume: | 13 | Issue: | 2 | Abstract: | Apresentamos neste artigo o corpo AIA-BDE, que
tem como principal objetivo a avalia¸c˜ao de sistemas
que procuram associar necessidades de informa¸c˜ao expressas
em linguagem natural a perguntas com resposta
conhecida (i.e., FAQ). Este corpo inclui v´arias
perguntas no dom´ınio da Administra¸c˜ao P´ublica em
Portugal e respetivas respostas. A 855 dessas perguntas
foram adicionadas, manual e automaticamente,
formas alternativas de as fazer, a que chamamos varia
¸c˜oes, e que podem ser utilizadas para simular intera
¸c˜oes de humanos. Essas perguntas encontramse
classificadas de acordo com a sua origem, com
quatro valores poss´ıveis, e tˆem ainda associado um
tipo, atribu´ıdo com base na opini˜ao de cinco anotadores.
Para al´em de apresentar o AIA-BDE, ilustramos
como pode ser utilizado atrav´es de trˆes experiˆencias,
com resultados que podem ser vistos como base para
melhorias futuras: associa¸c˜ao de varia¸c˜oes `as respetivas
perguntas; identifica¸c˜ao autom´atica da origem
das varia¸c˜oes; e classifica¸c˜ao autom´atica das perguntas
quanto ao seu tipo. We present the AIA-BDE corpus, which has as main goal the evaluation of computational systems that attempt at assigning questions with known answers (i.e., FAQs) to information needs, expressed in natural language. This corpus includes several questions in the domain of the Portuguese Public Administration and their answers. To 855 of those questions, alternative ways of making them were manually and automatically added. We call them variations and they can be used in the simulation of human user interactions. Such questions are classified according to their source, with four possible values, and have also a question type, based on the opinion of five human annotators. Besides presenting AIABDE, we illustrate how it can be used through three experiments, with results that might be seen as the baselines for future improvements, namely: variation assignment to the original questions; automatic automatic identification of the questions according to their source; and automatic classification of the questions according to their type. |
URI: | https://hdl.handle.net/10316/101048 | ISSN: | 1647-0818 | DOI: | 10.21814/lm.13.2.350 | Rights: | openAccess |
Appears in Collections: | I&D CISUC - Artigos em Revistas Internacionais |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
AIABDE-a-corpus-of-Portuguese-Questions-Variations-and-other-AnnotationsLinguamatica.pdf | 425.95 kB | Adobe PDF | View/Open |
Page view(s)
124
checked on Sep 11, 2024
Download(s)
61
checked on Sep 11, 2024
Google ScholarTM
Check
Altmetric
Altmetric
This item is licensed under a Creative Commons License