AIA-BDE: um Corpo de Perguntas, Variações e outras Anotações
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/101048 https://doi.org/10.21814/lm.13.2.350 |
Resumo: | Apresentamos neste artigo o corpo AIA-BDE, que tem como principal objetivo a avalia¸c˜ao de sistemas que procuram associar necessidades de informa¸c˜ao expressas em linguagem natural a perguntas com resposta conhecida (i.e., FAQ). Este corpo inclui v´arias perguntas no dom´ınio da Administra¸c˜ao P´ublica em Portugal e respetivas respostas. A 855 dessas perguntas foram adicionadas, manual e automaticamente, formas alternativas de as fazer, a que chamamos varia ¸c˜oes, e que podem ser utilizadas para simular intera ¸c˜oes de humanos. Essas perguntas encontramse classificadas de acordo com a sua origem, com quatro valores poss´ıveis, e tˆem ainda associado um tipo, atribu´ıdo com base na opini˜ao de cinco anotadores. Para al´em de apresentar o AIA-BDE, ilustramos como pode ser utilizado atrav´es de trˆes experiˆencias, com resultados que podem ser vistos como base para melhorias futuras: associa¸c˜ao de varia¸c˜oes `as respetivas perguntas; identifica¸c˜ao autom´atica da origem das varia¸c˜oes; e classifica¸c˜ao autom´atica das perguntas quanto ao seu tipo. |
id |
RCAP_e82010079382e8530e11ecc39c644f9a |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/101048 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
AIA-BDE: um Corpo de Perguntas, Variações e outras AnotaçõescorporaFAQs,resposta a perguntasparáfrasessimilaridade semânticaclassificação de textocoporaFAQsquestion answeringparaphrasessemantic similaritytext classificationApresentamos neste artigo o corpo AIA-BDE, que tem como principal objetivo a avalia¸c˜ao de sistemas que procuram associar necessidades de informa¸c˜ao expressas em linguagem natural a perguntas com resposta conhecida (i.e., FAQ). Este corpo inclui v´arias perguntas no dom´ınio da Administra¸c˜ao P´ublica em Portugal e respetivas respostas. A 855 dessas perguntas foram adicionadas, manual e automaticamente, formas alternativas de as fazer, a que chamamos varia ¸c˜oes, e que podem ser utilizadas para simular intera ¸c˜oes de humanos. Essas perguntas encontramse classificadas de acordo com a sua origem, com quatro valores poss´ıveis, e tˆem ainda associado um tipo, atribu´ıdo com base na opini˜ao de cinco anotadores. Para al´em de apresentar o AIA-BDE, ilustramos como pode ser utilizado atrav´es de trˆes experiˆencias, com resultados que podem ser vistos como base para melhorias futuras: associa¸c˜ao de varia¸c˜oes `as respetivas perguntas; identifica¸c˜ao autom´atica da origem das varia¸c˜oes; e classifica¸c˜ao autom´atica das perguntas quanto ao seu tipo.We present the AIA-BDE corpus, which has as main goal the evaluation of computational systems that attempt at assigning questions with known answers (i.e., FAQs) to information needs, expressed in natural language. This corpus includes several questions in the domain of the Portuguese Public Administration and their answers. To 855 of those questions, alternative ways of making them were manually and automatically added. We call them variations and they can be used in the simulation of human user interactions. Such questions are classified according to their source, with four possible values, and have also a question type, based on the opinion of five human annotators. Besides presenting AIABDE, we illustrate how it can be used through three experiments, with results that might be seen as the baselines for future improvements, namely: variation assignment to the original questions; automatic automatic identification of the questions according to their source; and automatic classification of the questions according to their type.2021info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articlehttp://hdl.handle.net/10316/101048http://hdl.handle.net/10316/101048https://doi.org/10.21814/lm.13.2.350por1647-0818Oliveira, Hugo GonçaloAlves, Ana Oliveirainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-07-27T20:37:32Zoai:estudogeral.uc.pt:10316/101048Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:18:19.930258Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
AIA-BDE: um Corpo de Perguntas, Variações e outras Anotações |
title |
AIA-BDE: um Corpo de Perguntas, Variações e outras Anotações |
spellingShingle |
AIA-BDE: um Corpo de Perguntas, Variações e outras Anotações Oliveira, Hugo Gonçalo corpora FAQs, resposta a perguntas paráfrases similaridade semântica classificação de texto copora FAQs question answering paraphrases semantic similarity text classification |
title_short |
AIA-BDE: um Corpo de Perguntas, Variações e outras Anotações |
title_full |
AIA-BDE: um Corpo de Perguntas, Variações e outras Anotações |
title_fullStr |
AIA-BDE: um Corpo de Perguntas, Variações e outras Anotações |
title_full_unstemmed |
AIA-BDE: um Corpo de Perguntas, Variações e outras Anotações |
title_sort |
AIA-BDE: um Corpo de Perguntas, Variações e outras Anotações |
author |
Oliveira, Hugo Gonçalo |
author_facet |
Oliveira, Hugo Gonçalo Alves, Ana Oliveira |
author_role |
author |
author2 |
Alves, Ana Oliveira |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Oliveira, Hugo Gonçalo Alves, Ana Oliveira |
dc.subject.por.fl_str_mv |
corpora FAQs, resposta a perguntas paráfrases similaridade semântica classificação de texto copora FAQs question answering paraphrases semantic similarity text classification |
topic |
corpora FAQs, resposta a perguntas paráfrases similaridade semântica classificação de texto copora FAQs question answering paraphrases semantic similarity text classification |
description |
Apresentamos neste artigo o corpo AIA-BDE, que tem como principal objetivo a avalia¸c˜ao de sistemas que procuram associar necessidades de informa¸c˜ao expressas em linguagem natural a perguntas com resposta conhecida (i.e., FAQ). Este corpo inclui v´arias perguntas no dom´ınio da Administra¸c˜ao P´ublica em Portugal e respetivas respostas. A 855 dessas perguntas foram adicionadas, manual e automaticamente, formas alternativas de as fazer, a que chamamos varia ¸c˜oes, e que podem ser utilizadas para simular intera ¸c˜oes de humanos. Essas perguntas encontramse classificadas de acordo com a sua origem, com quatro valores poss´ıveis, e tˆem ainda associado um tipo, atribu´ıdo com base na opini˜ao de cinco anotadores. Para al´em de apresentar o AIA-BDE, ilustramos como pode ser utilizado atrav´es de trˆes experiˆencias, com resultados que podem ser vistos como base para melhorias futuras: associa¸c˜ao de varia¸c˜oes `as respetivas perguntas; identifica¸c˜ao autom´atica da origem das varia¸c˜oes; e classifica¸c˜ao autom´atica das perguntas quanto ao seu tipo. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/101048 http://hdl.handle.net/10316/101048 https://doi.org/10.21814/lm.13.2.350 |
url |
http://hdl.handle.net/10316/101048 https://doi.org/10.21814/lm.13.2.350 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
1647-0818 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134078296915968 |