A hereditary attentive template-based approach for complex knowledge base question answering systems
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFJF |
Texto Completo: | https://doi.org/10.34019/ufjf/di/2021/00325 https://repositorio.ufjf.br/jspui/handle/ufjf/13687 |
Resumo: | Os sistemas de perguntas e respostas (QA) recuperam a resposta mais relevante para uma pergunta de linguagem natural. Os sistemas de perguntas e respostas sobre Bases de Conhecimento (KBQA) exploram entidades e relações das Bases de Conhecimento (KB) para gerar respostas. Os sistemas KBQA precisam lidar com perguntas que podem ser divididas em dois grupos: perguntas simples e complexas. Perguntas simples são aquelas que contêm respostas diretas que precisam ser detectadas para responder a um pergunta. As perguntas complexas precisam de mais informações do que as explícitas que podem ser extraídas de perguntas simples. É necessário utilizar operações de consulta avançada para coletar a resposta das KB, como exploração de relações indiretas entre entidades, multirelações, restrições qualitativas e quantitativas, entre outras. Atualmente, os sistemas KBQA alcançam melhores resultados ao responder a perguntas simples, e os sistemas de perguntas e respostas complexas sobre Bases de Conhecimento (C-KBQA) tornaram-se o objetivo para a pesquisa recente. No entanto, faltam estudos que abordem questões complexas na área de KBQA. Este trabalho visa preencher essa lacuna, apresentando um estudo sobre sistemas C-KBQA. A contribuição desta dissertação de mestrado é dividida em dois grupos: um mapeamento sistemático da literatura C-KBQA e uma nova abordagem de correspondência de modelos para sistemas C-KBQA. Primeiro, o mapeamento sistemático mostrou que os sistemas C-KBQA precisam lidar com dois tipos de perguntas: múltiplos saltos e perguntas com restrições. Além disso, foi possível identificar três etapas principais para a construção de um sistema C-KBQA e a utilização de duas abordagens principais neste processo. Em segundo lugar, a abordagem de CKBQA proposta realiza um casamento entre modelos usando a combinação de análises semânticas e técnicas de redes neurais para prever o modelo de resposta apropriado para uma questão de linguagem natural. A chamada Atenção Hereditária foi criada para auxiliar a Tree-LSTM, e demonstramos a eficácia de nossa solução comparando-a com o estado da arte do conjunto de dados LC-QuAD. Os resultados mostram que nossa abordagem supera os sistemas de última geração. |
id |
UFJF_ddaaa5d65d4501cac29721c264416402 |
---|---|
oai_identifier_str |
oai:hermes.cpd.ufjf.br:ufjf/13687 |
network_acronym_str |
UFJF |
network_name_str |
Repositório Institucional da UFJF |
repository_id_str |
|
spelling |
Souza, Jairo Francisco dehttp://lattes.cnpq.br/4516605108233899Menezes, Victor Ströele de Andradehttp://lattes.cnpq.br/7561791813071961Bernardino, Heder Soareshttp://lattes.cnpq.br/7733681743453751Ferreira, Anderson Almeidahttp://lattes.cnpq.br/7884364909927473http://lattes.cnpq.br/4648512356800217Gomes Junior, Jorão2022-01-24T14:33:53Z2022-01-032022-01-24T14:33:53Z2021-10-18https://doi.org/10.34019/ufjf/di/2021/00325https://repositorio.ufjf.br/jspui/handle/ufjf/13687Os sistemas de perguntas e respostas (QA) recuperam a resposta mais relevante para uma pergunta de linguagem natural. Os sistemas de perguntas e respostas sobre Bases de Conhecimento (KBQA) exploram entidades e relações das Bases de Conhecimento (KB) para gerar respostas. Os sistemas KBQA precisam lidar com perguntas que podem ser divididas em dois grupos: perguntas simples e complexas. Perguntas simples são aquelas que contêm respostas diretas que precisam ser detectadas para responder a um pergunta. As perguntas complexas precisam de mais informações do que as explícitas que podem ser extraídas de perguntas simples. É necessário utilizar operações de consulta avançada para coletar a resposta das KB, como exploração de relações indiretas entre entidades, multirelações, restrições qualitativas e quantitativas, entre outras. Atualmente, os sistemas KBQA alcançam melhores resultados ao responder a perguntas simples, e os sistemas de perguntas e respostas complexas sobre Bases de Conhecimento (C-KBQA) tornaram-se o objetivo para a pesquisa recente. No entanto, faltam estudos que abordem questões complexas na área de KBQA. Este trabalho visa preencher essa lacuna, apresentando um estudo sobre sistemas C-KBQA. A contribuição desta dissertação de mestrado é dividida em dois grupos: um mapeamento sistemático da literatura C-KBQA e uma nova abordagem de correspondência de modelos para sistemas C-KBQA. Primeiro, o mapeamento sistemático mostrou que os sistemas C-KBQA precisam lidar com dois tipos de perguntas: múltiplos saltos e perguntas com restrições. Além disso, foi possível identificar três etapas principais para a construção de um sistema C-KBQA e a utilização de duas abordagens principais neste processo. Em segundo lugar, a abordagem de CKBQA proposta realiza um casamento entre modelos usando a combinação de análises semânticas e técnicas de redes neurais para prever o modelo de resposta apropriado para uma questão de linguagem natural. A chamada Atenção Hereditária foi criada para auxiliar a Tree-LSTM, e demonstramos a eficácia de nossa solução comparando-a com o estado da arte do conjunto de dados LC-QuAD. Os resultados mostram que nossa abordagem supera os sistemas de última geração.Question Answering (QA) systems retrieve the most relevant answer to a natural language question. Knowledge Base Question Answering (KBQA) systems explore entities and relations from Knowledge Bases (KB) to generate answers. KBQA systems need to deal with questions that can be divided into two groups: simple and complex questions. Simple questions are those that contain direct answers that need to be detected to answer a question. Complex questions need more information than the explicit features that can be extracted from simple questions. It is necessary to use advanced query operations to collect the answer from the KB, such as exploiting indirect relations among entities, multi-relations, qualitative and quantitative constraints, and others. Currently, KBQA systems achieve better results when answering simple questions, and Complex Knowledge Base Question Answering (C-KBQA) systems turned the goal to the recent research. However, there is a lack of studies that address complex questions in the KBQA field. This work aims to fill this gap by presenting a study on C-KBQA systems. The contribution of this master thesis is twofold: a systematic mapping of the C-KBQA literature and a novel template matching approach for C-KBQA systems. First, the systematic mapping showed that C-KBQA systems need to handle with two question types: multi-hop and constraint questions. Also, it was possible to identify three main steps to construct a C-KBQA system and the use of two main approaches in this process. Secondly, our proposed C-KBQA approach performs a template matching using the combination of Semantic Parsing and Neural Networks techniques to predict the appropriate answer template to a natural language question. The so-called Hereditary Attention was created to assist the Tree-LSTM, and we demonstrate the effectiveness of our solution by comparing it to the state-of-the-art in the LC-QuAD dataset. The results show that our approach outperforms the state-of-the-art systems.porUniversidade Federal de Juiz de Fora (UFJF)Programa de Pós-graduação em Ciência da ComputaçãoUFJFBrasilICE – Instituto de Ciências ExatasAttribution-ShareAlike 3.0 Brazilhttp://creativecommons.org/licenses/by-sa/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOPerguntas e respostasPergunta complexaBases de conhecimentoAnálise semânticaRedes neuraisQuestion answeringComplex questionKnowledge baseSemantic parsingNeural networksA hereditary attentive template-based approach for complex knowledge base question answering systemsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFJFinstname:Universidade Federal de Juiz de Fora (UFJF)instacron:UFJFCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/1/license_rdf9b85e4235558a2887c2be3998124b615MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALjoraogomesjunior.pdfjoraogomesjunior.pdfapplication/pdf2797613https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/3/joraogomesjunior.pdf5a778d2e146413c0885b4603ace28941MD53TEXTjoraogomesjunior.pdf.txtjoraogomesjunior.pdf.txtExtracted texttext/plain167170https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/4/joraogomesjunior.pdf.txt2c6bf0ba8c04d70f0cb2d4a98c43140aMD54THUMBNAILjoraogomesjunior.pdf.jpgjoraogomesjunior.pdf.jpgGenerated Thumbnailimage/jpeg1153https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/5/joraogomesjunior.pdf.jpg35f2896403735410fb3693e45fd5c2f1MD55ufjf/136872023-11-17 04:03:56.094oai:hermes.cpd.ufjf.br:ufjf/13687Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufjf.br/oai/requestopendoar:2023-11-17T06:03:56Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)false |
dc.title.pt_BR.fl_str_mv |
A hereditary attentive template-based approach for complex knowledge base question answering systems |
title |
A hereditary attentive template-based approach for complex knowledge base question answering systems |
spellingShingle |
A hereditary attentive template-based approach for complex knowledge base question answering systems Gomes Junior, Jorão CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Perguntas e respostas Pergunta complexa Bases de conhecimento Análise semântica Redes neurais Question answering Complex question Knowledge base Semantic parsing Neural networks |
title_short |
A hereditary attentive template-based approach for complex knowledge base question answering systems |
title_full |
A hereditary attentive template-based approach for complex knowledge base question answering systems |
title_fullStr |
A hereditary attentive template-based approach for complex knowledge base question answering systems |
title_full_unstemmed |
A hereditary attentive template-based approach for complex knowledge base question answering systems |
title_sort |
A hereditary attentive template-based approach for complex knowledge base question answering systems |
author |
Gomes Junior, Jorão |
author_facet |
Gomes Junior, Jorão |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Souza, Jairo Francisco de |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/4516605108233899 |
dc.contributor.advisor-co1.fl_str_mv |
Menezes, Victor Ströele de Andrade |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/7561791813071961 |
dc.contributor.referee1.fl_str_mv |
Bernardino, Heder Soares |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/7733681743453751 |
dc.contributor.referee2.fl_str_mv |
Ferreira, Anderson Almeida |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/7884364909927473 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/4648512356800217 |
dc.contributor.author.fl_str_mv |
Gomes Junior, Jorão |
contributor_str_mv |
Souza, Jairo Francisco de Menezes, Victor Ströele de Andrade Bernardino, Heder Soares Ferreira, Anderson Almeida |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Perguntas e respostas Pergunta complexa Bases de conhecimento Análise semântica Redes neurais Question answering Complex question Knowledge base Semantic parsing Neural networks |
dc.subject.por.fl_str_mv |
Perguntas e respostas Pergunta complexa Bases de conhecimento Análise semântica Redes neurais Question answering Complex question Knowledge base Semantic parsing Neural networks |
description |
Os sistemas de perguntas e respostas (QA) recuperam a resposta mais relevante para uma pergunta de linguagem natural. Os sistemas de perguntas e respostas sobre Bases de Conhecimento (KBQA) exploram entidades e relações das Bases de Conhecimento (KB) para gerar respostas. Os sistemas KBQA precisam lidar com perguntas que podem ser divididas em dois grupos: perguntas simples e complexas. Perguntas simples são aquelas que contêm respostas diretas que precisam ser detectadas para responder a um pergunta. As perguntas complexas precisam de mais informações do que as explícitas que podem ser extraídas de perguntas simples. É necessário utilizar operações de consulta avançada para coletar a resposta das KB, como exploração de relações indiretas entre entidades, multirelações, restrições qualitativas e quantitativas, entre outras. Atualmente, os sistemas KBQA alcançam melhores resultados ao responder a perguntas simples, e os sistemas de perguntas e respostas complexas sobre Bases de Conhecimento (C-KBQA) tornaram-se o objetivo para a pesquisa recente. No entanto, faltam estudos que abordem questões complexas na área de KBQA. Este trabalho visa preencher essa lacuna, apresentando um estudo sobre sistemas C-KBQA. A contribuição desta dissertação de mestrado é dividida em dois grupos: um mapeamento sistemático da literatura C-KBQA e uma nova abordagem de correspondência de modelos para sistemas C-KBQA. Primeiro, o mapeamento sistemático mostrou que os sistemas C-KBQA precisam lidar com dois tipos de perguntas: múltiplos saltos e perguntas com restrições. Além disso, foi possível identificar três etapas principais para a construção de um sistema C-KBQA e a utilização de duas abordagens principais neste processo. Em segundo lugar, a abordagem de CKBQA proposta realiza um casamento entre modelos usando a combinação de análises semânticas e técnicas de redes neurais para prever o modelo de resposta apropriado para uma questão de linguagem natural. A chamada Atenção Hereditária foi criada para auxiliar a Tree-LSTM, e demonstramos a eficácia de nossa solução comparando-a com o estado da arte do conjunto de dados LC-QuAD. Os resultados mostram que nossa abordagem supera os sistemas de última geração. |
publishDate |
2021 |
dc.date.issued.fl_str_mv |
2021-10-18 |
dc.date.accessioned.fl_str_mv |
2022-01-24T14:33:53Z |
dc.date.available.fl_str_mv |
2022-01-03 2022-01-24T14:33:53Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufjf.br/jspui/handle/ufjf/13687 |
dc.identifier.doi.none.fl_str_mv |
https://doi.org/10.34019/ufjf/di/2021/00325 |
url |
https://doi.org/10.34019/ufjf/di/2021/00325 https://repositorio.ufjf.br/jspui/handle/ufjf/13687 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-ShareAlike 3.0 Brazil http://creativecommons.org/licenses/by-sa/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-ShareAlike 3.0 Brazil http://creativecommons.org/licenses/by-sa/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Juiz de Fora (UFJF) |
dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UFJF |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
ICE – Instituto de Ciências Exatas |
publisher.none.fl_str_mv |
Universidade Federal de Juiz de Fora (UFJF) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFJF instname:Universidade Federal de Juiz de Fora (UFJF) instacron:UFJF |
instname_str |
Universidade Federal de Juiz de Fora (UFJF) |
instacron_str |
UFJF |
institution |
UFJF |
reponame_str |
Repositório Institucional da UFJF |
collection |
Repositório Institucional da UFJF |
bitstream.url.fl_str_mv |
https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/1/license_rdf https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/2/license.txt https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/3/joraogomesjunior.pdf https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/4/joraogomesjunior.pdf.txt https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/5/joraogomesjunior.pdf.jpg |
bitstream.checksum.fl_str_mv |
9b85e4235558a2887c2be3998124b615 8a4605be74aa9ea9d79846c1fba20a33 5a778d2e146413c0885b4603ace28941 2c6bf0ba8c04d70f0cb2d4a98c43140a 35f2896403735410fb3693e45fd5c2f1 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF) |
repository.mail.fl_str_mv |
|
_version_ |
1801661425806999552 |