A hereditary attentive template-based approach for complex knowledge base question answering systems

Detalhes bibliográficos
Autor(a) principal: Gomes Junior, Jorão
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFJF
Texto Completo: https://doi.org/10.34019/ufjf/di/2021/00325
https://repositorio.ufjf.br/jspui/handle/ufjf/13687
Resumo: Os sistemas de perguntas e respostas (QA) recuperam a resposta mais relevante para uma pergunta de linguagem natural. Os sistemas de perguntas e respostas sobre Bases de Conhecimento (KBQA) exploram entidades e relações das Bases de Conhecimento (KB) para gerar respostas. Os sistemas KBQA precisam lidar com perguntas que podem ser divididas em dois grupos: perguntas simples e complexas. Perguntas simples são aquelas que contêm respostas diretas que precisam ser detectadas para responder a um pergunta. As perguntas complexas precisam de mais informações do que as explícitas que podem ser extraídas de perguntas simples. É necessário utilizar operações de consulta avançada para coletar a resposta das KB, como exploração de relações indiretas entre entidades, multirelações, restrições qualitativas e quantitativas, entre outras. Atualmente, os sistemas KBQA alcançam melhores resultados ao responder a perguntas simples, e os sistemas de perguntas e respostas complexas sobre Bases de Conhecimento (C-KBQA) tornaram-se o objetivo para a pesquisa recente. No entanto, faltam estudos que abordem questões complexas na área de KBQA. Este trabalho visa preencher essa lacuna, apresentando um estudo sobre sistemas C-KBQA. A contribuição desta dissertação de mestrado é dividida em dois grupos: um mapeamento sistemático da literatura C-KBQA e uma nova abordagem de correspondência de modelos para sistemas C-KBQA. Primeiro, o mapeamento sistemático mostrou que os sistemas C-KBQA precisam lidar com dois tipos de perguntas: múltiplos saltos e perguntas com restrições. Além disso, foi possível identificar três etapas principais para a construção de um sistema C-KBQA e a utilização de duas abordagens principais neste processo. Em segundo lugar, a abordagem de CKBQA proposta realiza um casamento entre modelos usando a combinação de análises semânticas e técnicas de redes neurais para prever o modelo de resposta apropriado para uma questão de linguagem natural. A chamada Atenção Hereditária foi criada para auxiliar a Tree-LSTM, e demonstramos a eficácia de nossa solução comparando-a com o estado da arte do conjunto de dados LC-QuAD. Os resultados mostram que nossa abordagem supera os sistemas de última geração.
id UFJF_ddaaa5d65d4501cac29721c264416402
oai_identifier_str oai:hermes.cpd.ufjf.br:ufjf/13687
network_acronym_str UFJF
network_name_str Repositório Institucional da UFJF
repository_id_str
spelling Souza, Jairo Francisco dehttp://lattes.cnpq.br/4516605108233899Menezes, Victor Ströele de Andradehttp://lattes.cnpq.br/7561791813071961Bernardino, Heder Soareshttp://lattes.cnpq.br/7733681743453751Ferreira, Anderson Almeidahttp://lattes.cnpq.br/7884364909927473http://lattes.cnpq.br/4648512356800217Gomes Junior, Jorão2022-01-24T14:33:53Z2022-01-032022-01-24T14:33:53Z2021-10-18https://doi.org/10.34019/ufjf/di/2021/00325https://repositorio.ufjf.br/jspui/handle/ufjf/13687Os sistemas de perguntas e respostas (QA) recuperam a resposta mais relevante para uma pergunta de linguagem natural. Os sistemas de perguntas e respostas sobre Bases de Conhecimento (KBQA) exploram entidades e relações das Bases de Conhecimento (KB) para gerar respostas. Os sistemas KBQA precisam lidar com perguntas que podem ser divididas em dois grupos: perguntas simples e complexas. Perguntas simples são aquelas que contêm respostas diretas que precisam ser detectadas para responder a um pergunta. As perguntas complexas precisam de mais informações do que as explícitas que podem ser extraídas de perguntas simples. É necessário utilizar operações de consulta avançada para coletar a resposta das KB, como exploração de relações indiretas entre entidades, multirelações, restrições qualitativas e quantitativas, entre outras. Atualmente, os sistemas KBQA alcançam melhores resultados ao responder a perguntas simples, e os sistemas de perguntas e respostas complexas sobre Bases de Conhecimento (C-KBQA) tornaram-se o objetivo para a pesquisa recente. No entanto, faltam estudos que abordem questões complexas na área de KBQA. Este trabalho visa preencher essa lacuna, apresentando um estudo sobre sistemas C-KBQA. A contribuição desta dissertação de mestrado é dividida em dois grupos: um mapeamento sistemático da literatura C-KBQA e uma nova abordagem de correspondência de modelos para sistemas C-KBQA. Primeiro, o mapeamento sistemático mostrou que os sistemas C-KBQA precisam lidar com dois tipos de perguntas: múltiplos saltos e perguntas com restrições. Além disso, foi possível identificar três etapas principais para a construção de um sistema C-KBQA e a utilização de duas abordagens principais neste processo. Em segundo lugar, a abordagem de CKBQA proposta realiza um casamento entre modelos usando a combinação de análises semânticas e técnicas de redes neurais para prever o modelo de resposta apropriado para uma questão de linguagem natural. A chamada Atenção Hereditária foi criada para auxiliar a Tree-LSTM, e demonstramos a eficácia de nossa solução comparando-a com o estado da arte do conjunto de dados LC-QuAD. Os resultados mostram que nossa abordagem supera os sistemas de última geração.Question Answering (QA) systems retrieve the most relevant answer to a natural language question. Knowledge Base Question Answering (KBQA) systems explore entities and relations from Knowledge Bases (KB) to generate answers. KBQA systems need to deal with questions that can be divided into two groups: simple and complex questions. Simple questions are those that contain direct answers that need to be detected to answer a question. Complex questions need more information than the explicit features that can be extracted from simple questions. It is necessary to use advanced query operations to collect the answer from the KB, such as exploiting indirect relations among entities, multi-relations, qualitative and quantitative constraints, and others. Currently, KBQA systems achieve better results when answering simple questions, and Complex Knowledge Base Question Answering (C-KBQA) systems turned the goal to the recent research. However, there is a lack of studies that address complex questions in the KBQA field. This work aims to fill this gap by presenting a study on C-KBQA systems. The contribution of this master thesis is twofold: a systematic mapping of the C-KBQA literature and a novel template matching approach for C-KBQA systems. First, the systematic mapping showed that C-KBQA systems need to handle with two question types: multi-hop and constraint questions. Also, it was possible to identify three main steps to construct a C-KBQA system and the use of two main approaches in this process. Secondly, our proposed C-KBQA approach performs a template matching using the combination of Semantic Parsing and Neural Networks techniques to predict the appropriate answer template to a natural language question. The so-called Hereditary Attention was created to assist the Tree-LSTM, and we demonstrate the effectiveness of our solution by comparing it to the state-of-the-art in the LC-QuAD dataset. The results show that our approach outperforms the state-of-the-art systems.porUniversidade Federal de Juiz de Fora (UFJF)Programa de Pós-graduação em Ciência da ComputaçãoUFJFBrasilICE – Instituto de Ciências ExatasAttribution-ShareAlike 3.0 Brazilhttp://creativecommons.org/licenses/by-sa/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOPerguntas e respostasPergunta complexaBases de conhecimentoAnálise semânticaRedes neuraisQuestion answeringComplex questionKnowledge baseSemantic parsingNeural networksA hereditary attentive template-based approach for complex knowledge base question answering systemsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFJFinstname:Universidade Federal de Juiz de Fora (UFJF)instacron:UFJFCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/1/license_rdf9b85e4235558a2887c2be3998124b615MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALjoraogomesjunior.pdfjoraogomesjunior.pdfapplication/pdf2797613https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/3/joraogomesjunior.pdf5a778d2e146413c0885b4603ace28941MD53TEXTjoraogomesjunior.pdf.txtjoraogomesjunior.pdf.txtExtracted texttext/plain167170https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/4/joraogomesjunior.pdf.txt2c6bf0ba8c04d70f0cb2d4a98c43140aMD54THUMBNAILjoraogomesjunior.pdf.jpgjoraogomesjunior.pdf.jpgGenerated Thumbnailimage/jpeg1153https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/5/joraogomesjunior.pdf.jpg35f2896403735410fb3693e45fd5c2f1MD55ufjf/136872023-11-17 04:03:56.094oai:hermes.cpd.ufjf.br:ufjf/13687Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufjf.br/oai/requestopendoar:2023-11-17T06:03:56Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)false
dc.title.pt_BR.fl_str_mv A hereditary attentive template-based approach for complex knowledge base question answering systems
title A hereditary attentive template-based approach for complex knowledge base question answering systems
spellingShingle A hereditary attentive template-based approach for complex knowledge base question answering systems
Gomes Junior, Jorão
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Perguntas e respostas
Pergunta complexa
Bases de conhecimento
Análise semântica
Redes neurais
Question answering
Complex question
Knowledge base
Semantic parsing
Neural networks
title_short A hereditary attentive template-based approach for complex knowledge base question answering systems
title_full A hereditary attentive template-based approach for complex knowledge base question answering systems
title_fullStr A hereditary attentive template-based approach for complex knowledge base question answering systems
title_full_unstemmed A hereditary attentive template-based approach for complex knowledge base question answering systems
title_sort A hereditary attentive template-based approach for complex knowledge base question answering systems
author Gomes Junior, Jorão
author_facet Gomes Junior, Jorão
author_role author
dc.contributor.advisor1.fl_str_mv Souza, Jairo Francisco de
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/4516605108233899
dc.contributor.advisor-co1.fl_str_mv Menezes, Victor Ströele de Andrade
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/7561791813071961
dc.contributor.referee1.fl_str_mv Bernardino, Heder Soares
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/7733681743453751
dc.contributor.referee2.fl_str_mv Ferreira, Anderson Almeida
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/7884364909927473
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4648512356800217
dc.contributor.author.fl_str_mv Gomes Junior, Jorão
contributor_str_mv Souza, Jairo Francisco de
Menezes, Victor Ströele de Andrade
Bernardino, Heder Soares
Ferreira, Anderson Almeida
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Perguntas e respostas
Pergunta complexa
Bases de conhecimento
Análise semântica
Redes neurais
Question answering
Complex question
Knowledge base
Semantic parsing
Neural networks
dc.subject.por.fl_str_mv Perguntas e respostas
Pergunta complexa
Bases de conhecimento
Análise semântica
Redes neurais
Question answering
Complex question
Knowledge base
Semantic parsing
Neural networks
description Os sistemas de perguntas e respostas (QA) recuperam a resposta mais relevante para uma pergunta de linguagem natural. Os sistemas de perguntas e respostas sobre Bases de Conhecimento (KBQA) exploram entidades e relações das Bases de Conhecimento (KB) para gerar respostas. Os sistemas KBQA precisam lidar com perguntas que podem ser divididas em dois grupos: perguntas simples e complexas. Perguntas simples são aquelas que contêm respostas diretas que precisam ser detectadas para responder a um pergunta. As perguntas complexas precisam de mais informações do que as explícitas que podem ser extraídas de perguntas simples. É necessário utilizar operações de consulta avançada para coletar a resposta das KB, como exploração de relações indiretas entre entidades, multirelações, restrições qualitativas e quantitativas, entre outras. Atualmente, os sistemas KBQA alcançam melhores resultados ao responder a perguntas simples, e os sistemas de perguntas e respostas complexas sobre Bases de Conhecimento (C-KBQA) tornaram-se o objetivo para a pesquisa recente. No entanto, faltam estudos que abordem questões complexas na área de KBQA. Este trabalho visa preencher essa lacuna, apresentando um estudo sobre sistemas C-KBQA. A contribuição desta dissertação de mestrado é dividida em dois grupos: um mapeamento sistemático da literatura C-KBQA e uma nova abordagem de correspondência de modelos para sistemas C-KBQA. Primeiro, o mapeamento sistemático mostrou que os sistemas C-KBQA precisam lidar com dois tipos de perguntas: múltiplos saltos e perguntas com restrições. Além disso, foi possível identificar três etapas principais para a construção de um sistema C-KBQA e a utilização de duas abordagens principais neste processo. Em segundo lugar, a abordagem de CKBQA proposta realiza um casamento entre modelos usando a combinação de análises semânticas e técnicas de redes neurais para prever o modelo de resposta apropriado para uma questão de linguagem natural. A chamada Atenção Hereditária foi criada para auxiliar a Tree-LSTM, e demonstramos a eficácia de nossa solução comparando-a com o estado da arte do conjunto de dados LC-QuAD. Os resultados mostram que nossa abordagem supera os sistemas de última geração.
publishDate 2021
dc.date.issued.fl_str_mv 2021-10-18
dc.date.accessioned.fl_str_mv 2022-01-24T14:33:53Z
dc.date.available.fl_str_mv 2022-01-03
2022-01-24T14:33:53Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufjf.br/jspui/handle/ufjf/13687
dc.identifier.doi.none.fl_str_mv https://doi.org/10.34019/ufjf/di/2021/00325
url https://doi.org/10.34019/ufjf/di/2021/00325
https://repositorio.ufjf.br/jspui/handle/ufjf/13687
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-ShareAlike 3.0 Brazil
http://creativecommons.org/licenses/by-sa/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-ShareAlike 3.0 Brazil
http://creativecommons.org/licenses/by-sa/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Juiz de Fora (UFJF)
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UFJF
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv ICE – Instituto de Ciências Exatas
publisher.none.fl_str_mv Universidade Federal de Juiz de Fora (UFJF)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFJF
instname:Universidade Federal de Juiz de Fora (UFJF)
instacron:UFJF
instname_str Universidade Federal de Juiz de Fora (UFJF)
instacron_str UFJF
institution UFJF
reponame_str Repositório Institucional da UFJF
collection Repositório Institucional da UFJF
bitstream.url.fl_str_mv https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/1/license_rdf
https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/2/license.txt
https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/3/joraogomesjunior.pdf
https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/4/joraogomesjunior.pdf.txt
https://repositorio.ufjf.br/jspui/bitstream/ufjf/13687/5/joraogomesjunior.pdf.jpg
bitstream.checksum.fl_str_mv 9b85e4235558a2887c2be3998124b615
8a4605be74aa9ea9d79846c1fba20a33
5a778d2e146413c0885b4603ace28941
2c6bf0ba8c04d70f0cb2d4a98c43140a
35f2896403735410fb3693e45fd5c2f1
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)
repository.mail.fl_str_mv
_version_ 1801661425806999552