O problema da incoerência e a regularização semântica para inferência textual

Detalhes bibliográficos
Autor(a) principal: Almeida, Gabriel Garcia de
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRJ
Texto Completo: http://hdl.handle.net/11422/12979
Resumo: O reconhecimento de inferência textual é uma tarefa do processamento de linguagem natural que busca mensurar a capacidade dos algoritmos de comparar um par de sentenças a nível semântico. Ela é útil direta ou indiretamente em diversas aplicações como tradução de máquina, sumarização e respostas automáticas. Esta tarefa recebeu grande atenção com o lançamento do dataset SNLI, possibilitando a aplicação de complexas técnicas de deep learning que obtiveram diversos resultados expressivos. Alguns trabalhos, porém, começam a questionar tais resultados, observando os vieses explorados pelos algoritmos de aprendizado. Esta dissertação discute mais um possível problema destes métodos: a incoerência entre as respostas. E apresentada uma definição formal, baseada em lógica proposicional, do que é uma resposta coerente. Também é dada uma solução que visa diminuir a incoerência dos modelos, aplicável a qualquer algoritmo de deep learning, além de experimentos que avaliam alguns possíveis impactos da incoerência e a eficácia da solução proposta.
id UFRJ_b14af586e1def5ce077d4abe9d6e2039
oai_identifier_str oai:pantheon.ufrj.br:11422/12979
network_acronym_str UFRJ
network_name_str Repositório Institucional da UFRJ
repository_id_str
spelling Almeida, Gabriel Garcia dehttp://lattes.cnpq.br/4783565791787812http://lattes.cnpq.br/8205059522763251Souza, Jano Moreira deOgasawara, Eduardo SoaresXexéo, Geraldo Bonorino2020-08-25T14:07:21Z2023-11-30T03:01:39Z2018-09http://hdl.handle.net/11422/12979O reconhecimento de inferência textual é uma tarefa do processamento de linguagem natural que busca mensurar a capacidade dos algoritmos de comparar um par de sentenças a nível semântico. Ela é útil direta ou indiretamente em diversas aplicações como tradução de máquina, sumarização e respostas automáticas. Esta tarefa recebeu grande atenção com o lançamento do dataset SNLI, possibilitando a aplicação de complexas técnicas de deep learning que obtiveram diversos resultados expressivos. Alguns trabalhos, porém, começam a questionar tais resultados, observando os vieses explorados pelos algoritmos de aprendizado. Esta dissertação discute mais um possível problema destes métodos: a incoerência entre as respostas. E apresentada uma definição formal, baseada em lógica proposicional, do que é uma resposta coerente. Também é dada uma solução que visa diminuir a incoerência dos modelos, aplicável a qualquer algoritmo de deep learning, além de experimentos que avaliam alguns possíveis impactos da incoerência e a eficácia da solução proposta.Recognition of textual entailment is a task of natural language processing that aims to measure the ability of algorithms to compare a pair of sentences at the semantic level. It is useful directly or indirectly in various applications such as machine translation, summarization and question answering. This task received attention with the release of the SNLI dataset, making possible the application of complex deep learning techniques that obtained several expressive results. Some works, however, begin to question such results, observing the biases explored by the learning algorithms. This dissertation discusses another possible problem of these methods: the incoherence between the answers. A formal definition, based on propositional logic, is presented for what is a coherent response. It is also given a solution that seeks to reduce the incoherence of the models, applicable to any deep learning algorithm, as well as experiments that evaluate some possible impacts of incoherence and the effectiveness of the proposed solution.Submitted by Daniele Fonseca (daniele@ct.ufrj.br) on 2020-08-25T14:07:21Z No. of bitstreams: 1 GabrielGarciaDeAlmeida-min.pdf: 718296 bytes, checksum: 021d6637b2773e208b3e9784620dae16 (MD5)Made available in DSpace on 2020-08-25T14:07:21Z (GMT). No. of bitstreams: 1 GabrielGarciaDeAlmeida-min.pdf: 718296 bytes, checksum: 021d6637b2773e208b3e9784620dae16 (MD5) Previous issue date: 2018-09porUniversidade Federal do Rio de JaneiroPrograma de Pós-Graduação em Engenharia de Sistemas e ComputaçãoUFRJBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaCNPQ::ENGENHARIASInferência textualRegularização semânticaO problema da incoerência e a regularização semântica para inferência textualinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisabertoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJORIGINALGabrielGarciaDeAlmeida-min.pdfGabrielGarciaDeAlmeida-min.pdfapplication/pdf718296http://pantheon.ufrj.br:80/bitstream/11422/12979/1/GabrielGarciaDeAlmeida-min.pdf021d6637b2773e208b3e9784620dae16MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81853http://pantheon.ufrj.br:80/bitstream/11422/12979/2/license.txtdd32849f2bfb22da963c3aac6e26e255MD5211422/129792023-11-30 00:01:39.109oai:pantheon.ufrj.br:11422/12979TElDRU7Dh0EgTsODTy1FWENMVVNJVkEgREUgRElTVFJJQlVJw4fDg08KCkFvIGFzc2luYXIgZSBlbnRyZWdhciBlc3RhIGxpY2Vuw6dhLCB2b2PDqihzKSBvKHMpIGF1dG9yKGVzKSBvdSBwcm9wcmlldMOhcmlvKHMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBjb25jZWRlKG0pIGFvIFJlcG9zaXTDs3JpbyBQYW50aGVvbiBkYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gZGUgSmFuZWlybyAoVUZSSikgbyBkaXJlaXRvIG7Do28gLSBleGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vKSBlbSB0b2RvIG8gbXVuZG8sIGVtIGZvcm1hdG8gZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8sIG1hcyBuw6NvIGxpbWl0YWRvIGEgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZSSiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhZHV6aXIgYSBhcHJlc2VudGHDp8OjbyBkZSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gY29tIGEgZmluYWxpZGFkZSBkZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogdGFtYsOpbSBjb25jb3JkYSBxdWUgYSBVRlJKIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXNzYSBzdWJtaXNzw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8OjbyBkaWdpdGFsLgoKRGVjbGFyYSBxdWUgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgc2V1IHRyYWJhbGhvIG9yaWdpbmFsLCBlIHF1ZSB2b2PDqiB0ZW0gbyBkaXJlaXRvIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIGEgc3VhIGFwcmVzZW50YcOnw6NvLCBjb20gbyBtZWxob3IgZGUgc2V1cyBjb25oZWNpbWVudG9zLCBuw6NvIGluZnJpbmdpIGRpcmVpdG9zIGF1dG9yYWlzIGRlIHRlcmNlaXJvcy4KClNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCB2b2PDqiBuw6NvIHRlbSBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBlIGNvbmNlZGUgYSBVRlJKIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRhIHN1Ym1pc3PDo28uCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIHF1ZSBmb2ksIG91IHRlbSBzaWRvIHBhdHJvY2luYWRvIG91IGFwb2lhZG8gcG9yIHVtYSBhZ8OqbmNpYSBvdSBvdXRybyhzKSBvcmdhbmlzbW8ocykgcXVlIG7Do28gYSBVRlJKLCB2b2PDqiBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWxxdWVyIGRpcmVpdG8gZGUgUkVWSVPDg08gb3UgZGUgb3V0cmFzIG9icmlnYcOnw7VlcyByZXF1ZXJpZGFzIHBvciBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUkogaXLDoSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8ocykgc2V1KHMpIG5vbWUocykgY29tbyBhdXRvcihlcykgb3UgcHJvcHJpZXTDoXJpbyhzKSBkYSBzdWJtaXNzw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EsIG5vIGF0byBkZSBzdWJtaXNzw6NvLgo=Repositório de PublicaçõesPUBhttp://www.pantheon.ufrj.br/oai/requestopendoar:2023-11-30T03:01:39Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false
dc.title.pt_BR.fl_str_mv O problema da incoerência e a regularização semântica para inferência textual
title O problema da incoerência e a regularização semântica para inferência textual
spellingShingle O problema da incoerência e a regularização semântica para inferência textual
Almeida, Gabriel Garcia de
CNPQ::ENGENHARIAS
Inferência textual
Regularização semântica
title_short O problema da incoerência e a regularização semântica para inferência textual
title_full O problema da incoerência e a regularização semântica para inferência textual
title_fullStr O problema da incoerência e a regularização semântica para inferência textual
title_full_unstemmed O problema da incoerência e a regularização semântica para inferência textual
title_sort O problema da incoerência e a regularização semântica para inferência textual
author Almeida, Gabriel Garcia de
author_facet Almeida, Gabriel Garcia de
author_role author
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/4783565791787812
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/8205059522763251
dc.contributor.author.fl_str_mv Almeida, Gabriel Garcia de
dc.contributor.referee1.fl_str_mv Souza, Jano Moreira de
dc.contributor.referee2.fl_str_mv Ogasawara, Eduardo Soares
dc.contributor.advisor1.fl_str_mv Xexéo, Geraldo Bonorino
contributor_str_mv Souza, Jano Moreira de
Ogasawara, Eduardo Soares
Xexéo, Geraldo Bonorino
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS
topic CNPQ::ENGENHARIAS
Inferência textual
Regularização semântica
dc.subject.por.fl_str_mv Inferência textual
Regularização semântica
description O reconhecimento de inferência textual é uma tarefa do processamento de linguagem natural que busca mensurar a capacidade dos algoritmos de comparar um par de sentenças a nível semântico. Ela é útil direta ou indiretamente em diversas aplicações como tradução de máquina, sumarização e respostas automáticas. Esta tarefa recebeu grande atenção com o lançamento do dataset SNLI, possibilitando a aplicação de complexas técnicas de deep learning que obtiveram diversos resultados expressivos. Alguns trabalhos, porém, começam a questionar tais resultados, observando os vieses explorados pelos algoritmos de aprendizado. Esta dissertação discute mais um possível problema destes métodos: a incoerência entre as respostas. E apresentada uma definição formal, baseada em lógica proposicional, do que é uma resposta coerente. Também é dada uma solução que visa diminuir a incoerência dos modelos, aplicável a qualquer algoritmo de deep learning, além de experimentos que avaliam alguns possíveis impactos da incoerência e a eficácia da solução proposta.
publishDate 2018
dc.date.issued.fl_str_mv 2018-09
dc.date.accessioned.fl_str_mv 2020-08-25T14:07:21Z
dc.date.available.fl_str_mv 2023-11-30T03:01:39Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11422/12979
url http://hdl.handle.net/11422/12979
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia de Sistemas e Computação
dc.publisher.initials.fl_str_mv UFRJ
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRJ
instname:Universidade Federal do Rio de Janeiro (UFRJ)
instacron:UFRJ
instname_str Universidade Federal do Rio de Janeiro (UFRJ)
instacron_str UFRJ
institution UFRJ
reponame_str Repositório Institucional da UFRJ
collection Repositório Institucional da UFRJ
bitstream.url.fl_str_mv http://pantheon.ufrj.br:80/bitstream/11422/12979/1/GabrielGarciaDeAlmeida-min.pdf
http://pantheon.ufrj.br:80/bitstream/11422/12979/2/license.txt
bitstream.checksum.fl_str_mv 021d6637b2773e208b3e9784620dae16
dd32849f2bfb22da963c3aac6e26e255
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)
repository.mail.fl_str_mv
_version_ 1784097187924279296