O problema da incoerência e a regularização semântica para inferência textual
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRJ |
Texto Completo: | http://hdl.handle.net/11422/12979 |
Resumo: | O reconhecimento de inferência textual é uma tarefa do processamento de linguagem natural que busca mensurar a capacidade dos algoritmos de comparar um par de sentenças a nível semântico. Ela é útil direta ou indiretamente em diversas aplicações como tradução de máquina, sumarização e respostas automáticas. Esta tarefa recebeu grande atenção com o lançamento do dataset SNLI, possibilitando a aplicação de complexas técnicas de deep learning que obtiveram diversos resultados expressivos. Alguns trabalhos, porém, começam a questionar tais resultados, observando os vieses explorados pelos algoritmos de aprendizado. Esta dissertação discute mais um possível problema destes métodos: a incoerência entre as respostas. E apresentada uma definição formal, baseada em lógica proposicional, do que é uma resposta coerente. Também é dada uma solução que visa diminuir a incoerência dos modelos, aplicável a qualquer algoritmo de deep learning, além de experimentos que avaliam alguns possíveis impactos da incoerência e a eficácia da solução proposta. |
id |
UFRJ_b14af586e1def5ce077d4abe9d6e2039 |
---|---|
oai_identifier_str |
oai:pantheon.ufrj.br:11422/12979 |
network_acronym_str |
UFRJ |
network_name_str |
Repositório Institucional da UFRJ |
repository_id_str |
|
spelling |
Almeida, Gabriel Garcia dehttp://lattes.cnpq.br/4783565791787812http://lattes.cnpq.br/8205059522763251Souza, Jano Moreira deOgasawara, Eduardo SoaresXexéo, Geraldo Bonorino2020-08-25T14:07:21Z2023-11-30T03:01:39Z2018-09http://hdl.handle.net/11422/12979O reconhecimento de inferência textual é uma tarefa do processamento de linguagem natural que busca mensurar a capacidade dos algoritmos de comparar um par de sentenças a nível semântico. Ela é útil direta ou indiretamente em diversas aplicações como tradução de máquina, sumarização e respostas automáticas. Esta tarefa recebeu grande atenção com o lançamento do dataset SNLI, possibilitando a aplicação de complexas técnicas de deep learning que obtiveram diversos resultados expressivos. Alguns trabalhos, porém, começam a questionar tais resultados, observando os vieses explorados pelos algoritmos de aprendizado. Esta dissertação discute mais um possível problema destes métodos: a incoerência entre as respostas. E apresentada uma definição formal, baseada em lógica proposicional, do que é uma resposta coerente. Também é dada uma solução que visa diminuir a incoerência dos modelos, aplicável a qualquer algoritmo de deep learning, além de experimentos que avaliam alguns possíveis impactos da incoerência e a eficácia da solução proposta.Recognition of textual entailment is a task of natural language processing that aims to measure the ability of algorithms to compare a pair of sentences at the semantic level. It is useful directly or indirectly in various applications such as machine translation, summarization and question answering. This task received attention with the release of the SNLI dataset, making possible the application of complex deep learning techniques that obtained several expressive results. Some works, however, begin to question such results, observing the biases explored by the learning algorithms. This dissertation discusses another possible problem of these methods: the incoherence between the answers. A formal definition, based on propositional logic, is presented for what is a coherent response. It is also given a solution that seeks to reduce the incoherence of the models, applicable to any deep learning algorithm, as well as experiments that evaluate some possible impacts of incoherence and the effectiveness of the proposed solution.Submitted by Daniele Fonseca (daniele@ct.ufrj.br) on 2020-08-25T14:07:21Z No. of bitstreams: 1 GabrielGarciaDeAlmeida-min.pdf: 718296 bytes, checksum: 021d6637b2773e208b3e9784620dae16 (MD5)Made available in DSpace on 2020-08-25T14:07:21Z (GMT). No. of bitstreams: 1 GabrielGarciaDeAlmeida-min.pdf: 718296 bytes, checksum: 021d6637b2773e208b3e9784620dae16 (MD5) Previous issue date: 2018-09porUniversidade Federal do Rio de JaneiroPrograma de Pós-Graduação em Engenharia de Sistemas e ComputaçãoUFRJBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaCNPQ::ENGENHARIASInferência textualRegularização semânticaO problema da incoerência e a regularização semântica para inferência textualinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisabertoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJORIGINALGabrielGarciaDeAlmeida-min.pdfGabrielGarciaDeAlmeida-min.pdfapplication/pdf718296http://pantheon.ufrj.br:80/bitstream/11422/12979/1/GabrielGarciaDeAlmeida-min.pdf021d6637b2773e208b3e9784620dae16MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81853http://pantheon.ufrj.br:80/bitstream/11422/12979/2/license.txtdd32849f2bfb22da963c3aac6e26e255MD5211422/129792023-11-30 00:01:39.109oai:pantheon.ufrj.br:11422/12979TElDRU7Dh0EgTsODTy1FWENMVVNJVkEgREUgRElTVFJJQlVJw4fDg08KCkFvIGFzc2luYXIgZSBlbnRyZWdhciBlc3RhIGxpY2Vuw6dhLCB2b2PDqihzKSBvKHMpIGF1dG9yKGVzKSBvdSBwcm9wcmlldMOhcmlvKHMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBjb25jZWRlKG0pIGFvIFJlcG9zaXTDs3JpbyBQYW50aGVvbiBkYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gZGUgSmFuZWlybyAoVUZSSikgbyBkaXJlaXRvIG7Do28gLSBleGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vKSBlbSB0b2RvIG8gbXVuZG8sIGVtIGZvcm1hdG8gZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8sIG1hcyBuw6NvIGxpbWl0YWRvIGEgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZSSiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhZHV6aXIgYSBhcHJlc2VudGHDp8OjbyBkZSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gY29tIGEgZmluYWxpZGFkZSBkZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogdGFtYsOpbSBjb25jb3JkYSBxdWUgYSBVRlJKIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXNzYSBzdWJtaXNzw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8OjbyBkaWdpdGFsLgoKRGVjbGFyYSBxdWUgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgc2V1IHRyYWJhbGhvIG9yaWdpbmFsLCBlIHF1ZSB2b2PDqiB0ZW0gbyBkaXJlaXRvIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIGEgc3VhIGFwcmVzZW50YcOnw6NvLCBjb20gbyBtZWxob3IgZGUgc2V1cyBjb25oZWNpbWVudG9zLCBuw6NvIGluZnJpbmdpIGRpcmVpdG9zIGF1dG9yYWlzIGRlIHRlcmNlaXJvcy4KClNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCB2b2PDqiBuw6NvIHRlbSBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBlIGNvbmNlZGUgYSBVRlJKIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRhIHN1Ym1pc3PDo28uCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIHF1ZSBmb2ksIG91IHRlbSBzaWRvIHBhdHJvY2luYWRvIG91IGFwb2lhZG8gcG9yIHVtYSBhZ8OqbmNpYSBvdSBvdXRybyhzKSBvcmdhbmlzbW8ocykgcXVlIG7Do28gYSBVRlJKLCB2b2PDqiBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWxxdWVyIGRpcmVpdG8gZGUgUkVWSVPDg08gb3UgZGUgb3V0cmFzIG9icmlnYcOnw7VlcyByZXF1ZXJpZGFzIHBvciBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUkogaXLDoSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8ocykgc2V1KHMpIG5vbWUocykgY29tbyBhdXRvcihlcykgb3UgcHJvcHJpZXTDoXJpbyhzKSBkYSBzdWJtaXNzw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EsIG5vIGF0byBkZSBzdWJtaXNzw6NvLgo=Repositório de PublicaçõesPUBhttp://www.pantheon.ufrj.br/oai/requestopendoar:2023-11-30T03:01:39Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false |
dc.title.pt_BR.fl_str_mv |
O problema da incoerência e a regularização semântica para inferência textual |
title |
O problema da incoerência e a regularização semântica para inferência textual |
spellingShingle |
O problema da incoerência e a regularização semântica para inferência textual Almeida, Gabriel Garcia de CNPQ::ENGENHARIAS Inferência textual Regularização semântica |
title_short |
O problema da incoerência e a regularização semântica para inferência textual |
title_full |
O problema da incoerência e a regularização semântica para inferência textual |
title_fullStr |
O problema da incoerência e a regularização semântica para inferência textual |
title_full_unstemmed |
O problema da incoerência e a regularização semântica para inferência textual |
title_sort |
O problema da incoerência e a regularização semântica para inferência textual |
author |
Almeida, Gabriel Garcia de |
author_facet |
Almeida, Gabriel Garcia de |
author_role |
author |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/4783565791787812 |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/8205059522763251 |
dc.contributor.author.fl_str_mv |
Almeida, Gabriel Garcia de |
dc.contributor.referee1.fl_str_mv |
Souza, Jano Moreira de |
dc.contributor.referee2.fl_str_mv |
Ogasawara, Eduardo Soares |
dc.contributor.advisor1.fl_str_mv |
Xexéo, Geraldo Bonorino |
contributor_str_mv |
Souza, Jano Moreira de Ogasawara, Eduardo Soares Xexéo, Geraldo Bonorino |
dc.subject.cnpq.fl_str_mv |
CNPQ::ENGENHARIAS |
topic |
CNPQ::ENGENHARIAS Inferência textual Regularização semântica |
dc.subject.por.fl_str_mv |
Inferência textual Regularização semântica |
description |
O reconhecimento de inferência textual é uma tarefa do processamento de linguagem natural que busca mensurar a capacidade dos algoritmos de comparar um par de sentenças a nível semântico. Ela é útil direta ou indiretamente em diversas aplicações como tradução de máquina, sumarização e respostas automáticas. Esta tarefa recebeu grande atenção com o lançamento do dataset SNLI, possibilitando a aplicação de complexas técnicas de deep learning que obtiveram diversos resultados expressivos. Alguns trabalhos, porém, começam a questionar tais resultados, observando os vieses explorados pelos algoritmos de aprendizado. Esta dissertação discute mais um possível problema destes métodos: a incoerência entre as respostas. E apresentada uma definição formal, baseada em lógica proposicional, do que é uma resposta coerente. Também é dada uma solução que visa diminuir a incoerência dos modelos, aplicável a qualquer algoritmo de deep learning, além de experimentos que avaliam alguns possíveis impactos da incoerência e a eficácia da solução proposta. |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018-09 |
dc.date.accessioned.fl_str_mv |
2020-08-25T14:07:21Z |
dc.date.available.fl_str_mv |
2023-11-30T03:01:39Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11422/12979 |
url |
http://hdl.handle.net/11422/12979 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Engenharia de Sistemas e Computação |
dc.publisher.initials.fl_str_mv |
UFRJ |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia |
publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRJ instname:Universidade Federal do Rio de Janeiro (UFRJ) instacron:UFRJ |
instname_str |
Universidade Federal do Rio de Janeiro (UFRJ) |
instacron_str |
UFRJ |
institution |
UFRJ |
reponame_str |
Repositório Institucional da UFRJ |
collection |
Repositório Institucional da UFRJ |
bitstream.url.fl_str_mv |
http://pantheon.ufrj.br:80/bitstream/11422/12979/1/GabrielGarciaDeAlmeida-min.pdf http://pantheon.ufrj.br:80/bitstream/11422/12979/2/license.txt |
bitstream.checksum.fl_str_mv |
021d6637b2773e208b3e9784620dae16 dd32849f2bfb22da963c3aac6e26e255 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ) |
repository.mail.fl_str_mv |
|
_version_ |
1784097187924279296 |