Online probabilistic theory revision from examples : a proPPR approach

Detalhes bibliográficos
Autor(a) principal: Guimarães, Victor Augusto Lopes
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Institucional da UFRJ
Texto Completo: http://hdl.handle.net/11422/13080
Resumo: A manipulação de fluxos de dados relacionais estruturados se tornou uma tarefa crucial, dada a disponibilidade de conteúdo produzido por sensores e pela Internet, como redes sociais e grafos de conhecimento. Esta tarefa é ainda mais desafiadora em um ambiente relacional do que em ambientes que lidam com exemplos i.i.d., dado que não podemos garantir que os exemplos são independentes. Além disso, a maioria dos métodos de aprendizado relacional ainda são projetados para aprender apenas a partir de conjuntos fechados de dados, não considerando modelos aprendidos em iterações anteriores de exemplos. Neste trabalho, nós propomos OSLR, um algoritmo de aprendizado relacional incremental que é capaz de lidar com fluxos de dados contínuos de exemplos, a medida em que eles chegam. Nós aplicamos técnica de revisão de teoria para aproveitar o conhecimento preliminar como ponto de partida, buscando onde o mesmo deve ser modificado para considerar novos exemplos e aplicando automaticamente essas modificações. Nós nos baseamos na teoria estatística do limitante de Hoeding para decidir se o modelo, de fato, deve ser atualizado, de acordo com novos exemplos. Nosso sistema foi construído sobre a linguagem estatística relacional ProPPR, para descrever os modelos induzidos, visando considerar a incerteza inerente de dados reais. Resultados experimentais em bases de co-autoria e redes sociais mostram o potencial da abordagem proposta comparada com outros métodos de aprendizado relacional.
id UFRJ_47e7fcd490a330b323ba696ccc01a3fb
oai_identifier_str oai:pantheon.ufrj.br:11422/13080
network_acronym_str UFRJ
network_name_str Repositório Institucional da UFRJ
repository_id_str
spelling Guimarães, Victor Augusto Lopeshttp://lattes.cnpq.br/5117568495536090http://lattes.cnpq.br/3532148462112499Carvalho, Aline Marins PaesCV: http://lattes.cnpq.br/0506389215528790Barbosa, Valmir CarneiroCozman, Fabio GagliardiZaverucha, Gerson2020-09-22T22:17:16Z2023-11-30T03:01:40Z2018-03http://hdl.handle.net/11422/13080A manipulação de fluxos de dados relacionais estruturados se tornou uma tarefa crucial, dada a disponibilidade de conteúdo produzido por sensores e pela Internet, como redes sociais e grafos de conhecimento. Esta tarefa é ainda mais desafiadora em um ambiente relacional do que em ambientes que lidam com exemplos i.i.d., dado que não podemos garantir que os exemplos são independentes. Além disso, a maioria dos métodos de aprendizado relacional ainda são projetados para aprender apenas a partir de conjuntos fechados de dados, não considerando modelos aprendidos em iterações anteriores de exemplos. Neste trabalho, nós propomos OSLR, um algoritmo de aprendizado relacional incremental que é capaz de lidar com fluxos de dados contínuos de exemplos, a medida em que eles chegam. Nós aplicamos técnica de revisão de teoria para aproveitar o conhecimento preliminar como ponto de partida, buscando onde o mesmo deve ser modificado para considerar novos exemplos e aplicando automaticamente essas modificações. Nós nos baseamos na teoria estatística do limitante de Hoeding para decidir se o modelo, de fato, deve ser atualizado, de acordo com novos exemplos. Nosso sistema foi construído sobre a linguagem estatística relacional ProPPR, para descrever os modelos induzidos, visando considerar a incerteza inerente de dados reais. Resultados experimentais em bases de co-autoria e redes sociais mostram o potencial da abordagem proposta comparada com outros métodos de aprendizado relacional.Handling relational data streams has become a crucial task, given the availability of pervasive sensors and Internet-produced content, such as social networks and knowledge graphs. In a relational environment, this is a particularly challenging task, since one cannot assure that the streams of examples are independent along the iterations. Thus, most relational machine learning methods are still designed to learn only from closed batches of data, not considering the models acquired in previous iterations of incoming examples. In this work, we propose OSLR, an online relational learning algorithm that can handle continuous, open-ended streams of relational examples as they arrive. We employ techniques from theory revision to take advantage of the already acquired knowledge as a starting point, find where it should be modified to cope with the new examples, and automatically update it. We rely on the Hoeding’s bound statistical theory to decide if the model must in fact be updated accordingly to the new examples. Our system is built upon ProPPR statistical relational language to describe the induced models, aiming at contemplating the uncertainty inherent to real data. Experimental results in entity co-reference and social networks datasets show the potential of the proposed approach compared to other relational learnersSubmitted by Moreno Barros (moreno@ct.ufrj.br) on 2020-09-22T22:17:16Z No. of bitstreams: 1 VictorAugustoLopesGuimaraes.pdf: 4874105 bytes, checksum: 239182b71371050810cc6f9cbc1ac4ec (MD5)Made available in DSpace on 2020-09-22T22:17:16Z (GMT). No. of bitstreams: 1 VictorAugustoLopesGuimaraes.pdf: 4874105 bytes, checksum: 239182b71371050810cc6f9cbc1ac4ec (MD5) Previous issue date: 2018-03engUniversidade Federal do Rio de JaneiroPrograma de Pós-Graduação em Engenharia de Sistemas e ComputaçãoUFRJBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaCNPQ::ENGENHARIASonline learningstatistical relational learningtheory revision from examplesinductive logic programmingmining data streamsOnline probabilistic theory revision from examples : a proPPR approachRevisão incremental de teoria probabilística a partir de exemplos: uma abordagem com proPPRinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisabertoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJORIGINALVictorAugustoLopesGuimaraes.pdfVictorAugustoLopesGuimaraes.pdfapplication/pdf4874105http://pantheon.ufrj.br:80/bitstream/11422/13080/1/VictorAugustoLopesGuimaraes.pdf239182b71371050810cc6f9cbc1ac4ecMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81853http://pantheon.ufrj.br:80/bitstream/11422/13080/2/license.txtdd32849f2bfb22da963c3aac6e26e255MD5211422/130802023-11-30 00:01:40.301oai:pantheon.ufrj.br:11422/13080TElDRU7Dh0EgTsODTy1FWENMVVNJVkEgREUgRElTVFJJQlVJw4fDg08KCkFvIGFzc2luYXIgZSBlbnRyZWdhciBlc3RhIGxpY2Vuw6dhLCB2b2PDqihzKSBvKHMpIGF1dG9yKGVzKSBvdSBwcm9wcmlldMOhcmlvKHMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBjb25jZWRlKG0pIGFvIFJlcG9zaXTDs3JpbyBQYW50aGVvbiBkYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gZGUgSmFuZWlybyAoVUZSSikgbyBkaXJlaXRvIG7Do28gLSBleGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vKSBlbSB0b2RvIG8gbXVuZG8sIGVtIGZvcm1hdG8gZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8sIG1hcyBuw6NvIGxpbWl0YWRvIGEgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZSSiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhZHV6aXIgYSBhcHJlc2VudGHDp8OjbyBkZSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gY29tIGEgZmluYWxpZGFkZSBkZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogdGFtYsOpbSBjb25jb3JkYSBxdWUgYSBVRlJKIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXNzYSBzdWJtaXNzw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8OjbyBkaWdpdGFsLgoKRGVjbGFyYSBxdWUgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgc2V1IHRyYWJhbGhvIG9yaWdpbmFsLCBlIHF1ZSB2b2PDqiB0ZW0gbyBkaXJlaXRvIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIGEgc3VhIGFwcmVzZW50YcOnw6NvLCBjb20gbyBtZWxob3IgZGUgc2V1cyBjb25oZWNpbWVudG9zLCBuw6NvIGluZnJpbmdpIGRpcmVpdG9zIGF1dG9yYWlzIGRlIHRlcmNlaXJvcy4KClNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCB2b2PDqiBuw6NvIHRlbSBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBlIGNvbmNlZGUgYSBVRlJKIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRhIHN1Ym1pc3PDo28uCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIHF1ZSBmb2ksIG91IHRlbSBzaWRvIHBhdHJvY2luYWRvIG91IGFwb2lhZG8gcG9yIHVtYSBhZ8OqbmNpYSBvdSBvdXRybyhzKSBvcmdhbmlzbW8ocykgcXVlIG7Do28gYSBVRlJKLCB2b2PDqiBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWxxdWVyIGRpcmVpdG8gZGUgUkVWSVPDg08gb3UgZGUgb3V0cmFzIG9icmlnYcOnw7VlcyByZXF1ZXJpZGFzIHBvciBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUkogaXLDoSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8ocykgc2V1KHMpIG5vbWUocykgY29tbyBhdXRvcihlcykgb3UgcHJvcHJpZXTDoXJpbyhzKSBkYSBzdWJtaXNzw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EsIG5vIGF0byBkZSBzdWJtaXNzw6NvLgo=Repositório de PublicaçõesPUBhttp://www.pantheon.ufrj.br/oai/requestopendoar:2023-11-30T03:01:40Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false
dc.title.pt_BR.fl_str_mv Online probabilistic theory revision from examples : a proPPR approach
dc.title.alternative.pt_BR.fl_str_mv Revisão incremental de teoria probabilística a partir de exemplos: uma abordagem com proPPR
title Online probabilistic theory revision from examples : a proPPR approach
spellingShingle Online probabilistic theory revision from examples : a proPPR approach
Guimarães, Victor Augusto Lopes
CNPQ::ENGENHARIAS
online learning
statistical relational learning
theory revision from examples
inductive logic programming
mining data streams
title_short Online probabilistic theory revision from examples : a proPPR approach
title_full Online probabilistic theory revision from examples : a proPPR approach
title_fullStr Online probabilistic theory revision from examples : a proPPR approach
title_full_unstemmed Online probabilistic theory revision from examples : a proPPR approach
title_sort Online probabilistic theory revision from examples : a proPPR approach
author Guimarães, Victor Augusto Lopes
author_facet Guimarães, Victor Augusto Lopes
author_role author
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/5117568495536090
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3532148462112499
dc.contributor.advisorCo1.none.fl_str_mv Carvalho, Aline Marins Paes
dc.contributor.advisorCo1Lattes.pt_BR.fl_str_mv CV: http://lattes.cnpq.br/0506389215528790
dc.contributor.author.fl_str_mv Guimarães, Victor Augusto Lopes
dc.contributor.referee1.fl_str_mv Barbosa, Valmir Carneiro
dc.contributor.referee2.fl_str_mv Cozman, Fabio Gagliardi
dc.contributor.advisor1.fl_str_mv Zaverucha, Gerson
contributor_str_mv Barbosa, Valmir Carneiro
Cozman, Fabio Gagliardi
Zaverucha, Gerson
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS
topic CNPQ::ENGENHARIAS
online learning
statistical relational learning
theory revision from examples
inductive logic programming
mining data streams
dc.subject.por.fl_str_mv online learning
statistical relational learning
theory revision from examples
inductive logic programming
mining data streams
description A manipulação de fluxos de dados relacionais estruturados se tornou uma tarefa crucial, dada a disponibilidade de conteúdo produzido por sensores e pela Internet, como redes sociais e grafos de conhecimento. Esta tarefa é ainda mais desafiadora em um ambiente relacional do que em ambientes que lidam com exemplos i.i.d., dado que não podemos garantir que os exemplos são independentes. Além disso, a maioria dos métodos de aprendizado relacional ainda são projetados para aprender apenas a partir de conjuntos fechados de dados, não considerando modelos aprendidos em iterações anteriores de exemplos. Neste trabalho, nós propomos OSLR, um algoritmo de aprendizado relacional incremental que é capaz de lidar com fluxos de dados contínuos de exemplos, a medida em que eles chegam. Nós aplicamos técnica de revisão de teoria para aproveitar o conhecimento preliminar como ponto de partida, buscando onde o mesmo deve ser modificado para considerar novos exemplos e aplicando automaticamente essas modificações. Nós nos baseamos na teoria estatística do limitante de Hoeding para decidir se o modelo, de fato, deve ser atualizado, de acordo com novos exemplos. Nosso sistema foi construído sobre a linguagem estatística relacional ProPPR, para descrever os modelos induzidos, visando considerar a incerteza inerente de dados reais. Resultados experimentais em bases de co-autoria e redes sociais mostram o potencial da abordagem proposta comparada com outros métodos de aprendizado relacional.
publishDate 2018
dc.date.issued.fl_str_mv 2018-03
dc.date.accessioned.fl_str_mv 2020-09-22T22:17:16Z
dc.date.available.fl_str_mv 2023-11-30T03:01:40Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11422/13080
url http://hdl.handle.net/11422/13080
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia de Sistemas e Computação
dc.publisher.initials.fl_str_mv UFRJ
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRJ
instname:Universidade Federal do Rio de Janeiro (UFRJ)
instacron:UFRJ
instname_str Universidade Federal do Rio de Janeiro (UFRJ)
instacron_str UFRJ
institution UFRJ
reponame_str Repositório Institucional da UFRJ
collection Repositório Institucional da UFRJ
bitstream.url.fl_str_mv http://pantheon.ufrj.br:80/bitstream/11422/13080/1/VictorAugustoLopesGuimaraes.pdf
http://pantheon.ufrj.br:80/bitstream/11422/13080/2/license.txt
bitstream.checksum.fl_str_mv 239182b71371050810cc6f9cbc1ac4ec
dd32849f2bfb22da963c3aac6e26e255
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)
repository.mail.fl_str_mv
_version_ 1784097188800888832