ETL4FAIR: Uma evolução do ETL4LOD+ voltada para dados FAIR

Detalhes bibliográficos
Autor(a) principal: Rodrigues, Henrique Fernandes
Data de Publicação: 2021
Outros Autores: Pinto, Nickolas Gomes
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRJ
Texto Completo: http://hdl.handle.net/11422/15779
Resumo: A natureza interdisciplinar e o rápido desenvolvimento da Web Semântica levaram à publicação em massa de dados na forma de triplas, utilizando a representação padrão conhecida como Resource Description Framework (RDF), serializada em diversos formatos amplamente aceitos. Dado esse grande crescimento, torna-se cada vez mais importante manter todo esse volume de dados acessível, usável, correto e confiável. Esta preocupação, somada a esforços para a Ciência aberta, ou seja, a abertura de dados seguindo padrões de transparência e colaboração, levaram a comunidade científica mundial, a definir um conjunto de princípios a serem seguidos para garantir a facilidade de descoberta, acesso, interoperabilidade e reuso aos dados. Tais princípios foram chamados de Princípios FAIR e estipulam uma série de processos e tratamentos, a chamada FAIRificação, que devem ser aplicados sobre todo o ciclo de vida de dados e metadados, para que se tornem FAIR. Este trabalho apresenta o ETL4FAIR, um conjunto de novas extensões e melhorias para o já existente ETL4LOD+, criado sobre a plataforma Pentaho Data Integration, para apoiar a publicação de dados conectados. O ETL4FAIR fornece uma interface intuitiva que permite conectar-se a várias fontes e formatos de dados. As novas extensões, empregando o framework em Java do RDF4J, inserem melhorias que promovem o acesso a repositórios de dados triplificados, a terminais SPARQL e a soluções de banco de dados RDF líderes com suporte a SPARQL 1.1 como, por exemplo, o GraphDB.
id UFRJ_6dbee1ba1bad17e2ec4500520e673469
oai_identifier_str oai:pantheon.ufrj.br:11422/15779
network_acronym_str UFRJ
network_name_str Repositório Institucional da UFRJ
repository_id_str
spelling Rodrigues, Henrique FernandesPinto, Nickolas Gomeshttp://lattes.cnpq.br/0659658820912418Borges, Vânia Jesus de Araujo Soareshttp://lattes.cnpq.br/1299486079970847Lopes, Giseli Rabellohttp://lattes.cnpq.br/9439416101626260Felicíssimo, Carolinahttp://lattes.cnpq.br/9285740086584040Campos, Maria Luiza Machado2021-12-10T19:59:22Z2023-11-30T03:04:36Z2021-11-19http://hdl.handle.net/11422/15779Submitted by Elaine Almeida (elaine.almeida@nce.ufrj.br) on 2021-12-10T19:59:22Z No. of bitstreams: 1 HFRodrigues.pdf: 2119954 bytes, checksum: 919bcdeef4c87ecd744feaf25342d1a4 (MD5)Made available in DSpace on 2021-12-10T19:59:22Z (GMT). No. of bitstreams: 1 HFRodrigues.pdf: 2119954 bytes, checksum: 919bcdeef4c87ecd744feaf25342d1a4 (MD5) Previous issue date: 2021-11-19A natureza interdisciplinar e o rápido desenvolvimento da Web Semântica levaram à publicação em massa de dados na forma de triplas, utilizando a representação padrão conhecida como Resource Description Framework (RDF), serializada em diversos formatos amplamente aceitos. Dado esse grande crescimento, torna-se cada vez mais importante manter todo esse volume de dados acessível, usável, correto e confiável. Esta preocupação, somada a esforços para a Ciência aberta, ou seja, a abertura de dados seguindo padrões de transparência e colaboração, levaram a comunidade científica mundial, a definir um conjunto de princípios a serem seguidos para garantir a facilidade de descoberta, acesso, interoperabilidade e reuso aos dados. Tais princípios foram chamados de Princípios FAIR e estipulam uma série de processos e tratamentos, a chamada FAIRificação, que devem ser aplicados sobre todo o ciclo de vida de dados e metadados, para que se tornem FAIR. Este trabalho apresenta o ETL4FAIR, um conjunto de novas extensões e melhorias para o já existente ETL4LOD+, criado sobre a plataforma Pentaho Data Integration, para apoiar a publicação de dados conectados. O ETL4FAIR fornece uma interface intuitiva que permite conectar-se a várias fontes e formatos de dados. As novas extensões, empregando o framework em Java do RDF4J, inserem melhorias que promovem o acesso a repositórios de dados triplificados, a terminais SPARQL e a soluções de banco de dados RDF líderes com suporte a SPARQL 1.1 como, por exemplo, o GraphDB.porUniversidade Federal do Rio de JaneiroUFRJBrasilInstituto de ComputaçãoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOGerenciamento de dadosPrincípios FAIRDados vinculadosCOVID-19ETL4FAIR: Uma evolução do ETL4LOD+ voltada para dados FAIRinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisabertoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJLICENSElicense.txtlicense.txttext/plain; charset=utf-81853http://pantheon.ufrj.br:80/bitstream/11422/15779/2/license.txtdd32849f2bfb22da963c3aac6e26e255MD52ORIGINALHFRodrigues.pdfHFRodrigues.pdfapplication/pdf2119954http://pantheon.ufrj.br:80/bitstream/11422/15779/1/HFRodrigues.pdf919bcdeef4c87ecd744feaf25342d1a4MD5111422/157792023-11-30 00:04:36.692oai:pantheon.ufrj.br:11422/15779TElDRU7Dh0EgTsODTy1FWENMVVNJVkEgREUgRElTVFJJQlVJw4fDg08KCkFvIGFzc2luYXIgZSBlbnRyZWdhciBlc3RhIGxpY2Vuw6dhLCB2b2PDqihzKSBvKHMpIGF1dG9yKGVzKSBvdSBwcm9wcmlldMOhcmlvKHMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBjb25jZWRlKG0pIGFvIFJlcG9zaXTDs3JpbyBQYW50aGVvbiBkYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gZGUgSmFuZWlybyAoVUZSSikgbyBkaXJlaXRvIG7Do28gLSBleGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vKSBlbSB0b2RvIG8gbXVuZG8sIGVtIGZvcm1hdG8gZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8sIG1hcyBuw6NvIGxpbWl0YWRvIGEgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZSSiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhZHV6aXIgYSBhcHJlc2VudGHDp8OjbyBkZSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gY29tIGEgZmluYWxpZGFkZSBkZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogdGFtYsOpbSBjb25jb3JkYSBxdWUgYSBVRlJKIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXNzYSBzdWJtaXNzw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8OjbyBkaWdpdGFsLgoKRGVjbGFyYSBxdWUgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgc2V1IHRyYWJhbGhvIG9yaWdpbmFsLCBlIHF1ZSB2b2PDqiB0ZW0gbyBkaXJlaXRvIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIGEgc3VhIGFwcmVzZW50YcOnw6NvLCBjb20gbyBtZWxob3IgZGUgc2V1cyBjb25oZWNpbWVudG9zLCBuw6NvIGluZnJpbmdpIGRpcmVpdG9zIGF1dG9yYWlzIGRlIHRlcmNlaXJvcy4KClNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCB2b2PDqiBuw6NvIHRlbSBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBlIGNvbmNlZGUgYSBVRlJKIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRhIHN1Ym1pc3PDo28uCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIHF1ZSBmb2ksIG91IHRlbSBzaWRvIHBhdHJvY2luYWRvIG91IGFwb2lhZG8gcG9yIHVtYSBhZ8OqbmNpYSBvdSBvdXRybyhzKSBvcmdhbmlzbW8ocykgcXVlIG7Do28gYSBVRlJKLCB2b2PDqiBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWxxdWVyIGRpcmVpdG8gZGUgUkVWSVPDg08gb3UgZGUgb3V0cmFzIG9icmlnYcOnw7VlcyByZXF1ZXJpZGFzIHBvciBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUkogaXLDoSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8ocykgc2V1KHMpIG5vbWUocykgY29tbyBhdXRvcihlcykgb3UgcHJvcHJpZXTDoXJpbyhzKSBkYSBzdWJtaXNzw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EsIG5vIGF0byBkZSBzdWJtaXNzw6NvLgo=Repositório de PublicaçõesPUBhttp://www.pantheon.ufrj.br/oai/requestopendoar:2023-11-30T03:04:36Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false
dc.title.pt_BR.fl_str_mv ETL4FAIR: Uma evolução do ETL4LOD+ voltada para dados FAIR
title ETL4FAIR: Uma evolução do ETL4LOD+ voltada para dados FAIR
spellingShingle ETL4FAIR: Uma evolução do ETL4LOD+ voltada para dados FAIR
Rodrigues, Henrique Fernandes
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
Gerenciamento de dados
Princípios FAIR
Dados vinculados
COVID-19
title_short ETL4FAIR: Uma evolução do ETL4LOD+ voltada para dados FAIR
title_full ETL4FAIR: Uma evolução do ETL4LOD+ voltada para dados FAIR
title_fullStr ETL4FAIR: Uma evolução do ETL4LOD+ voltada para dados FAIR
title_full_unstemmed ETL4FAIR: Uma evolução do ETL4LOD+ voltada para dados FAIR
title_sort ETL4FAIR: Uma evolução do ETL4LOD+ voltada para dados FAIR
author Rodrigues, Henrique Fernandes
author_facet Rodrigues, Henrique Fernandes
Pinto, Nickolas Gomes
author_role author
author2 Pinto, Nickolas Gomes
author2_role author
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/0659658820912418
dc.contributor.advisorCo1.none.fl_str_mv Borges, Vânia Jesus de Araujo Soares
dc.contributor.advisorCo1Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1299486079970847
dc.contributor.author.fl_str_mv Rodrigues, Henrique Fernandes
Pinto, Nickolas Gomes
dc.contributor.referee1.fl_str_mv Lopes, Giseli Rabello
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/9439416101626260
dc.contributor.referee2.fl_str_mv Felicíssimo, Carolina
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/9285740086584040
dc.contributor.advisor1.fl_str_mv Campos, Maria Luiza Machado
contributor_str_mv Lopes, Giseli Rabello
Felicíssimo, Carolina
Campos, Maria Luiza Machado
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
Gerenciamento de dados
Princípios FAIR
Dados vinculados
COVID-19
dc.subject.por.fl_str_mv Gerenciamento de dados
Princípios FAIR
Dados vinculados
COVID-19
description A natureza interdisciplinar e o rápido desenvolvimento da Web Semântica levaram à publicação em massa de dados na forma de triplas, utilizando a representação padrão conhecida como Resource Description Framework (RDF), serializada em diversos formatos amplamente aceitos. Dado esse grande crescimento, torna-se cada vez mais importante manter todo esse volume de dados acessível, usável, correto e confiável. Esta preocupação, somada a esforços para a Ciência aberta, ou seja, a abertura de dados seguindo padrões de transparência e colaboração, levaram a comunidade científica mundial, a definir um conjunto de princípios a serem seguidos para garantir a facilidade de descoberta, acesso, interoperabilidade e reuso aos dados. Tais princípios foram chamados de Princípios FAIR e estipulam uma série de processos e tratamentos, a chamada FAIRificação, que devem ser aplicados sobre todo o ciclo de vida de dados e metadados, para que se tornem FAIR. Este trabalho apresenta o ETL4FAIR, um conjunto de novas extensões e melhorias para o já existente ETL4LOD+, criado sobre a plataforma Pentaho Data Integration, para apoiar a publicação de dados conectados. O ETL4FAIR fornece uma interface intuitiva que permite conectar-se a várias fontes e formatos de dados. As novas extensões, empregando o framework em Java do RDF4J, inserem melhorias que promovem o acesso a repositórios de dados triplificados, a terminais SPARQL e a soluções de banco de dados RDF líderes com suporte a SPARQL 1.1 como, por exemplo, o GraphDB.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-12-10T19:59:22Z
dc.date.issued.fl_str_mv 2021-11-19
dc.date.available.fl_str_mv 2023-11-30T03:04:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11422/15779
url http://hdl.handle.net/11422/15779
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
dc.publisher.initials.fl_str_mv UFRJ
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Computação
publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRJ
instname:Universidade Federal do Rio de Janeiro (UFRJ)
instacron:UFRJ
instname_str Universidade Federal do Rio de Janeiro (UFRJ)
instacron_str UFRJ
institution UFRJ
reponame_str Repositório Institucional da UFRJ
collection Repositório Institucional da UFRJ
bitstream.url.fl_str_mv http://pantheon.ufrj.br:80/bitstream/11422/15779/2/license.txt
http://pantheon.ufrj.br:80/bitstream/11422/15779/1/HFRodrigues.pdf
bitstream.checksum.fl_str_mv dd32849f2bfb22da963c3aac6e26e255
919bcdeef4c87ecd744feaf25342d1a4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)
repository.mail.fl_str_mv
_version_ 1784097227019386880