Grafos de conhecimento para preparação e reutilização de dados científicos

Detalhes bibliográficos
Autor(a) principal: Marcello Peixoto Bax
Data de Publicação: 2019
Outros Autores: José Eugênio de Assis Gonçalves
Tipo de documento: Artigo de conferência
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/40594
Resumo: A Ciência da Informação deve instrumentalizar os processos de gerenciamento de dados na eScience, viabilizando a maior integração e reuso de dados científicos. Este é um problema não resol vido, presente nos ciclos de gestão de dados científicos. A dificuldade de reuso leva à redundância de esforços custosos para os laboratórios e agências de fomento. É possível aumentar as taxas de reuso de dados entre pesquisas com a sua integração através de ontologias. Este artigo apresenta um mé todo "ágil" de integração semântica de dados, que realiza a ingestão de conjuntos de dados (datasets), produzidos por diferentes estudos, na forma de grafos de conhecimento. O método utiliza uma onto logia de fundação estruturada como um "Dicionário Semântico de Dados", que, integrada a outras ontologias de domínio, gera um grafo de conhecimento. Este grafo facilita o reuso dos dados já que pode integrar conceitualmente dados oriundos de várias fontes em um único repositório. O grafo per mite ao usuário navegar por facetas e escolher as dimensões de seu interesse. A organização facetada dos dados permite a seleção flexível e granular dos mesmos nos datasets integrados, fomentado o reuso e facilitando a tarefa de preparação de dados. O método apoia-se em uma adaptação da design science, com elementos do desenvolvimento ágil de sistemas, que permitem obter e avaliar resultados mais rapidamente (do que os métodos clássicos) e corrigir problemas precocemente. A hipótese de que a integração semântica é facilitada com o uso do método tem sido confirmada pelos resultados de sua aplicação em um projeto de integração de dados em epidemiologia.
id UFMG_dc3f857d58e960e3952a182ff720adb8
oai_identifier_str oai:repositorio.ufmg.br:1843/40594
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling 2022-03-29T23:54:44Z2022-03-29T23:54:44Z2019201222177-3688http://hdl.handle.net/1843/40594A Ciência da Informação deve instrumentalizar os processos de gerenciamento de dados na eScience, viabilizando a maior integração e reuso de dados científicos. Este é um problema não resol vido, presente nos ciclos de gestão de dados científicos. A dificuldade de reuso leva à redundância de esforços custosos para os laboratórios e agências de fomento. É possível aumentar as taxas de reuso de dados entre pesquisas com a sua integração através de ontologias. Este artigo apresenta um mé todo "ágil" de integração semântica de dados, que realiza a ingestão de conjuntos de dados (datasets), produzidos por diferentes estudos, na forma de grafos de conhecimento. O método utiliza uma onto logia de fundação estruturada como um "Dicionário Semântico de Dados", que, integrada a outras ontologias de domínio, gera um grafo de conhecimento. Este grafo facilita o reuso dos dados já que pode integrar conceitualmente dados oriundos de várias fontes em um único repositório. O grafo per mite ao usuário navegar por facetas e escolher as dimensões de seu interesse. A organização facetada dos dados permite a seleção flexível e granular dos mesmos nos datasets integrados, fomentado o reuso e facilitando a tarefa de preparação de dados. O método apoia-se em uma adaptação da design science, com elementos do desenvolvimento ágil de sistemas, que permitem obter e avaliar resultados mais rapidamente (do que os métodos clássicos) e corrigir problemas precocemente. A hipótese de que a integração semântica é facilitada com o uso do método tem sido confirmada pelos resultados de sua aplicação em um projeto de integração de dados em epidemiologia.porUniversidade Federal de Minas GeraisUFMGBrasilECI - DEPARTAMENTO DE TEORIA E GESTÃO INFORMAÇÃOEncontro Nacional de Pequisa em Ciência da Informação - EnancibOntologiasIntegração semântica de dadosGrafos de conhecimentoWeb semânticaGrafos de conhecimento para preparação e reutilização de dados científicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/conferenceObjecthttps://conferencias.ufsc.br/index.php/enancib/2019/paper/viewFile/953/624Marcello Peixoto BaxJosé Eugênio de Assis Gonçalvesapplication/pdfinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGLICENSELicense.txtLicense.txttext/plain; charset=utf-82042https://repositorio.ufmg.br/bitstream/1843/40594/1/License.txtfa505098d172de0bc8864fc1287ffe22MD51ORIGINAL2019_Grafos de conhecimento para preparação e reutilização de dados científicos.pdf2019_Grafos de conhecimento para preparação e reutilização de dados científicos.pdfapplication/pdf708296https://repositorio.ufmg.br/bitstream/1843/40594/2/2019_Grafos%20de%20conhecimento%20para%20prepara%c3%a7%c3%a3o%20e%20reutiliza%c3%a7%c3%a3o%20de%20dados%20cient%c3%adficos.pdf8df956ef9895722a303cc4b1ca338c6cMD521843/405942022-03-29 20:54:44.86oai:repositorio.ufmg.br:1843/40594TElDRU7vv71BIERFIERJU1RSSUJVSe+/ve+/vU8gTu+/vU8tRVhDTFVTSVZBIERPIFJFUE9TSVTvv71SSU8gSU5TVElUVUNJT05BTCBEQSBVRk1HCiAKCkNvbSBhIGFwcmVzZW50Ye+/ve+/vW8gZGVzdGEgbGljZW7vv71hLCB2b2Pvv70gKG8gYXV0b3IgKGVzKSBvdSBvIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yKSBjb25jZWRlIGFvIFJlcG9zaXTvv71yaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbu+/vW8gZXhjbHVzaXZvIGUgaXJyZXZvZ++/vXZlbCBkZSByZXByb2R1emlyIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNh77+977+9byAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0cu+/vW5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mg77+9dWRpbyBvdSB277+9ZGVvLgoKVm9j77+9IGRlY2xhcmEgcXVlIGNvbmhlY2UgYSBwb2zvv710aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2Pvv70gY29uY29yZGEgcXVlIG8gUmVwb3NpdO+/vXJpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250Ze+/vWRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNh77+977+9byBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHvv73vv71vLgoKVm9j77+9IHRhbWLvv71tIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTvv71yaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPvv71waWEgZGUgc3VhIHB1YmxpY2Hvv73vv71vIHBhcmEgZmlucyBkZSBzZWd1cmFu77+9YSwgYmFjay11cCBlIHByZXNlcnZh77+977+9by4KClZvY++/vSBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNh77+977+9byDvv70gb3JpZ2luYWwgZSBxdWUgdm9j77+9IHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vu77+9YS4gVm9j77+9IHRhbWLvv71tIGRlY2xhcmEgcXVlIG8gZGVw77+9c2l0byBkZSBzdWEgcHVibGljYe+/ve+/vW8gbu+/vW8sIHF1ZSBzZWphIGRlIHNldSBjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd177+9bS4KCkNhc28gYSBzdWEgcHVibGljYe+/ve+/vW8gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY++/vSBu77+9byBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2Pvv70gZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc++/vW8gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBSZXBvc2l077+9cmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7vv71hLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3Tvv70gY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250Ze+/vWRvIGRhIHB1YmxpY2Hvv73vv71vIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0Hvv73vv71PIE9SQSBERVBPU0lUQURBIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQ++/vU5JTyBPVSBBUE9JTyBERSBVTUEgQUfvv71OQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0Pvv70gREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklT77+9TyBDT01PIFRBTULvv71NIEFTIERFTUFJUyBPQlJJR0Hvv73vv71FUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l077+9cmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNh77+977+9bywgZSBu77+9byBmYXLvv70gcXVhbHF1ZXIgYWx0ZXJh77+977+9bywgYWzvv71tIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7vv71hLgo=Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2022-03-29T23:54:44Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Grafos de conhecimento para preparação e reutilização de dados científicos
title Grafos de conhecimento para preparação e reutilização de dados científicos
spellingShingle Grafos de conhecimento para preparação e reutilização de dados científicos
Marcello Peixoto Bax
Ontologias
Integração semântica de dados
Grafos de conhecimento
Web semântica
title_short Grafos de conhecimento para preparação e reutilização de dados científicos
title_full Grafos de conhecimento para preparação e reutilização de dados científicos
title_fullStr Grafos de conhecimento para preparação e reutilização de dados científicos
title_full_unstemmed Grafos de conhecimento para preparação e reutilização de dados científicos
title_sort Grafos de conhecimento para preparação e reutilização de dados científicos
author Marcello Peixoto Bax
author_facet Marcello Peixoto Bax
José Eugênio de Assis Gonçalves
author_role author
author2 José Eugênio de Assis Gonçalves
author2_role author
dc.contributor.author.fl_str_mv Marcello Peixoto Bax
José Eugênio de Assis Gonçalves
dc.subject.other.pt_BR.fl_str_mv Ontologias
Integração semântica de dados
Grafos de conhecimento
Web semântica
topic Ontologias
Integração semântica de dados
Grafos de conhecimento
Web semântica
description A Ciência da Informação deve instrumentalizar os processos de gerenciamento de dados na eScience, viabilizando a maior integração e reuso de dados científicos. Este é um problema não resol vido, presente nos ciclos de gestão de dados científicos. A dificuldade de reuso leva à redundância de esforços custosos para os laboratórios e agências de fomento. É possível aumentar as taxas de reuso de dados entre pesquisas com a sua integração através de ontologias. Este artigo apresenta um mé todo "ágil" de integração semântica de dados, que realiza a ingestão de conjuntos de dados (datasets), produzidos por diferentes estudos, na forma de grafos de conhecimento. O método utiliza uma onto logia de fundação estruturada como um "Dicionário Semântico de Dados", que, integrada a outras ontologias de domínio, gera um grafo de conhecimento. Este grafo facilita o reuso dos dados já que pode integrar conceitualmente dados oriundos de várias fontes em um único repositório. O grafo per mite ao usuário navegar por facetas e escolher as dimensões de seu interesse. A organização facetada dos dados permite a seleção flexível e granular dos mesmos nos datasets integrados, fomentado o reuso e facilitando a tarefa de preparação de dados. O método apoia-se em uma adaptação da design science, com elementos do desenvolvimento ágil de sistemas, que permitem obter e avaliar resultados mais rapidamente (do que os métodos clássicos) e corrigir problemas precocemente. A hipótese de que a integração semântica é facilitada com o uso do método tem sido confirmada pelos resultados de sua aplicação em um projeto de integração de dados em epidemiologia.
publishDate 2019
dc.date.issued.fl_str_mv 2019
dc.date.accessioned.fl_str_mv 2022-03-29T23:54:44Z
dc.date.available.fl_str_mv 2022-03-29T23:54:44Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/conferenceObject
format conferenceObject
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/40594
dc.identifier.issn.pt_BR.fl_str_mv 2177-3688
identifier_str_mv 2177-3688
url http://hdl.handle.net/1843/40594
dc.language.iso.fl_str_mv por
language por
dc.relation.ispartof.pt_BR.fl_str_mv Encontro Nacional de Pequisa em Ciência da Informação - Enancib
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv ECI - DEPARTAMENTO DE TEORIA E GESTÃO INFORMAÇÃO
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/40594/1/License.txt
https://repositorio.ufmg.br/bitstream/1843/40594/2/2019_Grafos%20de%20conhecimento%20para%20prepara%c3%a7%c3%a3o%20e%20reutiliza%c3%a7%c3%a3o%20de%20dados%20cient%c3%adficos.pdf
bitstream.checksum.fl_str_mv fa505098d172de0bc8864fc1287ffe22
8df956ef9895722a303cc4b1ca338c6c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1801676640751714304