FAIR principles and big data: a software reference architecture for open science

Detalhes bibliográficos
Autor(a) principal: João Pedro de Carvalho Castro
Data de Publicação: 2022
Outros Autores: Lucas M. F. Romero, Anderson C. Carniel, Cristina D. Aguiar
Tipo de documento: Artigo de conferência
Idioma: eng
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/77035
Resumo: A Open Science busca a garantia de disponibilidade e usabilidade gratuitas de todos os resultados digitais originados de pesquisas científicas, como publicações científicas, dados e metodologias. Ela motivou o surgimento dos Princípios FAIR, que introduzem um conjunto de requisitos que os repositórios contemporâneos de compartilhamento de dados devem adotar para fornecer capacidade de localização, acessibilidade, interoperabilidade e reutilização. No entanto, implementar um repositório compatível com FAIR se tornou um problema central devido a dois fatores principais. Primeiro, há uma complexidade significativa relacionada ao cumprimento dos requisitos, pois eles exigem o gerenciamento de dados de pesquisa e metadados. Segundo, o repositório deve ser projetado para suportar a complexidade inerente de big data de volume, variedade e velocidade. Neste artigo, propomos uma nova arquitetura de referência de software compatível com FAIR para armazenar, processar e consultar grandes volumes de dados científicos e metadados. Também introduzimos um modelo genérico de warehouse de metadados para lidar com os metadados do repositório e dar suporte ao processamento de consultas analíticas, fornecendo diferentes perspectivas de insights de dados. Mostramos a aplicabilidade da arquitetura por meio de um estudo de caso no contexto de um conjunto de dados do mundo real de pacientes brasileiros com COVID-19, detalhando diferentes tipos de consultas e destacando sua importância para a análise de big data
id UFMG_b3570b982cb19577aeeea51b8dbf5442
oai_identifier_str oai:repositorio.ufmg.br:1843/77035
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling FAIR principles and big data: a software reference architecture for open sciencePrincípios FAIR e big data: uma arquitetura de referência de software para ciência abertaScienceBig DataSoftware architectureCiência AbertaBig DataSoftware, ArquiteturaA Open Science busca a garantia de disponibilidade e usabilidade gratuitas de todos os resultados digitais originados de pesquisas científicas, como publicações científicas, dados e metodologias. Ela motivou o surgimento dos Princípios FAIR, que introduzem um conjunto de requisitos que os repositórios contemporâneos de compartilhamento de dados devem adotar para fornecer capacidade de localização, acessibilidade, interoperabilidade e reutilização. No entanto, implementar um repositório compatível com FAIR se tornou um problema central devido a dois fatores principais. Primeiro, há uma complexidade significativa relacionada ao cumprimento dos requisitos, pois eles exigem o gerenciamento de dados de pesquisa e metadados. Segundo, o repositório deve ser projetado para suportar a complexidade inerente de big data de volume, variedade e velocidade. Neste artigo, propomos uma nova arquitetura de referência de software compatível com FAIR para armazenar, processar e consultar grandes volumes de dados científicos e metadados. Também introduzimos um modelo genérico de warehouse de metadados para lidar com os metadados do repositório e dar suporte ao processamento de consultas analíticas, fornecendo diferentes perspectivas de insights de dados. Mostramos a aplicabilidade da arquitetura por meio de um estudo de caso no contexto de um conjunto de dados do mundo real de pacientes brasileiros com COVID-19, detalhando diferentes tipos de consultas e destacando sua importância para a análise de big dataOpen Science pursues the assurance of free availability and usability of every digital outcome originated from scientific research, such as scientific publications, data, and methodologies. It motivated the emergence of the FAIR Principles, which introduce a set of requirements that contemporary data sharing repositories must adopt to provide findability, accessibility, interoperability, and reusability. However, implementing a FAIRcompliant repository has become a core problem due to two main factors. First, there is a significant complexity related to fulfilling the requirements since they demand the management of research data and metadata. Second, the repository must be designed to support the inherent big data complexity of volume, variety, and velocity. In this paper, we propose a novel FAIR-compliant software reference architecture to store, process, and query massive volumes of scientific data and metadata. We also introduce a generic metadata warehouse model to handle the repository metadata and support analytical query processing, providing different perspectives of data insights. We show the applicability of the architecture through a case study in the context of a real-world dataset of COVID-19 Brazilian patients, detailing different types of queries and highlighting their importance to big data analytics.Universidade Federal de Minas GeraisBrasilECI - DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃOUFMG2024-09-30T20:02:07Z2024-09-30T20:02:07Z2022info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/conferenceObjectpdfapplication/pdf9789897585692http://hdl.handle.net/1843/77035engInternational Conference on Enterprise Information SystemJoão Pedro de Carvalho CastroLucas M. F. RomeroAnderson C. CarnielCristina D. Aguiarinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMG2024-09-30T20:02:08Zoai:repositorio.ufmg.br:1843/77035Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oairepositorio@ufmg.bropendoar:2024-09-30T20:02:08Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.none.fl_str_mv FAIR principles and big data: a software reference architecture for open science
Princípios FAIR e big data: uma arquitetura de referência de software para ciência aberta
title FAIR principles and big data: a software reference architecture for open science
spellingShingle FAIR principles and big data: a software reference architecture for open science
João Pedro de Carvalho Castro
Science
Big Data
Software architecture
Ciência Aberta
Big Data
Software, Arquitetura
title_short FAIR principles and big data: a software reference architecture for open science
title_full FAIR principles and big data: a software reference architecture for open science
title_fullStr FAIR principles and big data: a software reference architecture for open science
title_full_unstemmed FAIR principles and big data: a software reference architecture for open science
title_sort FAIR principles and big data: a software reference architecture for open science
author João Pedro de Carvalho Castro
author_facet João Pedro de Carvalho Castro
Lucas M. F. Romero
Anderson C. Carniel
Cristina D. Aguiar
author_role author
author2 Lucas M. F. Romero
Anderson C. Carniel
Cristina D. Aguiar
author2_role author
author
author
dc.contributor.author.fl_str_mv João Pedro de Carvalho Castro
Lucas M. F. Romero
Anderson C. Carniel
Cristina D. Aguiar
dc.subject.por.fl_str_mv Science
Big Data
Software architecture
Ciência Aberta
Big Data
Software, Arquitetura
topic Science
Big Data
Software architecture
Ciência Aberta
Big Data
Software, Arquitetura
description A Open Science busca a garantia de disponibilidade e usabilidade gratuitas de todos os resultados digitais originados de pesquisas científicas, como publicações científicas, dados e metodologias. Ela motivou o surgimento dos Princípios FAIR, que introduzem um conjunto de requisitos que os repositórios contemporâneos de compartilhamento de dados devem adotar para fornecer capacidade de localização, acessibilidade, interoperabilidade e reutilização. No entanto, implementar um repositório compatível com FAIR se tornou um problema central devido a dois fatores principais. Primeiro, há uma complexidade significativa relacionada ao cumprimento dos requisitos, pois eles exigem o gerenciamento de dados de pesquisa e metadados. Segundo, o repositório deve ser projetado para suportar a complexidade inerente de big data de volume, variedade e velocidade. Neste artigo, propomos uma nova arquitetura de referência de software compatível com FAIR para armazenar, processar e consultar grandes volumes de dados científicos e metadados. Também introduzimos um modelo genérico de warehouse de metadados para lidar com os metadados do repositório e dar suporte ao processamento de consultas analíticas, fornecendo diferentes perspectivas de insights de dados. Mostramos a aplicabilidade da arquitetura por meio de um estudo de caso no contexto de um conjunto de dados do mundo real de pacientes brasileiros com COVID-19, detalhando diferentes tipos de consultas e destacando sua importância para a análise de big data
publishDate 2022
dc.date.none.fl_str_mv 2022
2024-09-30T20:02:07Z
2024-09-30T20:02:07Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/conferenceObject
format conferenceObject
status_str publishedVersion
dc.identifier.uri.fl_str_mv 9789897585692
http://hdl.handle.net/1843/77035
identifier_str_mv 9789897585692
url http://hdl.handle.net/1843/77035
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv International Conference on Enterprise Information System
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv pdf
application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
Brasil
ECI - DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO
UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
Brasil
ECI - DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO
UFMG
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv repositorio@ufmg.br
_version_ 1816829755307065344