FAIR principles and big data: a software reference architecture for open science
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Outros Autores: | , , |
Tipo de documento: | Artigo de conferência |
Idioma: | eng |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/77035 |
Resumo: | A Open Science busca a garantia de disponibilidade e usabilidade gratuitas de todos os resultados digitais originados de pesquisas científicas, como publicações científicas, dados e metodologias. Ela motivou o surgimento dos Princípios FAIR, que introduzem um conjunto de requisitos que os repositórios contemporâneos de compartilhamento de dados devem adotar para fornecer capacidade de localização, acessibilidade, interoperabilidade e reutilização. No entanto, implementar um repositório compatível com FAIR se tornou um problema central devido a dois fatores principais. Primeiro, há uma complexidade significativa relacionada ao cumprimento dos requisitos, pois eles exigem o gerenciamento de dados de pesquisa e metadados. Segundo, o repositório deve ser projetado para suportar a complexidade inerente de big data de volume, variedade e velocidade. Neste artigo, propomos uma nova arquitetura de referência de software compatível com FAIR para armazenar, processar e consultar grandes volumes de dados científicos e metadados. Também introduzimos um modelo genérico de warehouse de metadados para lidar com os metadados do repositório e dar suporte ao processamento de consultas analíticas, fornecendo diferentes perspectivas de insights de dados. Mostramos a aplicabilidade da arquitetura por meio de um estudo de caso no contexto de um conjunto de dados do mundo real de pacientes brasileiros com COVID-19, detalhando diferentes tipos de consultas e destacando sua importância para a análise de big data |
id |
UFMG_b3570b982cb19577aeeea51b8dbf5442 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/77035 |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
FAIR principles and big data: a software reference architecture for open sciencePrincípios FAIR e big data: uma arquitetura de referência de software para ciência abertaScienceBig DataSoftware architectureCiência AbertaBig DataSoftware, ArquiteturaA Open Science busca a garantia de disponibilidade e usabilidade gratuitas de todos os resultados digitais originados de pesquisas científicas, como publicações científicas, dados e metodologias. Ela motivou o surgimento dos Princípios FAIR, que introduzem um conjunto de requisitos que os repositórios contemporâneos de compartilhamento de dados devem adotar para fornecer capacidade de localização, acessibilidade, interoperabilidade e reutilização. No entanto, implementar um repositório compatível com FAIR se tornou um problema central devido a dois fatores principais. Primeiro, há uma complexidade significativa relacionada ao cumprimento dos requisitos, pois eles exigem o gerenciamento de dados de pesquisa e metadados. Segundo, o repositório deve ser projetado para suportar a complexidade inerente de big data de volume, variedade e velocidade. Neste artigo, propomos uma nova arquitetura de referência de software compatível com FAIR para armazenar, processar e consultar grandes volumes de dados científicos e metadados. Também introduzimos um modelo genérico de warehouse de metadados para lidar com os metadados do repositório e dar suporte ao processamento de consultas analíticas, fornecendo diferentes perspectivas de insights de dados. Mostramos a aplicabilidade da arquitetura por meio de um estudo de caso no contexto de um conjunto de dados do mundo real de pacientes brasileiros com COVID-19, detalhando diferentes tipos de consultas e destacando sua importância para a análise de big dataOpen Science pursues the assurance of free availability and usability of every digital outcome originated from scientific research, such as scientific publications, data, and methodologies. It motivated the emergence of the FAIR Principles, which introduce a set of requirements that contemporary data sharing repositories must adopt to provide findability, accessibility, interoperability, and reusability. However, implementing a FAIRcompliant repository has become a core problem due to two main factors. First, there is a significant complexity related to fulfilling the requirements since they demand the management of research data and metadata. Second, the repository must be designed to support the inherent big data complexity of volume, variety, and velocity. In this paper, we propose a novel FAIR-compliant software reference architecture to store, process, and query massive volumes of scientific data and metadata. We also introduce a generic metadata warehouse model to handle the repository metadata and support analytical query processing, providing different perspectives of data insights. We show the applicability of the architecture through a case study in the context of a real-world dataset of COVID-19 Brazilian patients, detailing different types of queries and highlighting their importance to big data analytics.Universidade Federal de Minas GeraisBrasilECI - DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃOUFMG2024-09-30T20:02:07Z2024-09-30T20:02:07Z2022info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/conferenceObjectpdfapplication/pdf9789897585692http://hdl.handle.net/1843/77035engInternational Conference on Enterprise Information SystemJoão Pedro de Carvalho CastroLucas M. F. RomeroAnderson C. CarnielCristina D. Aguiarinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMG2024-09-30T20:02:08Zoai:repositorio.ufmg.br:1843/77035Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oairepositorio@ufmg.bropendoar:2024-09-30T20:02:08Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.none.fl_str_mv |
FAIR principles and big data: a software reference architecture for open science Princípios FAIR e big data: uma arquitetura de referência de software para ciência aberta |
title |
FAIR principles and big data: a software reference architecture for open science |
spellingShingle |
FAIR principles and big data: a software reference architecture for open science João Pedro de Carvalho Castro Science Big Data Software architecture Ciência Aberta Big Data Software, Arquitetura |
title_short |
FAIR principles and big data: a software reference architecture for open science |
title_full |
FAIR principles and big data: a software reference architecture for open science |
title_fullStr |
FAIR principles and big data: a software reference architecture for open science |
title_full_unstemmed |
FAIR principles and big data: a software reference architecture for open science |
title_sort |
FAIR principles and big data: a software reference architecture for open science |
author |
João Pedro de Carvalho Castro |
author_facet |
João Pedro de Carvalho Castro Lucas M. F. Romero Anderson C. Carniel Cristina D. Aguiar |
author_role |
author |
author2 |
Lucas M. F. Romero Anderson C. Carniel Cristina D. Aguiar |
author2_role |
author author author |
dc.contributor.author.fl_str_mv |
João Pedro de Carvalho Castro Lucas M. F. Romero Anderson C. Carniel Cristina D. Aguiar |
dc.subject.por.fl_str_mv |
Science Big Data Software architecture Ciência Aberta Big Data Software, Arquitetura |
topic |
Science Big Data Software architecture Ciência Aberta Big Data Software, Arquitetura |
description |
A Open Science busca a garantia de disponibilidade e usabilidade gratuitas de todos os resultados digitais originados de pesquisas científicas, como publicações científicas, dados e metodologias. Ela motivou o surgimento dos Princípios FAIR, que introduzem um conjunto de requisitos que os repositórios contemporâneos de compartilhamento de dados devem adotar para fornecer capacidade de localização, acessibilidade, interoperabilidade e reutilização. No entanto, implementar um repositório compatível com FAIR se tornou um problema central devido a dois fatores principais. Primeiro, há uma complexidade significativa relacionada ao cumprimento dos requisitos, pois eles exigem o gerenciamento de dados de pesquisa e metadados. Segundo, o repositório deve ser projetado para suportar a complexidade inerente de big data de volume, variedade e velocidade. Neste artigo, propomos uma nova arquitetura de referência de software compatível com FAIR para armazenar, processar e consultar grandes volumes de dados científicos e metadados. Também introduzimos um modelo genérico de warehouse de metadados para lidar com os metadados do repositório e dar suporte ao processamento de consultas analíticas, fornecendo diferentes perspectivas de insights de dados. Mostramos a aplicabilidade da arquitetura por meio de um estudo de caso no contexto de um conjunto de dados do mundo real de pacientes brasileiros com COVID-19, detalhando diferentes tipos de consultas e destacando sua importância para a análise de big data |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022 2024-09-30T20:02:07Z 2024-09-30T20:02:07Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/conferenceObject |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
9789897585692 http://hdl.handle.net/1843/77035 |
identifier_str_mv |
9789897585692 |
url |
http://hdl.handle.net/1843/77035 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
International Conference on Enterprise Information System |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
pdf application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais Brasil ECI - DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais Brasil ECI - DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO UFMG |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
repositorio@ufmg.br |
_version_ |
1816829755307065344 |