Towards Findable, Accessible, Interoperable and Reusable (FAIR) Data Repositories: Improving a Data Repository to Behave as a FAIR Data Point

Detalhes bibliográficos
Autor(a) principal: Moreira, João Luiz Rebelo
Data de Publicação: 2019
Outros Autores: Bonino, Luiz, Ferreira Pires, Luís, van Sinderen, Marten, Henning, Patricia
Tipo de documento: Artigo
Idioma: eng
Título da fonte: Liinc em Revista
Texto Completo: http://revista.ibict.br/liinc/article/view/4817
Resumo: ABSTRACT Significant effort is required to find, make sense and reuse research data. To tackle this problem, the Findable, Accessible, Reusable and Interoperable (FAIR) data principles describe a minimal set of requirements for data management and stewardship, considered as the technological basis for the European Open Science Cloud. The FAIR data point (FDP) leverages linked data (LD) to expose data and metadata adhering to the FAIR data principles, specifying a set of standardized metadata that a data repository should implement. Data owners can expose datasets, and data users can reuse datasets through RESTful services, enabling interoperability in a web scale. Data repositories and their underlying software only recently started supporting LD, and their metadata are only available as key-value pairs. An open question in this context is how to enable an existing data repository software to be compliant with the FDP specification, i.e., how to add semantic descriptions to data repositories to ensure the semantic interoperability among data from different repositories? This paper describes a semantic proxy solution to enable a data repository software, the EUDAT B2share service to behave as an FDP in a non-invasive and non-intrusive way, enabling the semantic interoperability through semantic translations. Our solution describes a methodology for metadata mapping based on endogenous model-driven transformations from lexicon to semantic models. We show how metadata in key-value pairs from a general-purpose repository can be made compliant with LD technology without changing the repository software. The solution validation includes functional tests of the FDP metadata layers and a performance analysis of the impact of the semantic proxy on data exchange. The results show that B2share can be compliant to FDP specifications with a reduced impact on the data exchange performance. Therefore, the validation shows that the solution is feasible and adequate to transform a general-purpose data repository software in an FDP.Keywords: FAIR Data; Data Reusability; Data Repository Software; FAIR Data Point.
id IBICT-2_635d305e46ea952ed8bf430f05e99897
oai_identifier_str oai:ojs.revista.ibict.br:article/4817
network_acronym_str IBICT-2
network_name_str Liinc em Revista
spelling Towards Findable, Accessible, Interoperable and Reusable (FAIR) Data Repositories: Improving a Data Repository to Behave as a FAIR Data PointRepositórios para dados localizáveis, acessíveis, interoperáveis e reutilizáveis (FAIR): adaptando um repositório de dados para se comportar como um FAIR Data PointABSTRACT Significant effort is required to find, make sense and reuse research data. To tackle this problem, the Findable, Accessible, Reusable and Interoperable (FAIR) data principles describe a minimal set of requirements for data management and stewardship, considered as the technological basis for the European Open Science Cloud. The FAIR data point (FDP) leverages linked data (LD) to expose data and metadata adhering to the FAIR data principles, specifying a set of standardized metadata that a data repository should implement. Data owners can expose datasets, and data users can reuse datasets through RESTful services, enabling interoperability in a web scale. Data repositories and their underlying software only recently started supporting LD, and their metadata are only available as key-value pairs. An open question in this context is how to enable an existing data repository software to be compliant with the FDP specification, i.e., how to add semantic descriptions to data repositories to ensure the semantic interoperability among data from different repositories? This paper describes a semantic proxy solution to enable a data repository software, the EUDAT B2share service to behave as an FDP in a non-invasive and non-intrusive way, enabling the semantic interoperability through semantic translations. Our solution describes a methodology for metadata mapping based on endogenous model-driven transformations from lexicon to semantic models. We show how metadata in key-value pairs from a general-purpose repository can be made compliant with LD technology without changing the repository software. The solution validation includes functional tests of the FDP metadata layers and a performance analysis of the impact of the semantic proxy on data exchange. The results show that B2share can be compliant to FDP specifications with a reduced impact on the data exchange performance. Therefore, the validation shows that the solution is feasible and adequate to transform a general-purpose data repository software in an FDP.Keywords: FAIR Data; Data Reusability; Data Repository Software; FAIR Data Point.RESUMO É necessário um esforço significativo para encontrar, entender e reutilizar dados da pesquisa. Para endereçar esse problema, os princípios de dados Localizáveis, Acessíveis, Reutilizáveis e Interoperáveis (FAIR em inglês) foram criados, e descrevem um conjunto mínimo de requisitos para gerenciamento e administração de dados, considerados a base tecnológica para a Nuvem Europeia de Ciência Aberta. O FAIR Data Point (FDP) utiliza dados ligados (LD) para expor dados e metadados aderentes aos princípios de dados FAIR, especificando um conjunto de metadados padronizados que um repositório de dados deve implementar. Os proprietários de dados podem expor conjuntos de dados e os usuários de dados podem reutilizar conjuntos de dados por meio de serviços RESTful, permitindo a interoperabilidade em escala na web. Os repositórios de dados e o software subjacente apenas recentemente começaram a oferecer suporte à LD, e seus metadados estão disponíveis apenas como pares de valores-chave. Uma questão em aberto neste contexto é como permitir que um software de repositório de dados existente seja compatível com a especificação do FDP, ou seja, como adicionar descrições semânticas aos repositórios de dados para garantir a interoperabilidade semântica entre dados de diferentes repositórios. Este artigo descreve uma solução não invasiva e não intrusiva de proxy semântico que permite que um software de repositório de dados, o serviço EUDAT B2share, se comporte como um FDP, permitindo a interoperabilidade semântica por meio de traduções semânticas. A solução inclui uma metodologia para o mapeamento de metadados com base em transformações endógenas de modelos léxicos para modelos semânticos. Mostramos como os metadados nos pares de valores-chave de um repositório de uso geral podem ser compatíveis com a tecnologia LD sem alterar o software do repositório. A validação da solução inclui testes funcionais das camadas de metadados do FDP e uma análise de desempenho do impacto do proxy semântico na troca de dados. Os resultados mostram que o B2share pode ser compatível com as especificações do FDP, tendo impacto reduzido no desempenho da troca de dados. Portanto, a validação mostra que a solução é viável e adequada para transformar um software de repositório de dados de uso geral em um FDP.Palavras-chave: Dados FAIR; Reusabilidade de Dados; Software de Repositório de Dados; FAIR Data Point.Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)2019-12-11info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttp://revista.ibict.br/liinc/article/view/481710.18617/liinc.v15i2.4817Liinc em Revista; Vol. 15 No. 2 (2019): Research DataLiinc em Revista; Vol. 15 Núm. 2 (2019): Datos de InvestigaciónLiinc em Revista; v. 15 n. 2 (2019): Dados de Pesquisa1808-3536reponame:Liinc em Revistainstname:Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)instacron:IBICTenghttp://revista.ibict.br/liinc/article/view/4817/4318Moreira, João Luiz RebeloBonino, LuizFerreira Pires, Luísvan Sinderen, MartenHenning, Patriciainfo:eu-repo/semantics/openAccess2021-05-27T11:34:00Zoai:ojs.revista.ibict.br:article/4817Revistahttp://revista.ibict.br/liincPUBhttp://revista.ibict.br/liinc/oai1808-35361808-3536opendoar:null2021-05-27 11:34:02.709Liinc em Revista - Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)false
dc.title.none.fl_str_mv Towards Findable, Accessible, Interoperable and Reusable (FAIR) Data Repositories: Improving a Data Repository to Behave as a FAIR Data Point
Repositórios para dados localizáveis, acessíveis, interoperáveis e reutilizáveis (FAIR): adaptando um repositório de dados para se comportar como um FAIR Data Point
title Towards Findable, Accessible, Interoperable and Reusable (FAIR) Data Repositories: Improving a Data Repository to Behave as a FAIR Data Point
spellingShingle Towards Findable, Accessible, Interoperable and Reusable (FAIR) Data Repositories: Improving a Data Repository to Behave as a FAIR Data Point
Moreira, João Luiz Rebelo
title_short Towards Findable, Accessible, Interoperable and Reusable (FAIR) Data Repositories: Improving a Data Repository to Behave as a FAIR Data Point
title_full Towards Findable, Accessible, Interoperable and Reusable (FAIR) Data Repositories: Improving a Data Repository to Behave as a FAIR Data Point
title_fullStr Towards Findable, Accessible, Interoperable and Reusable (FAIR) Data Repositories: Improving a Data Repository to Behave as a FAIR Data Point
title_full_unstemmed Towards Findable, Accessible, Interoperable and Reusable (FAIR) Data Repositories: Improving a Data Repository to Behave as a FAIR Data Point
title_sort Towards Findable, Accessible, Interoperable and Reusable (FAIR) Data Repositories: Improving a Data Repository to Behave as a FAIR Data Point
author Moreira, João Luiz Rebelo
author_facet Moreira, João Luiz Rebelo
Bonino, Luiz
Ferreira Pires, Luís
van Sinderen, Marten
Henning, Patricia
author_role author
author2 Bonino, Luiz
Ferreira Pires, Luís
van Sinderen, Marten
Henning, Patricia
author2_role author
author
author
author
dc.contributor.author.fl_str_mv Moreira, João Luiz Rebelo
Bonino, Luiz
Ferreira Pires, Luís
van Sinderen, Marten
Henning, Patricia
dc.description.none.fl_txt_mv ABSTRACT Significant effort is required to find, make sense and reuse research data. To tackle this problem, the Findable, Accessible, Reusable and Interoperable (FAIR) data principles describe a minimal set of requirements for data management and stewardship, considered as the technological basis for the European Open Science Cloud. The FAIR data point (FDP) leverages linked data (LD) to expose data and metadata adhering to the FAIR data principles, specifying a set of standardized metadata that a data repository should implement. Data owners can expose datasets, and data users can reuse datasets through RESTful services, enabling interoperability in a web scale. Data repositories and their underlying software only recently started supporting LD, and their metadata are only available as key-value pairs. An open question in this context is how to enable an existing data repository software to be compliant with the FDP specification, i.e., how to add semantic descriptions to data repositories to ensure the semantic interoperability among data from different repositories? This paper describes a semantic proxy solution to enable a data repository software, the EUDAT B2share service to behave as an FDP in a non-invasive and non-intrusive way, enabling the semantic interoperability through semantic translations. Our solution describes a methodology for metadata mapping based on endogenous model-driven transformations from lexicon to semantic models. We show how metadata in key-value pairs from a general-purpose repository can be made compliant with LD technology without changing the repository software. The solution validation includes functional tests of the FDP metadata layers and a performance analysis of the impact of the semantic proxy on data exchange. The results show that B2share can be compliant to FDP specifications with a reduced impact on the data exchange performance. Therefore, the validation shows that the solution is feasible and adequate to transform a general-purpose data repository software in an FDP.Keywords: FAIR Data; Data Reusability; Data Repository Software; FAIR Data Point.
RESUMO É necessário um esforço significativo para encontrar, entender e reutilizar dados da pesquisa. Para endereçar esse problema, os princípios de dados Localizáveis, Acessíveis, Reutilizáveis e Interoperáveis (FAIR em inglês) foram criados, e descrevem um conjunto mínimo de requisitos para gerenciamento e administração de dados, considerados a base tecnológica para a Nuvem Europeia de Ciência Aberta. O FAIR Data Point (FDP) utiliza dados ligados (LD) para expor dados e metadados aderentes aos princípios de dados FAIR, especificando um conjunto de metadados padronizados que um repositório de dados deve implementar. Os proprietários de dados podem expor conjuntos de dados e os usuários de dados podem reutilizar conjuntos de dados por meio de serviços RESTful, permitindo a interoperabilidade em escala na web. Os repositórios de dados e o software subjacente apenas recentemente começaram a oferecer suporte à LD, e seus metadados estão disponíveis apenas como pares de valores-chave. Uma questão em aberto neste contexto é como permitir que um software de repositório de dados existente seja compatível com a especificação do FDP, ou seja, como adicionar descrições semânticas aos repositórios de dados para garantir a interoperabilidade semântica entre dados de diferentes repositórios. Este artigo descreve uma solução não invasiva e não intrusiva de proxy semântico que permite que um software de repositório de dados, o serviço EUDAT B2share, se comporte como um FDP, permitindo a interoperabilidade semântica por meio de traduções semânticas. A solução inclui uma metodologia para o mapeamento de metadados com base em transformações endógenas de modelos léxicos para modelos semânticos. Mostramos como os metadados nos pares de valores-chave de um repositório de uso geral podem ser compatíveis com a tecnologia LD sem alterar o software do repositório. A validação da solução inclui testes funcionais das camadas de metadados do FDP e uma análise de desempenho do impacto do proxy semântico na troca de dados. Os resultados mostram que o B2share pode ser compatível com as especificações do FDP, tendo impacto reduzido no desempenho da troca de dados. Portanto, a validação mostra que a solução é viável e adequada para transformar um software de repositório de dados de uso geral em um FDP.Palavras-chave: Dados FAIR; Reusabilidade de Dados; Software de Repositório de Dados; FAIR Data Point.
description ABSTRACT Significant effort is required to find, make sense and reuse research data. To tackle this problem, the Findable, Accessible, Reusable and Interoperable (FAIR) data principles describe a minimal set of requirements for data management and stewardship, considered as the technological basis for the European Open Science Cloud. The FAIR data point (FDP) leverages linked data (LD) to expose data and metadata adhering to the FAIR data principles, specifying a set of standardized metadata that a data repository should implement. Data owners can expose datasets, and data users can reuse datasets through RESTful services, enabling interoperability in a web scale. Data repositories and their underlying software only recently started supporting LD, and their metadata are only available as key-value pairs. An open question in this context is how to enable an existing data repository software to be compliant with the FDP specification, i.e., how to add semantic descriptions to data repositories to ensure the semantic interoperability among data from different repositories? This paper describes a semantic proxy solution to enable a data repository software, the EUDAT B2share service to behave as an FDP in a non-invasive and non-intrusive way, enabling the semantic interoperability through semantic translations. Our solution describes a methodology for metadata mapping based on endogenous model-driven transformations from lexicon to semantic models. We show how metadata in key-value pairs from a general-purpose repository can be made compliant with LD technology without changing the repository software. The solution validation includes functional tests of the FDP metadata layers and a performance analysis of the impact of the semantic proxy on data exchange. The results show that B2share can be compliant to FDP specifications with a reduced impact on the data exchange performance. Therefore, the validation shows that the solution is feasible and adequate to transform a general-purpose data repository software in an FDP.Keywords: FAIR Data; Data Reusability; Data Repository Software; FAIR Data Point.
publishDate 2019
dc.date.none.fl_str_mv 2019-12-11
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://revista.ibict.br/liinc/article/view/4817
10.18617/liinc.v15i2.4817
url http://revista.ibict.br/liinc/article/view/4817
identifier_str_mv 10.18617/liinc.v15i2.4817
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv http://revista.ibict.br/liinc/article/view/4817/4318
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)
publisher.none.fl_str_mv Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)
dc.source.none.fl_str_mv Liinc em Revista; Vol. 15 No. 2 (2019): Research Data
Liinc em Revista; Vol. 15 Núm. 2 (2019): Datos de Investigación
Liinc em Revista; v. 15 n. 2 (2019): Dados de Pesquisa
1808-3536
reponame:Liinc em Revista
instname:Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)
instacron:IBICT
reponame_str Liinc em Revista
collection Liinc em Revista
instname_str Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)
instacron_str IBICT
institution IBICT
repository.name.fl_str_mv Liinc em Revista - Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)
repository.mail.fl_str_mv
_version_ 1700924326389219328