Framework para publicação de metadados geoespaciais semânticos seguindo as boas práticas de Linked Data

Detalhes bibliográficos
Autor(a) principal: Pereira, Clayton Martins [UNESP]
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/239209
Resumo: Os metadados são atributos de recursos informacionais, com a finalidade de identificá-los e fornecer informações detalhadas a seu respeito, de forma que possam ser rapidamente encontrados e processados pelos usuários. No caso dos metadados que descrevem recursos (datasets) que podem ser referenciados espacialmente em relação à superfície da Terra, os chamados ‘metadados geoespaciais’, esses devem transmitir ainda outras informações específicas a respeito da posição precisa daquele recurso, chamadas de ‘extensão espacial’. Isso aumenta consideravelmente o espaço necessário para armazenamento dos datasets, bem como torna seu processamento mais complexo, o que exige maior alocação de recursos computacionais. Diante dessa complexidade, e dos altos custos para produzir e manter enormes volumes de dados geoespaciais, é que diversos governos e entidades se lançaram na concepção das chamadas ‘Infraestruturas de Dados Espaciais (IDEs)’, que têm se popularizado como uma importante solução para permitir a interoperabilidade de dados geoespaciais. No entanto, nas plataformas de IDEs de geração atual, as buscas aos metadados disponibilizados nos respectivos servidores de catálogo são sintáticas, ou seja, as palavras-chave fornecidas pelos usuários são utilizadas de forma literal, quer sejam isoladas (termo) ou agrupadas (frase), sem considerar o contexto ou significado específico delas. Assim, podem ser retornados resultados que não são de interesse dos usuários, ou ainda resultados relevantes deixarem de ser encontrados devido à falta de desambiguação de termos com vários sentidos e por não incorporar todos os significados e sinônimos desses termos na busca. Diante disso, as tecnologias e ferramentas da Web Semântica, e as boas práticas de Linked Data, tem se mostrado eficazes para promover a interoperabilidade de dados em nível semântico, em larga escala, ao usar a arquitetura da Web atual, que é constituída de padrões totalmente abertos. Assim, o presente trabalho pretende contribuir para a concepção das IDEs de próxima geração por meio de sua integração com as tecnologias e ferramentas da Web Semântica, o que possibilitaria a recuperação e reuso de datasets geoespaciais tanto por humanos quanto por máquinas. Para isso, é proposto um framework que estabelece um fluxo organizacional para orientar a execução das etapas de um processo de publicação de metadados geoespaciais semânticos na Web seguindo as boas práticas de Linked Data. Trata-se de uma pesquisa teórica, de natureza aplicada, de abordagem qualitativa e do tipo exploratória, que emprega como métodos a revisão bibliográfica e a pesquisa documental, nas quais os conteúdos obtidos são analisados por meio da aplicação do método de ‘Análise de Conteúdo’. O framework proposto foi validado em uma prova de conceito, na qual foram executados cada um dos procedimentos que o compõem, utilizando como amostra um registro de metadados extraído do catálogo de metadados da IDE ‘TerraBrasilis/INPE’. A partir da prova de conceito foi possível constatar a viabilidade de implementação de cada procedimento proposto no framework, dentre os quais o crosswalk para conversão de padrões de metadados, a estruturação das triplas RDF com o uso do vocabulário DCAT-2, e o enriquecimento semântico dos metadados por meio de sua ligação à Web de dados.
id UNSP_052231e081f13054e823e501cfddb25e
oai_identifier_str oai:repositorio.unesp.br:11449/239209
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Framework para publicação de metadados geoespaciais semânticos seguindo as boas práticas de Linked DataFramework for publishing semantic geospatial metadata following Linked Data best practicesFramework para la publicación de metadatos geoespaciales semánticos siguiendo las mejores prácticas de datos vinculadosCiência da informaçãoMetadadosDados ligadosDados geoespaciaisWeb semânticaMetadataLinked dataGeospatial dataSemantic webOs metadados são atributos de recursos informacionais, com a finalidade de identificá-los e fornecer informações detalhadas a seu respeito, de forma que possam ser rapidamente encontrados e processados pelos usuários. No caso dos metadados que descrevem recursos (datasets) que podem ser referenciados espacialmente em relação à superfície da Terra, os chamados ‘metadados geoespaciais’, esses devem transmitir ainda outras informações específicas a respeito da posição precisa daquele recurso, chamadas de ‘extensão espacial’. Isso aumenta consideravelmente o espaço necessário para armazenamento dos datasets, bem como torna seu processamento mais complexo, o que exige maior alocação de recursos computacionais. Diante dessa complexidade, e dos altos custos para produzir e manter enormes volumes de dados geoespaciais, é que diversos governos e entidades se lançaram na concepção das chamadas ‘Infraestruturas de Dados Espaciais (IDEs)’, que têm se popularizado como uma importante solução para permitir a interoperabilidade de dados geoespaciais. No entanto, nas plataformas de IDEs de geração atual, as buscas aos metadados disponibilizados nos respectivos servidores de catálogo são sintáticas, ou seja, as palavras-chave fornecidas pelos usuários são utilizadas de forma literal, quer sejam isoladas (termo) ou agrupadas (frase), sem considerar o contexto ou significado específico delas. Assim, podem ser retornados resultados que não são de interesse dos usuários, ou ainda resultados relevantes deixarem de ser encontrados devido à falta de desambiguação de termos com vários sentidos e por não incorporar todos os significados e sinônimos desses termos na busca. Diante disso, as tecnologias e ferramentas da Web Semântica, e as boas práticas de Linked Data, tem se mostrado eficazes para promover a interoperabilidade de dados em nível semântico, em larga escala, ao usar a arquitetura da Web atual, que é constituída de padrões totalmente abertos. Assim, o presente trabalho pretende contribuir para a concepção das IDEs de próxima geração por meio de sua integração com as tecnologias e ferramentas da Web Semântica, o que possibilitaria a recuperação e reuso de datasets geoespaciais tanto por humanos quanto por máquinas. Para isso, é proposto um framework que estabelece um fluxo organizacional para orientar a execução das etapas de um processo de publicação de metadados geoespaciais semânticos na Web seguindo as boas práticas de Linked Data. Trata-se de uma pesquisa teórica, de natureza aplicada, de abordagem qualitativa e do tipo exploratória, que emprega como métodos a revisão bibliográfica e a pesquisa documental, nas quais os conteúdos obtidos são analisados por meio da aplicação do método de ‘Análise de Conteúdo’. O framework proposto foi validado em uma prova de conceito, na qual foram executados cada um dos procedimentos que o compõem, utilizando como amostra um registro de metadados extraído do catálogo de metadados da IDE ‘TerraBrasilis/INPE’. A partir da prova de conceito foi possível constatar a viabilidade de implementação de cada procedimento proposto no framework, dentre os quais o crosswalk para conversão de padrões de metadados, a estruturação das triplas RDF com o uso do vocabulário DCAT-2, e o enriquecimento semântico dos metadados por meio de sua ligação à Web de dados.Metadata are attributes of information resources, with the purpose of identifying them and providing detailed information about them, so that they can be quickly found and processed by users. In the case of metadata describing resources (datasets) that can be spatially referenced relative to the Earth's surface, the so-called 'geospatial metadata', it must also convey other specific information about the precise position of that resource, called 'spatial extent'. This considerably increases the space required for storing the datasets, as well as making their processing more complex, which requires a greater allocation of computational resources. Given this complexity, and the high costs to produce and maintain huge volumes of geospatial data, is that several governments and entities have launched in the design of the so-called 'Spatial Data Infrastructures (SDIs)', which have become popular as an important solution to enable the interoperability of geospatial data. However, in the current generation SDI platforms, the searches to the metadata made available in the respective catalog servers are syntactic, i.e., the keywords provided by users are used in a literal way, either isolated (term) or grouped (phrase), without considering their specific context or meaning. Thus, results may be returned that are not of interest to the users, or even relevant results may not be found due to the lack of disambiguation of terms with multiple meanings and by not incorporating all the meanings and synonyms of these terms in the search. Therefore, Semantic Web technologies and tools, and Linked Data best practices have proven to be effective in promoting large-scale semantic data interoperability by using the current Web architecture, which consists of completely open standards. Thus, this work aims to contribute to the design of next generation SDIs through their integration with Semantic Web technologies and tools, which would enable the retrieval and reuse of geospatial datasets by both humans and machines. To this end, a framework is proposed that establishes an organizational flow to guide the execution of the steps of a semantic geospatial metadata publishing process on the Web following Linked Data best practices. This is theoretical research, of applied nature, of qualitative approach and exploratory type, that employs as methods the bibliographic review and the documentary research, in which the obtained contents are analyzed through the application of the 'Content Analysis' method. The proposed framework was validated in a proof of concept, in which each of the procedures that compose it were executed, using as sample a metadata record extracted from the metadata catalog of the SDI 'TerraBrasilis/INPE'. From the proof of concept, it was possible to verify the feasibility of implementing each procedure proposed in the framework, including the crosswalk to convert metadata standards, the structuring of RDF triples using DCAT-2 vocabulary, and the semantic enrichment of metadata through its link to the Web of data.Não recebi financiamentoUniversidade Estadual Paulista (Unesp)Santarem Segundo, José Eduardo [UNESP]Universidade Estadual Paulista (Unesp)Pereira, Clayton Martins [UNESP]2023-02-01T13:16:07Z2023-02-01T13:16:07Z2022-12-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfPEREIRA, Clayton Martins. Framework para publicação de metadados geoespaciais semânticos seguindo as boas práticas de Linked Data. Universidade Estadual Paulista (Unesp), 2022.http://hdl.handle.net/11449/23920933004110043P4porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-08-12T18:32:47Zoai:repositorio.unesp.br:11449/239209Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-12T18:32:47Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Framework para publicação de metadados geoespaciais semânticos seguindo as boas práticas de Linked Data
Framework for publishing semantic geospatial metadata following Linked Data best practices
Framework para la publicación de metadatos geoespaciales semánticos siguiendo las mejores prácticas de datos vinculados
title Framework para publicação de metadados geoespaciais semânticos seguindo as boas práticas de Linked Data
spellingShingle Framework para publicação de metadados geoespaciais semânticos seguindo as boas práticas de Linked Data
Pereira, Clayton Martins [UNESP]
Ciência da informação
Metadados
Dados ligados
Dados geoespaciais
Web semântica
Metadata
Linked data
Geospatial data
Semantic web
title_short Framework para publicação de metadados geoespaciais semânticos seguindo as boas práticas de Linked Data
title_full Framework para publicação de metadados geoespaciais semânticos seguindo as boas práticas de Linked Data
title_fullStr Framework para publicação de metadados geoespaciais semânticos seguindo as boas práticas de Linked Data
title_full_unstemmed Framework para publicação de metadados geoespaciais semânticos seguindo as boas práticas de Linked Data
title_sort Framework para publicação de metadados geoespaciais semânticos seguindo as boas práticas de Linked Data
author Pereira, Clayton Martins [UNESP]
author_facet Pereira, Clayton Martins [UNESP]
author_role author
dc.contributor.none.fl_str_mv Santarem Segundo, José Eduardo [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Pereira, Clayton Martins [UNESP]
dc.subject.por.fl_str_mv Ciência da informação
Metadados
Dados ligados
Dados geoespaciais
Web semântica
Metadata
Linked data
Geospatial data
Semantic web
topic Ciência da informação
Metadados
Dados ligados
Dados geoespaciais
Web semântica
Metadata
Linked data
Geospatial data
Semantic web
description Os metadados são atributos de recursos informacionais, com a finalidade de identificá-los e fornecer informações detalhadas a seu respeito, de forma que possam ser rapidamente encontrados e processados pelos usuários. No caso dos metadados que descrevem recursos (datasets) que podem ser referenciados espacialmente em relação à superfície da Terra, os chamados ‘metadados geoespaciais’, esses devem transmitir ainda outras informações específicas a respeito da posição precisa daquele recurso, chamadas de ‘extensão espacial’. Isso aumenta consideravelmente o espaço necessário para armazenamento dos datasets, bem como torna seu processamento mais complexo, o que exige maior alocação de recursos computacionais. Diante dessa complexidade, e dos altos custos para produzir e manter enormes volumes de dados geoespaciais, é que diversos governos e entidades se lançaram na concepção das chamadas ‘Infraestruturas de Dados Espaciais (IDEs)’, que têm se popularizado como uma importante solução para permitir a interoperabilidade de dados geoespaciais. No entanto, nas plataformas de IDEs de geração atual, as buscas aos metadados disponibilizados nos respectivos servidores de catálogo são sintáticas, ou seja, as palavras-chave fornecidas pelos usuários são utilizadas de forma literal, quer sejam isoladas (termo) ou agrupadas (frase), sem considerar o contexto ou significado específico delas. Assim, podem ser retornados resultados que não são de interesse dos usuários, ou ainda resultados relevantes deixarem de ser encontrados devido à falta de desambiguação de termos com vários sentidos e por não incorporar todos os significados e sinônimos desses termos na busca. Diante disso, as tecnologias e ferramentas da Web Semântica, e as boas práticas de Linked Data, tem se mostrado eficazes para promover a interoperabilidade de dados em nível semântico, em larga escala, ao usar a arquitetura da Web atual, que é constituída de padrões totalmente abertos. Assim, o presente trabalho pretende contribuir para a concepção das IDEs de próxima geração por meio de sua integração com as tecnologias e ferramentas da Web Semântica, o que possibilitaria a recuperação e reuso de datasets geoespaciais tanto por humanos quanto por máquinas. Para isso, é proposto um framework que estabelece um fluxo organizacional para orientar a execução das etapas de um processo de publicação de metadados geoespaciais semânticos na Web seguindo as boas práticas de Linked Data. Trata-se de uma pesquisa teórica, de natureza aplicada, de abordagem qualitativa e do tipo exploratória, que emprega como métodos a revisão bibliográfica e a pesquisa documental, nas quais os conteúdos obtidos são analisados por meio da aplicação do método de ‘Análise de Conteúdo’. O framework proposto foi validado em uma prova de conceito, na qual foram executados cada um dos procedimentos que o compõem, utilizando como amostra um registro de metadados extraído do catálogo de metadados da IDE ‘TerraBrasilis/INPE’. A partir da prova de conceito foi possível constatar a viabilidade de implementação de cada procedimento proposto no framework, dentre os quais o crosswalk para conversão de padrões de metadados, a estruturação das triplas RDF com o uso do vocabulário DCAT-2, e o enriquecimento semântico dos metadados por meio de sua ligação à Web de dados.
publishDate 2022
dc.date.none.fl_str_mv 2022-12-15
2023-02-01T13:16:07Z
2023-02-01T13:16:07Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PEREIRA, Clayton Martins. Framework para publicação de metadados geoespaciais semânticos seguindo as boas práticas de Linked Data. Universidade Estadual Paulista (Unesp), 2022.
http://hdl.handle.net/11449/239209
33004110043P4
identifier_str_mv PEREIRA, Clayton Martins. Framework para publicação de metadados geoespaciais semânticos seguindo as boas práticas de Linked Data. Universidade Estadual Paulista (Unesp), 2022.
33004110043P4
url http://hdl.handle.net/11449/239209
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128148519256064