Data linking as a service: a microservices infrastructure for publishing linked data

Detalhes bibliográficos
Autor(a) principal: Salvadori, Ivan Luiz
Data de Publicação: 2019
Tipo de documento: Tese
Idioma: eng
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/214954
Resumo: Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.
id UFSC_ac2a14dc3e7ed8ead92807b7a613bd38
oai_identifier_str oai:repositorio.ufsc.br:123456789/214954
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Universidade Federal de Santa CatarinaSalvadori, Ivan LuizSiqueira, Frank2020-10-21T21:11:38Z2020-10-21T21:11:38Z2019362963https://repositorio.ufsc.br/handle/123456789/214954Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.Empresas, governos e pessoas comuns produzem e publicam uma enorme quantidade de dados na Web. Muitos observadores estão apontando que a compreensão dos dados não pode ser feita sem ferramentas adequadas para conceituar, preparar e integrar dados. Pesquisas realizadas nos últimos anos mostram que descrever os dados semanticamente é crucial para promover soluções de integração de dados. No entanto, existem poucos padrões definidos para o desenvolvimento de serviços orientados a dados que possuem suporte a padrões da Web semântica. Nesse sentido, este trabalho propõe DLaaS, uma infraestrutura de microserviços para publicação de dados conectados, capaz de interconectar informações de várias fontes de dados. A infraestrutura proposta é composta por componentes internos capazes de conectar proativamente dados gerenciados por microserviços distintos. DLaaS busca facilitar a execução dos processos necessários para publicar adequadamente dados conectados na Web, o que inclui enriquecimento semântico, conversão de dados legados em dados conectados, processos de interlinking de dados e publicação. Seu principal objetivo é maximizar a reutilização de dados através da conexão de entidades provenientes de conjuntos de dados distintos e heterogêneos, mas que possuem um certo nível de interseção de dados ou possuem relacionamentos semânticos explicitamente definidos. O que diferencia este trabalho das demais propostas encontradas na literatura é a capacidade da infraestrutura executar a otimização da estrutura de dados e gerar links entre recursos Web e, portanto, fornecer uma visão navegável de várias fontes de dados heterogêneas e distribuídas. Além disso, este trabalho propõem um modelo de capacidade que auxilia o desenvolvimento de provedores de dados semânticos. A fim de demonstrar a viabilidade da abordagem proposta, avaliações foram conduzidas de acordo com métodos estatísticos apropriados utilizando conjuntos de dados do mundo real.<br>Abstract : We are living in the age of big data, advanced analytics, and data science. Companies, government, and even ordinary people are producing and publishing a huge amount of data on the Web. Many observers are pointing out that making sense of data cannot be done without suitable tools for conceptualizing, preparing, and integrating data. Research in the last years has shown that taking into account the semantics of data is crucial for fostering data integration solutions. However, there is a lack of solutions for data publishing that follow the best practices for exposing, sharing and connecting data. With this regard, this work proposed DLaaS, a microservices infrastructure for publishing linked data. DLaaS is capable of interconnecting Web resources from multiple data sources. The proposed infrastructure is composed of several internal components responsible for performing a multitude of tasks for pro-actively connecting Web resources managed by the infrastructure. The proposed infrastructure aims at facilitating the execution of necessary processes to properly publish high quality linked data, which includes semantic enrichment, conversion of legacy data into linked data, data linking procedures, and publication. Its main goal is to improve the reuse of data by connecting entities based on distinct and heterogeneous datasets that share a certain level of data intersection or semantic relationship. What differentiates this work from similar proposals found in the literature is the capability of performing data structure optimization combined with the generation of links between Web resources and therefore providing a navigable view of multiple distributed heterogeneous data sources. Additionally, this work proposed a capacity model that describes how to properly adopt the most appropriate semantic Web features for implementing data-driven services. In order to properly demonstrate the feasability of our approach, evaluations were conducted according to appropriate statistical methods and used real-world datasets.177 p.| il., gráfs., tabs.engComputaçãoDados ligadosWeb semânticaServiços da WebData linking as a service: a microservices infrastructure for publishing linked datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPGCC1146-T.pdfPGCC1146-T.pdfapplication/pdf3087753https://repositorio.ufsc.br/bitstream/123456789/214954/-1/PGCC1146-T.pdfb2b5cb99ea53e6c07b4e18823f21f1a3MD5-1123456789/2149542020-10-21 18:11:38.951oai:repositorio.ufsc.br:123456789/214954Repositório de PublicaçõesPUBhttp://150.162.242.35/oai/requestopendoar:23732020-10-21T21:11:38Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Data linking as a service: a microservices infrastructure for publishing linked data
title Data linking as a service: a microservices infrastructure for publishing linked data
spellingShingle Data linking as a service: a microservices infrastructure for publishing linked data
Salvadori, Ivan Luiz
Computação
Dados ligados
Web semântica
Serviços da Web
title_short Data linking as a service: a microservices infrastructure for publishing linked data
title_full Data linking as a service: a microservices infrastructure for publishing linked data
title_fullStr Data linking as a service: a microservices infrastructure for publishing linked data
title_full_unstemmed Data linking as a service: a microservices infrastructure for publishing linked data
title_sort Data linking as a service: a microservices infrastructure for publishing linked data
author Salvadori, Ivan Luiz
author_facet Salvadori, Ivan Luiz
author_role author
dc.contributor.none.fl_str_mv Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Salvadori, Ivan Luiz
dc.contributor.advisor1.fl_str_mv Siqueira, Frank
contributor_str_mv Siqueira, Frank
dc.subject.classification.none.fl_str_mv Computação
Dados ligados
Web semântica
Serviços da Web
topic Computação
Dados ligados
Web semântica
Serviços da Web
description Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.
publishDate 2019
dc.date.issued.fl_str_mv 2019
dc.date.accessioned.fl_str_mv 2020-10-21T21:11:38Z
dc.date.available.fl_str_mv 2020-10-21T21:11:38Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/214954
dc.identifier.other.none.fl_str_mv 362963
identifier_str_mv 362963
url https://repositorio.ufsc.br/handle/123456789/214954
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 177 p.| il., gráfs., tabs.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
bitstream.url.fl_str_mv https://repositorio.ufsc.br/bitstream/123456789/214954/-1/PGCC1146-T.pdf
bitstream.checksum.fl_str_mv b2b5cb99ea53e6c07b4e18823f21f1a3
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1766805376302317568