[pt] INTERLIGANDO RECURSOS NA WEB ATRAVÉS DE ABORDAGENS DE MATCHING E INTERLINKING

Detalhes bibliográficos
Autor(a) principal: BERNARDO PEREIRA NUNES
Data de Publicação: 2016
Tipo de documento: Outros
Idioma: eng
Título da fonte: Repositório Institucional da PUC-RIO (Projeto Maxwell)
Texto Completo: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=25608@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=25608@2
http://doi.org/10.17771/PUCRio.acad.25608
Resumo: [pt] Com o surgimento da Linked (Open) Data, uma série de novos e importantes desafios de pesquisa vieram à tona. A abertura de dados, como muitas vezes a Linked Data é conhecida, oferece uma oportunidade para integrar e conectar, de forma homogênea, fontes de dados heterogêneas na Web. Como diferentes fontes de dados, com recursos em comum ou relacionados, são publicados por diferentes editores, a sua integração e consolidação torna-se um verdadeiro desafio. Outro desafio advindo da Linked Data está na criação de um grafo denso de dados na Web. Com isso, a identificação e interligação, não só de recursos idênticos, mas também dos recursos relacionadas na Web, provê ao consumidor (data consumer) uma representação mais rica dos dados e a possibilidade de exploração dos recursos conectados. Nesta tese, apresentamos três abordagens para enfrentar os problemas de integração, consolidação e interligação de dados. Nossa primeira abordagem combina técnicas de informação mútua e programação genética para solucionar o problema de alinhamento complexo entre fontes de dados, um problema raramente abordado na literatura. Na segunda e terceira abordagens, adotamos e ampliamos uma métrica utilizada em teoria de redes sociais para enfrentar o problema de consolidação e interligação de dados. Além disso, apresentamos um aplicativo Web chamado Cite4Me que fornece uma nova perspectiva sobre a pesquisa e recuperação de conjuntos de Linked Open Data, bem como os benefícios da utilização de nossas abordagens. Por fim, uma série de experimentos utilizando conjuntos de dados reais demonstram que as nossas abordagens superam abordagens consideradas como estado da arte.
id PUC_RIO-1_1daf84f7b0a826d29f290752e46ea781
oai_identifier_str oai:MAXWELL.puc-rio.br:25608
network_acronym_str PUC_RIO-1
network_name_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str 534
spelling [pt] INTERLIGANDO RECURSOS NA WEB ATRAVÉS DE ABORDAGENS DE MATCHING E INTERLINKING [en] TOWARDS A WELL-INTERLINKED WEB THROUGH MATCHING AND INTERLINKING APPROACHES [pt] WEB SEMANTICA[pt] FIREME[pt] CITE4ME[pt] DOCUMENT LINKING[pt] ENTITY LINKING[pt] CONSOLIDACAO DE DADOS[pt] LINKED DATA[pt] ALINHAMENTO DE ESQUEMAS[pt] SISTEMAS DE RECOMENDACAO[pt] ALINHAMENTO DE ONTOLOGIAS[pt] PRIVACIDADE[pt] INTEGRACAO DE DADOS[en] SEMANTIC WEB[en] FIREME[en] CITE4ME[en] DOCUMENT LINKING[en] ENTITY LINKING[en] DATA CONSOLIDATION[en] LINKED DATA[en] RECOMMENDER SYSTEMS[en] ONTOLOGY ALIGNMENT[en] PRIVACY[en] DATA INTEGRATION[pt] Com o surgimento da Linked (Open) Data, uma série de novos e importantes desafios de pesquisa vieram à tona. A abertura de dados, como muitas vezes a Linked Data é conhecida, oferece uma oportunidade para integrar e conectar, de forma homogênea, fontes de dados heterogêneas na Web. Como diferentes fontes de dados, com recursos em comum ou relacionados, são publicados por diferentes editores, a sua integração e consolidação torna-se um verdadeiro desafio. Outro desafio advindo da Linked Data está na criação de um grafo denso de dados na Web. Com isso, a identificação e interligação, não só de recursos idênticos, mas também dos recursos relacionadas na Web, provê ao consumidor (data consumer) uma representação mais rica dos dados e a possibilidade de exploração dos recursos conectados. Nesta tese, apresentamos três abordagens para enfrentar os problemas de integração, consolidação e interligação de dados. Nossa primeira abordagem combina técnicas de informação mútua e programação genética para solucionar o problema de alinhamento complexo entre fontes de dados, um problema raramente abordado na literatura. Na segunda e terceira abordagens, adotamos e ampliamos uma métrica utilizada em teoria de redes sociais para enfrentar o problema de consolidação e interligação de dados. Além disso, apresentamos um aplicativo Web chamado Cite4Me que fornece uma nova perspectiva sobre a pesquisa e recuperação de conjuntos de Linked Open Data, bem como os benefícios da utilização de nossas abordagens. Por fim, uma série de experimentos utilizando conjuntos de dados reais demonstram que as nossas abordagens superam abordagens consideradas como estado da arte.[en] With the emergence of Linked (Open) Data, a number of novel and notable research challenges have been raised. The openness that often characterises Linked Data offers an opportunity to homogeneously integrate and connect heterogeneous data sources on the Web. As disparate data sources with overlapping or related resources are provided by different data publishers, their integration and consolidation becomes a real challenge. An additional challenge of Linked Data lies in the creation of a well-interlinked graph of Web data. Identifying and linking not only identical Web resources, but also lateral Web resources, provides the data consumer with richer representation of the data and the possibility of exploiting connected resources. In this thesis, we present three approaches that tackle data integration, consolidation and linkage problems. Our first approach combines mutual information and genetic programming techniques for complex datatype property matching, a rarely addressed problem in the literature. In the second and third approaches, we adopt and extend a measure from social network theory to address data consolidation and interlinking. Furthermore, we present a Web-based application named Cite4Me that provides a new perspective on search and retrieval of Linked Open Data sets, as well as the benefits of using our approaches. Finally, we validate our approaches through extensive evaluations using real-world datasets, reporting results that outperform state of the art approaches.MAXWELLMARCO ANTONIO CASANOVAMARCO ANTONIO CASANOVAMARCO ANTONIO CASANOVABERNARDO PEREIRA NUNES2016-01-07info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/otherhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=25608@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=25608@2http://doi.org/10.17771/PUCRio.acad.25608engreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2018-08-30T00:00:00Zoai:MAXWELL.puc-rio.br:25608Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342018-08-30T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.none.fl_str_mv [pt] INTERLIGANDO RECURSOS NA WEB ATRAVÉS DE ABORDAGENS DE MATCHING E INTERLINKING
[en] TOWARDS A WELL-INTERLINKED WEB THROUGH MATCHING AND INTERLINKING APPROACHES
title [pt] INTERLIGANDO RECURSOS NA WEB ATRAVÉS DE ABORDAGENS DE MATCHING E INTERLINKING
spellingShingle [pt] INTERLIGANDO RECURSOS NA WEB ATRAVÉS DE ABORDAGENS DE MATCHING E INTERLINKING
BERNARDO PEREIRA NUNES
[pt] WEB SEMANTICA
[pt] FIREME
[pt] CITE4ME
[pt] DOCUMENT LINKING
[pt] ENTITY LINKING
[pt] CONSOLIDACAO DE DADOS
[pt] LINKED DATA
[pt] ALINHAMENTO DE ESQUEMAS
[pt] SISTEMAS DE RECOMENDACAO
[pt] ALINHAMENTO DE ONTOLOGIAS
[pt] PRIVACIDADE
[pt] INTEGRACAO DE DADOS
[en] SEMANTIC WEB
[en] FIREME
[en] CITE4ME
[en] DOCUMENT LINKING
[en] ENTITY LINKING
[en] DATA CONSOLIDATION
[en] LINKED DATA
[en] RECOMMENDER SYSTEMS
[en] ONTOLOGY ALIGNMENT
[en] PRIVACY
[en] DATA INTEGRATION
title_short [pt] INTERLIGANDO RECURSOS NA WEB ATRAVÉS DE ABORDAGENS DE MATCHING E INTERLINKING
title_full [pt] INTERLIGANDO RECURSOS NA WEB ATRAVÉS DE ABORDAGENS DE MATCHING E INTERLINKING
title_fullStr [pt] INTERLIGANDO RECURSOS NA WEB ATRAVÉS DE ABORDAGENS DE MATCHING E INTERLINKING
title_full_unstemmed [pt] INTERLIGANDO RECURSOS NA WEB ATRAVÉS DE ABORDAGENS DE MATCHING E INTERLINKING
title_sort [pt] INTERLIGANDO RECURSOS NA WEB ATRAVÉS DE ABORDAGENS DE MATCHING E INTERLINKING
author BERNARDO PEREIRA NUNES
author_facet BERNARDO PEREIRA NUNES
author_role author
dc.contributor.none.fl_str_mv MARCO ANTONIO CASANOVA
MARCO ANTONIO CASANOVA
MARCO ANTONIO CASANOVA
dc.contributor.author.fl_str_mv BERNARDO PEREIRA NUNES
dc.subject.por.fl_str_mv [pt] WEB SEMANTICA
[pt] FIREME
[pt] CITE4ME
[pt] DOCUMENT LINKING
[pt] ENTITY LINKING
[pt] CONSOLIDACAO DE DADOS
[pt] LINKED DATA
[pt] ALINHAMENTO DE ESQUEMAS
[pt] SISTEMAS DE RECOMENDACAO
[pt] ALINHAMENTO DE ONTOLOGIAS
[pt] PRIVACIDADE
[pt] INTEGRACAO DE DADOS
[en] SEMANTIC WEB
[en] FIREME
[en] CITE4ME
[en] DOCUMENT LINKING
[en] ENTITY LINKING
[en] DATA CONSOLIDATION
[en] LINKED DATA
[en] RECOMMENDER SYSTEMS
[en] ONTOLOGY ALIGNMENT
[en] PRIVACY
[en] DATA INTEGRATION
topic [pt] WEB SEMANTICA
[pt] FIREME
[pt] CITE4ME
[pt] DOCUMENT LINKING
[pt] ENTITY LINKING
[pt] CONSOLIDACAO DE DADOS
[pt] LINKED DATA
[pt] ALINHAMENTO DE ESQUEMAS
[pt] SISTEMAS DE RECOMENDACAO
[pt] ALINHAMENTO DE ONTOLOGIAS
[pt] PRIVACIDADE
[pt] INTEGRACAO DE DADOS
[en] SEMANTIC WEB
[en] FIREME
[en] CITE4ME
[en] DOCUMENT LINKING
[en] ENTITY LINKING
[en] DATA CONSOLIDATION
[en] LINKED DATA
[en] RECOMMENDER SYSTEMS
[en] ONTOLOGY ALIGNMENT
[en] PRIVACY
[en] DATA INTEGRATION
description [pt] Com o surgimento da Linked (Open) Data, uma série de novos e importantes desafios de pesquisa vieram à tona. A abertura de dados, como muitas vezes a Linked Data é conhecida, oferece uma oportunidade para integrar e conectar, de forma homogênea, fontes de dados heterogêneas na Web. Como diferentes fontes de dados, com recursos em comum ou relacionados, são publicados por diferentes editores, a sua integração e consolidação torna-se um verdadeiro desafio. Outro desafio advindo da Linked Data está na criação de um grafo denso de dados na Web. Com isso, a identificação e interligação, não só de recursos idênticos, mas também dos recursos relacionadas na Web, provê ao consumidor (data consumer) uma representação mais rica dos dados e a possibilidade de exploração dos recursos conectados. Nesta tese, apresentamos três abordagens para enfrentar os problemas de integração, consolidação e interligação de dados. Nossa primeira abordagem combina técnicas de informação mútua e programação genética para solucionar o problema de alinhamento complexo entre fontes de dados, um problema raramente abordado na literatura. Na segunda e terceira abordagens, adotamos e ampliamos uma métrica utilizada em teoria de redes sociais para enfrentar o problema de consolidação e interligação de dados. Além disso, apresentamos um aplicativo Web chamado Cite4Me que fornece uma nova perspectiva sobre a pesquisa e recuperação de conjuntos de Linked Open Data, bem como os benefícios da utilização de nossas abordagens. Por fim, uma série de experimentos utilizando conjuntos de dados reais demonstram que as nossas abordagens superam abordagens consideradas como estado da arte.
publishDate 2016
dc.date.none.fl_str_mv 2016-01-07
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/other
format other
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=25608@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=25608@2
http://doi.org/10.17771/PUCRio.acad.25608
url https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=25608@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=25608@2
http://doi.org/10.17771/PUCRio.acad.25608
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv MAXWELL
publisher.none.fl_str_mv MAXWELL
dc.source.none.fl_str_mv reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)
instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron:PUC_RIO
instname_str Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str PUC_RIO
institution PUC_RIO
reponame_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_ 1814822593003257856