W-RAY: AN APPROACH TO THE DEEP WEB DATA PUBLICATION

Detalhes bibliográficos
Autor(a) principal: HELENA SERRAO PICCININI
Data de Publicação: 2013
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da PUC-RIO (Projeto Maxwell)
Texto Completo: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23502@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23502@2
Resumo: Deep Web é composta por dados armazenados em bases de dados, páginas dinâmicas, páginas com scripts e dados multimídia, dentre outros tipos de objetos. Os bancos de dados da Deep Web são geralmente sub-representados pelos motores de busca, devido aos desafios técnicos de localizar, acessar e indexar seus dados. A utilização de hyperlinks pelos motores de busca não é suficente para alcançar todos os dados da Deep Web, exigindo interação com interfaces de consultas complexas. Esta tese apresenta uma abordagem, denominada W-Ray, capaz de fornecer visibilidade aos dados da Deep Web. A abordagem baseia-se na descrição dos dados relevantes através de sentenças bem estruturadas, e na publicação dessas sentenças em páginas estáticas da Web. As sentenças podem ser geradas com RDFa embutido, mantendo a semântica do banco de dados. As páginas da Web assim geradas são passíveis de ser indexadas pelos motores de coleta de dados tradicionais e por motores mais sofisticados que suportam busca semântica. É apresentada também uma ferramenta que apóia a abordagem W-Ray. A abordagem foi implementada com sucesso para diferentes bancos de dados reais.
id PUC_RIO-1_84f2beeee9f350ecbbeda4d0928d5f14
oai_identifier_str oai:MAXWELL.puc-rio.br:23502
network_acronym_str PUC_RIO-1
network_name_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str 534
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisW-RAY: AN APPROACH TO THE DEEP WEB DATA PUBLICATIONW-RAY: UMA ABORDAGEM PARA PUBLICAÇÃO DE DADOS DA DEEP WEB2013-06-21MARCO ANTONIO CASANOVA29997810759lattes.cnpq.br/0400232298849115MARCO ANTONIO CASANOVA29997810759lattes.cnpq.br/0400232298849115MARCO ANTONIO CASANOVAHELIO CORTES VIEIRA LOPESLUIZ ANDRE PORTES PAES LEMELUIZ ANDRE PORTES PAES LEMEANTONIO LUZ FURTADO67685587734HELENA SERRAO PICCININIPONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIROPPG EM INFORMÁTICAPUC-RioBRDeep Web é composta por dados armazenados em bases de dados, páginas dinâmicas, páginas com scripts e dados multimídia, dentre outros tipos de objetos. Os bancos de dados da Deep Web são geralmente sub-representados pelos motores de busca, devido aos desafios técnicos de localizar, acessar e indexar seus dados. A utilização de hyperlinks pelos motores de busca não é suficente para alcançar todos os dados da Deep Web, exigindo interação com interfaces de consultas complexas. Esta tese apresenta uma abordagem, denominada W-Ray, capaz de fornecer visibilidade aos dados da Deep Web. A abordagem baseia-se na descrição dos dados relevantes através de sentenças bem estruturadas, e na publicação dessas sentenças em páginas estáticas da Web. As sentenças podem ser geradas com RDFa embutido, mantendo a semântica do banco de dados. As páginas da Web assim geradas são passíveis de ser indexadas pelos motores de coleta de dados tradicionais e por motores mais sofisticados que suportam busca semântica. É apresentada também uma ferramenta que apóia a abordagem W-Ray. A abordagem foi implementada com sucesso para diferentes bancos de dados reais.The Deep Web comprises data stored in databases, dynamic pages, scripted pages and multimedia data, among other types of objects. The databases of the Deep Web are generally underrepresented by the search engines due to the technical challenges of locating, accessing and indexing them. The use of hyperlinks by search engines is not sufficient to achieve all the Deep Web data, requiring interaction with complex queries interfaces. This thesis presents an approach, called W-Ray, that provides visibility to Deep Web data. The approach relies on describing the relevant data through well-structured sentences, and on publishing the sentences as static Web pages. The sentences can be generated with embedded RDFa, keeping the semantics of the database. The Web pages thus generated are indexed by traditional Web crawlers and sophisticated crawlers that support semantic search. It is also presented a tool that supports the W-Ray approach. The approach has been successfully implemented for some real databases.PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIROhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23502@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23502@2porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2022-11-01T13:22:42Zoai:MAXWELL.puc-rio.br:23502Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342019-08-15T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.en.fl_str_mv W-RAY: AN APPROACH TO THE DEEP WEB DATA PUBLICATION
dc.title.alternative.pt.fl_str_mv W-RAY: UMA ABORDAGEM PARA PUBLICAÇÃO DE DADOS DA DEEP WEB
title W-RAY: AN APPROACH TO THE DEEP WEB DATA PUBLICATION
spellingShingle W-RAY: AN APPROACH TO THE DEEP WEB DATA PUBLICATION
HELENA SERRAO PICCININI
title_short W-RAY: AN APPROACH TO THE DEEP WEB DATA PUBLICATION
title_full W-RAY: AN APPROACH TO THE DEEP WEB DATA PUBLICATION
title_fullStr W-RAY: AN APPROACH TO THE DEEP WEB DATA PUBLICATION
title_full_unstemmed W-RAY: AN APPROACH TO THE DEEP WEB DATA PUBLICATION
title_sort W-RAY: AN APPROACH TO THE DEEP WEB DATA PUBLICATION
dc.creator.Lattes.none.fl_str_mv
author HELENA SERRAO PICCININI
author_facet HELENA SERRAO PICCININI
author_role author
dc.contributor.advisor2ID.none.fl_str_mv 29997810759
dc.contributor.advisor1.fl_str_mv MARCO ANTONIO CASANOVA
dc.contributor.advisor1ID.fl_str_mv 29997810759
dc.contributor.advisor1Lattes.fl_str_mv lattes.cnpq.br/0400232298849115
dc.contributor.advisor2.fl_str_mv MARCO ANTONIO CASANOVA
dc.contributor.advisor2Lattes.fl_str_mv lattes.cnpq.br/0400232298849115
dc.contributor.referee1.fl_str_mv MARCO ANTONIO CASANOVA
dc.contributor.referee2.fl_str_mv HELIO CORTES VIEIRA LOPES
dc.contributor.referee3.fl_str_mv LUIZ ANDRE PORTES PAES LEME
dc.contributor.referee4.fl_str_mv LUIZ ANDRE PORTES PAES LEME
dc.contributor.referee5.fl_str_mv ANTONIO LUZ FURTADO
dc.contributor.authorID.fl_str_mv 67685587734
dc.contributor.author.fl_str_mv HELENA SERRAO PICCININI
contributor_str_mv MARCO ANTONIO CASANOVA
MARCO ANTONIO CASANOVA
MARCO ANTONIO CASANOVA
HELIO CORTES VIEIRA LOPES
LUIZ ANDRE PORTES PAES LEME
LUIZ ANDRE PORTES PAES LEME
ANTONIO LUZ FURTADO
description Deep Web é composta por dados armazenados em bases de dados, páginas dinâmicas, páginas com scripts e dados multimídia, dentre outros tipos de objetos. Os bancos de dados da Deep Web são geralmente sub-representados pelos motores de busca, devido aos desafios técnicos de localizar, acessar e indexar seus dados. A utilização de hyperlinks pelos motores de busca não é suficente para alcançar todos os dados da Deep Web, exigindo interação com interfaces de consultas complexas. Esta tese apresenta uma abordagem, denominada W-Ray, capaz de fornecer visibilidade aos dados da Deep Web. A abordagem baseia-se na descrição dos dados relevantes através de sentenças bem estruturadas, e na publicação dessas sentenças em páginas estáticas da Web. As sentenças podem ser geradas com RDFa embutido, mantendo a semântica do banco de dados. As páginas da Web assim geradas são passíveis de ser indexadas pelos motores de coleta de dados tradicionais e por motores mais sofisticados que suportam busca semântica. É apresentada também uma ferramenta que apóia a abordagem W-Ray. A abordagem foi implementada com sucesso para diferentes bancos de dados reais.
publishDate 2013
dc.date.issued.fl_str_mv 2013-06-21
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23502@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23502@2
url https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23502@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23502@2
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
dc.publisher.program.fl_str_mv PPG EM INFORMÁTICA
dc.publisher.initials.fl_str_mv PUC-Rio
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
dc.source.none.fl_str_mv reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)
instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron:PUC_RIO
instname_str Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str PUC_RIO
institution PUC_RIO
reponame_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_ 1748324918059073536