Definição e avaliação de métodos para determinação de similaridade entre tabelas na web
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/xmlui/handle/123456789/160567 |
Resumo: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015 |
id |
UFSC_959c3eb5017c13bfe0cfeebb78cd42b5 |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/160567 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
Definição e avaliação de métodos para determinação de similaridade entre tabelas na webComputaçãoServiços da WebTabelasLógicaDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015A Web e uma grande fonte de dados. Grandes quantidades de dados são inseridos diariamente e muitos desses dados estão na forma de tabelas HTML. Alguns trabalhos têm proposto formas de extrair e integrar o conteúdo dessas tabelas para torna-los mais acessíveis para o consumo humano. Porem, essa e uma tarefa complexa e um problema ainda em aberto visto que tabelas Web n~ao possuem um padrão de representação. Alem disso, o uso de sinônimos e abreviações torna difícil a comparação dos conteúdos dessas tabelas. Assim sendo, este trabalho propõe uma nova abordagem para determinar a similaridade entre tabelas Web capaz de lidar com suas diferentes estruturas e termos sinônimos. Trabalhos relacionados não lidam, ao mesmo tempo,com essas duas problemáticas. Experimentos realizados mostram que a abordagem e promissora.<br>Abstract : The Web is a huge information source. Large amounts of data are publisheddaily and great part of them is available as HTML tables. Someworks have proposed approaches to extract and integrate Web tables'content in order to make it more accessible for human consumption.However, this is a complex task and still an open issue given that Webtables do not have a unique representation pattern. Besides, the useof synonyms and abbreviations become hard the comparison of tables'content. Given that, we propose a new approach to determine similaritybetween Web tables which is able to deal with distinct structuresand synonym terms. Related works do not deal, at the same time,with both problematics. Experimental evaluations had shown that theapproach is promising.Mello, Ronaldo dos SantosUniversidade Federal de Santa CatarinaSilva, Filipe Roberto2016-04-15T13:16:45Z2016-04-15T13:16:45Z2015info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis86 p.| il., tabs., grafs.application/pdf337788https://repositorio.ufsc.br/xmlui/handle/123456789/160567porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2016-04-15T13:16:45Zoai:repositorio.ufsc.br:123456789/160567Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732016-04-15T13:16:45Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Definição e avaliação de métodos para determinação de similaridade entre tabelas na web |
title |
Definição e avaliação de métodos para determinação de similaridade entre tabelas na web |
spellingShingle |
Definição e avaliação de métodos para determinação de similaridade entre tabelas na web Silva, Filipe Roberto Computação Serviços da Web Tabelas Lógica |
title_short |
Definição e avaliação de métodos para determinação de similaridade entre tabelas na web |
title_full |
Definição e avaliação de métodos para determinação de similaridade entre tabelas na web |
title_fullStr |
Definição e avaliação de métodos para determinação de similaridade entre tabelas na web |
title_full_unstemmed |
Definição e avaliação de métodos para determinação de similaridade entre tabelas na web |
title_sort |
Definição e avaliação de métodos para determinação de similaridade entre tabelas na web |
author |
Silva, Filipe Roberto |
author_facet |
Silva, Filipe Roberto |
author_role |
author |
dc.contributor.none.fl_str_mv |
Mello, Ronaldo dos Santos Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Silva, Filipe Roberto |
dc.subject.por.fl_str_mv |
Computação Serviços da Web Tabelas Lógica |
topic |
Computação Serviços da Web Tabelas Lógica |
description |
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015 |
publishDate |
2015 |
dc.date.none.fl_str_mv |
2015 2016-04-15T13:16:45Z 2016-04-15T13:16:45Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
337788 https://repositorio.ufsc.br/xmlui/handle/123456789/160567 |
identifier_str_mv |
337788 |
url |
https://repositorio.ufsc.br/xmlui/handle/123456789/160567 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
86 p.| il., tabs., grafs. application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808652416214630400 |