Proposta de uma função de similaridade para listas HTML extraídas da Web
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/xmlui/handle/123456789/177697 |
Resumo: | TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação. |
id |
UFSC_e7cc37ff385a498231414649b37ddda1 |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/177697 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
Proposta de uma função de similaridade para listas HTML extraídas da WebDadosWebSimilaridadeListaWeblistComparaçãoHTMLTCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação.A Web tornou-se uma fonte rica em dados, diversificada pela popularização dos sites, redes de relacionamento e aplicativos, sendo utilizada para a extra- ção seletiva de conteúdo útil para consumo humano. Entretanto, a extração e análise dos dados contidos na Web são um desafio devido ao crescimento das massas de dados e a variabilidade da representação destas informações. Entre estas informações estão as listas HTML, que tendem a ser apenas um agrupamento onde os itens de dados presentes nela possuem um contexto comum, como por exemplo, uma lista de informações sobre cidades ou uma lista de músicas. Alguns trabalhos relacionados buscam a comparação das listas HTML que possuam características semelhantes e que seguem um determinado padrão, pois assumem que as listas são provenientes de respostas produzidas por aplicativos e sistemas. Diferente desses trabalhos, este trabalho de conclusão de curso considera listas HTML extraídas da Web com contextos desconhecidos, que necessitam de uma análise e padronização de sua estrutura, de forma a considerar uma possível variabilidade estrutural, visando determinar se elas dizem respeito a um mesmo assunto. O objetivo principal deste trabalho é propor uma técnica de comparação entre listas HTML que resulte em um escore de similaridade que possa ser utilizado para diversas finalidades, como integração de dados e buscas aproximadas de dados com foco em listas na Web.Florianópolis, SC.Mello, Ronaldo dos SantosUniversidade Federal de Santa CatarinaVenancio, Filipe Guedes2017-07-23T13:58:12Z2017-07-23T13:58:12Z2017-06-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis103 f.application/pdfhttps://repositorio.ufsc.br/xmlui/handle/123456789/177697porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2017-07-23T13:58:12Zoai:repositorio.ufsc.br:123456789/177697Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732017-07-23T13:58:12Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Proposta de uma função de similaridade para listas HTML extraídas da Web |
title |
Proposta de uma função de similaridade para listas HTML extraídas da Web |
spellingShingle |
Proposta de uma função de similaridade para listas HTML extraídas da Web Venancio, Filipe Guedes Dados Web Similaridade Lista Weblist Comparação HTML |
title_short |
Proposta de uma função de similaridade para listas HTML extraídas da Web |
title_full |
Proposta de uma função de similaridade para listas HTML extraídas da Web |
title_fullStr |
Proposta de uma função de similaridade para listas HTML extraídas da Web |
title_full_unstemmed |
Proposta de uma função de similaridade para listas HTML extraídas da Web |
title_sort |
Proposta de uma função de similaridade para listas HTML extraídas da Web |
author |
Venancio, Filipe Guedes |
author_facet |
Venancio, Filipe Guedes |
author_role |
author |
dc.contributor.none.fl_str_mv |
Mello, Ronaldo dos Santos Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Venancio, Filipe Guedes |
dc.subject.por.fl_str_mv |
Dados Web Similaridade Lista Weblist Comparação HTML |
topic |
Dados Web Similaridade Lista Weblist Comparação HTML |
description |
TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-07-23T13:58:12Z 2017-07-23T13:58:12Z 2017-06-20 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufsc.br/xmlui/handle/123456789/177697 |
url |
https://repositorio.ufsc.br/xmlui/handle/123456789/177697 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
103 f. application/pdf |
dc.publisher.none.fl_str_mv |
Florianópolis, SC. |
publisher.none.fl_str_mv |
Florianópolis, SC. |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808652078193573888 |