Proposta de uma função de similaridade para listas HTML extraídas da Web

Detalhes bibliográficos
Autor(a) principal: Venancio, Filipe Guedes
Data de Publicação: 2017
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/xmlui/handle/123456789/177697
Resumo: TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação.
id UFSC_e7cc37ff385a498231414649b37ddda1
oai_identifier_str oai:repositorio.ufsc.br:123456789/177697
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Proposta de uma função de similaridade para listas HTML extraídas da WebDadosWebSimilaridadeListaWeblistComparaçãoHTMLTCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação.A Web tornou-se uma fonte rica em dados, diversificada pela popularização dos sites, redes de relacionamento e aplicativos, sendo utilizada para a extra- ção seletiva de conteúdo útil para consumo humano. Entretanto, a extração e análise dos dados contidos na Web são um desafio devido ao crescimento das massas de dados e a variabilidade da representação destas informações. Entre estas informações estão as listas HTML, que tendem a ser apenas um agrupamento onde os itens de dados presentes nela possuem um contexto comum, como por exemplo, uma lista de informações sobre cidades ou uma lista de músicas. Alguns trabalhos relacionados buscam a comparação das listas HTML que possuam características semelhantes e que seguem um determinado padrão, pois assumem que as listas são provenientes de respostas produzidas por aplicativos e sistemas. Diferente desses trabalhos, este trabalho de conclusão de curso considera listas HTML extraídas da Web com contextos desconhecidos, que necessitam de uma análise e padronização de sua estrutura, de forma a considerar uma possível variabilidade estrutural, visando determinar se elas dizem respeito a um mesmo assunto. O objetivo principal deste trabalho é propor uma técnica de comparação entre listas HTML que resulte em um escore de similaridade que possa ser utilizado para diversas finalidades, como integração de dados e buscas aproximadas de dados com foco em listas na Web.Florianópolis, SC.Mello, Ronaldo dos SantosUniversidade Federal de Santa CatarinaVenancio, Filipe Guedes2017-07-23T13:58:12Z2017-07-23T13:58:12Z2017-06-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis103 f.application/pdfhttps://repositorio.ufsc.br/xmlui/handle/123456789/177697porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2017-07-23T13:58:12Zoai:repositorio.ufsc.br:123456789/177697Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732017-07-23T13:58:12Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Proposta de uma função de similaridade para listas HTML extraídas da Web
title Proposta de uma função de similaridade para listas HTML extraídas da Web
spellingShingle Proposta de uma função de similaridade para listas HTML extraídas da Web
Venancio, Filipe Guedes
Dados
Web
Similaridade
Lista
Weblist
Comparação
HTML
title_short Proposta de uma função de similaridade para listas HTML extraídas da Web
title_full Proposta de uma função de similaridade para listas HTML extraídas da Web
title_fullStr Proposta de uma função de similaridade para listas HTML extraídas da Web
title_full_unstemmed Proposta de uma função de similaridade para listas HTML extraídas da Web
title_sort Proposta de uma função de similaridade para listas HTML extraídas da Web
author Venancio, Filipe Guedes
author_facet Venancio, Filipe Guedes
author_role author
dc.contributor.none.fl_str_mv Mello, Ronaldo dos Santos
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Venancio, Filipe Guedes
dc.subject.por.fl_str_mv Dados
Web
Similaridade
Lista
Weblist
Comparação
HTML
topic Dados
Web
Similaridade
Lista
Weblist
Comparação
HTML
description TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação.
publishDate 2017
dc.date.none.fl_str_mv 2017-07-23T13:58:12Z
2017-07-23T13:58:12Z
2017-06-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/xmlui/handle/123456789/177697
url https://repositorio.ufsc.br/xmlui/handle/123456789/177697
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 103 f.
application/pdf
dc.publisher.none.fl_str_mv Florianópolis, SC.
publisher.none.fl_str_mv Florianópolis, SC.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808652078193573888