CrawlEX: uma ferramenta para extração de dados na web configurável através de exemplos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/handle/123456789/237991 |
Resumo: | TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação. |
id |
UFSC_7bd9962f89553ae74af27985c146e59b |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/237991 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
CrawlEX: uma ferramenta para extração de dados na web configurável através de exemplosextração de dadosartigosweb crawlerTCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação.Com o grande avanço da internet ao longo dos anos, é natural que tenhamos uma enorme quantidade de dados disponível na rede. Esses dados, podem nos informar coisas completamente diferentes, como o que foi falado no último discurso do Presidente da República ou, a coordenada geográfica de um local que estamos interessados em visitar. Dependendo do perfil de interesse de um usuário ou até mesmo de uma empresa, é muito importante ter esses dados em mãos para que se possa analisá-los e, eventualmente, tomar algum tipo de ação. Porém, na grande maioria das vezes, é inviável que esses dados sejam coletados manualmente, pois demandam tempo e esforço, logo, faz-se necessário que a coletada seja feita de maneira automática, permitindo ao interessado apenas fazer a análise daquilo que efetivamente já foi coletado. Além disso, para que a configuração de uma coleta de um website seja feita de forma automática, é necessário que o usuário tenha habilidade em programação, sendo assim, um empecilho para muitas pessoas. Nesse contexto, o presente trabalho apresenta uma ferramenta para navegação e extração de artigos disponíveis na internet, onde um web crawler pode ser configurado por um usuário comum, sem conhecimentos em programação, apenas por fornecer exemplos de artigos das páginas as quais tem interesse. É apresentado os experimentos feitos pelo autor e usuários leigos, e depois analisados os seus resultados.Florianópolis, SC.Dorneles, Carina FriedrichUniversidade Federal de Santa CatarinaLessa, Marcos Aurélio2022-08-06T00:17:55Z2022-08-06T00:17:55Z2022-07-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis127 f.application/pdfhttps://repositorio.ufsc.br/handle/123456789/237991info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSC2022-08-06T00:17:55Zoai:repositorio.ufsc.br:123456789/237991Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732022-08-06T00:17:55Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
CrawlEX: uma ferramenta para extração de dados na web configurável através de exemplos |
title |
CrawlEX: uma ferramenta para extração de dados na web configurável através de exemplos |
spellingShingle |
CrawlEX: uma ferramenta para extração de dados na web configurável através de exemplos Lessa, Marcos Aurélio extração de dados artigos web crawler |
title_short |
CrawlEX: uma ferramenta para extração de dados na web configurável através de exemplos |
title_full |
CrawlEX: uma ferramenta para extração de dados na web configurável através de exemplos |
title_fullStr |
CrawlEX: uma ferramenta para extração de dados na web configurável através de exemplos |
title_full_unstemmed |
CrawlEX: uma ferramenta para extração de dados na web configurável através de exemplos |
title_sort |
CrawlEX: uma ferramenta para extração de dados na web configurável através de exemplos |
author |
Lessa, Marcos Aurélio |
author_facet |
Lessa, Marcos Aurélio |
author_role |
author |
dc.contributor.none.fl_str_mv |
Dorneles, Carina Friedrich Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Lessa, Marcos Aurélio |
dc.subject.por.fl_str_mv |
extração de dados artigos web crawler |
topic |
extração de dados artigos web crawler |
description |
TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-08-06T00:17:55Z 2022-08-06T00:17:55Z 2022-07-29 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufsc.br/handle/123456789/237991 |
url |
https://repositorio.ufsc.br/handle/123456789/237991 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
127 f. application/pdf |
dc.publisher.none.fl_str_mv |
Florianópolis, SC. |
publisher.none.fl_str_mv |
Florianópolis, SC. |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808652113660608512 |