ScraperCI: um protótipo de Web scraper para coleta de dados

Detalhes bibliográficos
Autor(a) principal: Graciano, Helton Luiz dos Santos
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/17166
Resumo: The technological development experienced in the last decades, the popularization of the internet and the massive production of information resources of the most varied types, has provided significant changes that culminated in the transformation of the Web environment. The objective of this research is to contribute to the expansion of the perception of the advantages of using data collection tools in the information retrieval process, using Web scrapers. The research is characterized as applied, exploratory and descriptive, with a qualitative approach that aims to identify the potential of using Web scrapers in the information retrieval process. As a result, a Web scraper prototype and a practical demonstration of its use were prepared in the Python programming language. It is concluded that the use of the Web scraper can favor the retrieval of information, expanding the possibilities and bringing greater productivity regarding the extraction of informational resources on the Web. This research will contribute to a greater understanding of the potential of using Web scrapers for data collection and will serve as a stimulus for information professionals to develop new skills and innovative possibilities for professional activity.
id SCAR_d9e57265a26406567e523b2fd1153ed4
oai_identifier_str oai:repositorio.ufscar.br:ufscar/17166
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Graciano, Helton Luiz dos SantosRamalho, Rogério Aparecido Sáhttp://lattes.cnpq.br/5602653417743793http://lattes.cnpq.br/6704031539568694e8fd3c46-312e-46e2-a21d-2b285404749d2023-01-03T12:22:12Z2023-01-03T12:22:12Z2022-05-12GRACIANO, Helton Luiz dos Santos. ScraperCI: um protótipo de Web scraper para coleta de dados. 2022. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/17166.https://repositorio.ufscar.br/handle/ufscar/17166The technological development experienced in the last decades, the popularization of the internet and the massive production of information resources of the most varied types, has provided significant changes that culminated in the transformation of the Web environment. The objective of this research is to contribute to the expansion of the perception of the advantages of using data collection tools in the information retrieval process, using Web scrapers. The research is characterized as applied, exploratory and descriptive, with a qualitative approach that aims to identify the potential of using Web scrapers in the information retrieval process. As a result, a Web scraper prototype and a practical demonstration of its use were prepared in the Python programming language. It is concluded that the use of the Web scraper can favor the retrieval of information, expanding the possibilities and bringing greater productivity regarding the extraction of informational resources on the Web. This research will contribute to a greater understanding of the potential of using Web scrapers for data collection and will serve as a stimulus for information professionals to develop new skills and innovative possibilities for professional activity.O desenvolvimento tecnológico vivenciado nas últimas décadas, a popularização da internet e a produção massiva de recursos informacionais dos mais variados tipos, tem proporcionado mudanças significativas que culminaram na transformação do ambiente Web. O objetivo dessa pesquisa é contribuir para a ampliação da percepção das vantagens do uso de ferramentas de coleta de dados no processo de recuperação da informação, a partir do uso de Web scrapers. A pesquisa caracteriza-se como aplicada, de natureza exploratória e descritiva, com abordagem qualitativa que visa identificar as potencialidades da utilização de Web scrapers no processo de coleta de dados. Como resultado, foi elaborado na linguagem de programação Python, um protótipo de Web scraper e uma demonstração prática de sua utilização. Conclui-se que o uso do Web scraper pode favorecer a recuperação de informações, ampliando as possibilidades e trazendo maior produtividade no que tange a extração de recursos informacionais na Web. A presente pesquisa contribuirá para uma maior compreensão das potencialidades do uso de Web scrapers para a coleta de dados e servirá de estímulo aos profissionais da informação a desenvolver novas competências e possibilidades inovadoras de atuação profissional.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Informação - PPGCIUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessRecuperação da informaçãoColeta de dadosMecanismos de buscaInformation retrievalData collectionWeb ScrapingSearch enginesCIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIAScraperCI: um protótipo de Web scraper para coleta de dadosScraperCI: a Web scraper prototype for data collectioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis600600aee2fec0-32da-472a-9d3f-67d53b635c32reponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALdissertação_helton_luiz_dos_santos_graciano.pdfdissertação_helton_luiz_dos_santos_graciano.pdfapplication/pdf3106182https://repositorio.ufscar.br/bitstream/ufscar/17166/1/disserta%c3%a7%c3%a3o_helton_luiz_dos_santos_graciano.pdfee8c8b9bc0ef6ac2a30c11ef67df93f1MD51Carta Comprovante de Validação da Versão Final.pdfCarta Comprovante de Validação da Versão Final.pdfapplication/pdf58728https://repositorio.ufscar.br/bitstream/ufscar/17166/2/Carta%20Comprovante%20de%20Valida%c3%a7%c3%a3o%20da%20Vers%c3%a3o%20Final.pdf6930fd60b83d4d983790f973fd9c76a7MD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstream/ufscar/17166/3/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD53TEXTdissertação_helton_luiz_dos_santos_graciano.pdf.txtdissertação_helton_luiz_dos_santos_graciano.pdf.txtExtracted texttext/plain126495https://repositorio.ufscar.br/bitstream/ufscar/17166/4/disserta%c3%a7%c3%a3o_helton_luiz_dos_santos_graciano.pdf.txt48dc9bb8e896ed8fd22341f288415b2fMD54Carta Comprovante de Validação da Versão Final.pdf.txtCarta Comprovante de Validação da Versão Final.pdf.txtExtracted texttext/plain1301https://repositorio.ufscar.br/bitstream/ufscar/17166/6/Carta%20Comprovante%20de%20Valida%c3%a7%c3%a3o%20da%20Vers%c3%a3o%20Final.pdf.txt823b0e83f452d276cbe8d2f6e92d6d71MD56THUMBNAILdissertação_helton_luiz_dos_santos_graciano.pdf.jpgdissertação_helton_luiz_dos_santos_graciano.pdf.jpgIM Thumbnailimage/jpeg4994https://repositorio.ufscar.br/bitstream/ufscar/17166/5/disserta%c3%a7%c3%a3o_helton_luiz_dos_santos_graciano.pdf.jpgf2d7a0523e6b8c907ccd62ef7c0e2077MD55Carta Comprovante de Validação da Versão Final.pdf.jpgCarta Comprovante de Validação da Versão Final.pdf.jpgIM Thumbnailimage/jpeg6617https://repositorio.ufscar.br/bitstream/ufscar/17166/7/Carta%20Comprovante%20de%20Valida%c3%a7%c3%a3o%20da%20Vers%c3%a3o%20Final.pdf.jpg91172670d1b719f9aa63a820a39c7c56MD57ufscar/171662023-09-18 18:32:33.83oai:repositorio.ufscar.br:ufscar/17166Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:32:33Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv ScraperCI: um protótipo de Web scraper para coleta de dados
dc.title.alternative.eng.fl_str_mv ScraperCI: a Web scraper prototype for data collection
title ScraperCI: um protótipo de Web scraper para coleta de dados
spellingShingle ScraperCI: um protótipo de Web scraper para coleta de dados
Graciano, Helton Luiz dos Santos
Recuperação da informação
Coleta de dados
Mecanismos de busca
Information retrieval
Data collection
Web Scraping
Search engines
CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIA
title_short ScraperCI: um protótipo de Web scraper para coleta de dados
title_full ScraperCI: um protótipo de Web scraper para coleta de dados
title_fullStr ScraperCI: um protótipo de Web scraper para coleta de dados
title_full_unstemmed ScraperCI: um protótipo de Web scraper para coleta de dados
title_sort ScraperCI: um protótipo de Web scraper para coleta de dados
author Graciano, Helton Luiz dos Santos
author_facet Graciano, Helton Luiz dos Santos
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/6704031539568694
dc.contributor.author.fl_str_mv Graciano, Helton Luiz dos Santos
dc.contributor.advisor1.fl_str_mv Ramalho, Rogério Aparecido Sá
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/5602653417743793
dc.contributor.authorID.fl_str_mv e8fd3c46-312e-46e2-a21d-2b285404749d
contributor_str_mv Ramalho, Rogério Aparecido Sá
dc.subject.por.fl_str_mv Recuperação da informação
Coleta de dados
Mecanismos de busca
topic Recuperação da informação
Coleta de dados
Mecanismos de busca
Information retrieval
Data collection
Web Scraping
Search engines
CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIA
dc.subject.eng.fl_str_mv Information retrieval
Data collection
Web Scraping
Search engines
dc.subject.cnpq.fl_str_mv CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIA
description The technological development experienced in the last decades, the popularization of the internet and the massive production of information resources of the most varied types, has provided significant changes that culminated in the transformation of the Web environment. The objective of this research is to contribute to the expansion of the perception of the advantages of using data collection tools in the information retrieval process, using Web scrapers. The research is characterized as applied, exploratory and descriptive, with a qualitative approach that aims to identify the potential of using Web scrapers in the information retrieval process. As a result, a Web scraper prototype and a practical demonstration of its use were prepared in the Python programming language. It is concluded that the use of the Web scraper can favor the retrieval of information, expanding the possibilities and bringing greater productivity regarding the extraction of informational resources on the Web. This research will contribute to a greater understanding of the potential of using Web scrapers for data collection and will serve as a stimulus for information professionals to develop new skills and innovative possibilities for professional activity.
publishDate 2022
dc.date.issued.fl_str_mv 2022-05-12
dc.date.accessioned.fl_str_mv 2023-01-03T12:22:12Z
dc.date.available.fl_str_mv 2023-01-03T12:22:12Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv GRACIANO, Helton Luiz dos Santos. ScraperCI: um protótipo de Web scraper para coleta de dados. 2022. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/17166.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/17166
identifier_str_mv GRACIANO, Helton Luiz dos Santos. ScraperCI: um protótipo de Web scraper para coleta de dados. 2022. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/17166.
url https://repositorio.ufscar.br/handle/ufscar/17166
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv aee2fec0-32da-472a-9d3f-67d53b635c32
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Informação - PPGCI
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/17166/1/disserta%c3%a7%c3%a3o_helton_luiz_dos_santos_graciano.pdf
https://repositorio.ufscar.br/bitstream/ufscar/17166/2/Carta%20Comprovante%20de%20Valida%c3%a7%c3%a3o%20da%20Vers%c3%a3o%20Final.pdf
https://repositorio.ufscar.br/bitstream/ufscar/17166/3/license_rdf
https://repositorio.ufscar.br/bitstream/ufscar/17166/4/disserta%c3%a7%c3%a3o_helton_luiz_dos_santos_graciano.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/17166/6/Carta%20Comprovante%20de%20Valida%c3%a7%c3%a3o%20da%20Vers%c3%a3o%20Final.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/17166/5/disserta%c3%a7%c3%a3o_helton_luiz_dos_santos_graciano.pdf.jpg
https://repositorio.ufscar.br/bitstream/ufscar/17166/7/Carta%20Comprovante%20de%20Valida%c3%a7%c3%a3o%20da%20Vers%c3%a3o%20Final.pdf.jpg
bitstream.checksum.fl_str_mv ee8c8b9bc0ef6ac2a30c11ef67df93f1
6930fd60b83d4d983790f973fd9c76a7
e39d27027a6cc9cb039ad269a5db8e34
48dc9bb8e896ed8fd22341f288415b2f
823b0e83f452d276cbe8d2f6e92d6d71
f2d7a0523e6b8c907ccd62ef7c0e2077
91172670d1b719f9aa63a820a39c7c56
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1802136415404818432