ScraperCI: um protótipo de Web scraper para coleta de dados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/17166 |
Resumo: | The technological development experienced in the last decades, the popularization of the internet and the massive production of information resources of the most varied types, has provided significant changes that culminated in the transformation of the Web environment. The objective of this research is to contribute to the expansion of the perception of the advantages of using data collection tools in the information retrieval process, using Web scrapers. The research is characterized as applied, exploratory and descriptive, with a qualitative approach that aims to identify the potential of using Web scrapers in the information retrieval process. As a result, a Web scraper prototype and a practical demonstration of its use were prepared in the Python programming language. It is concluded that the use of the Web scraper can favor the retrieval of information, expanding the possibilities and bringing greater productivity regarding the extraction of informational resources on the Web. This research will contribute to a greater understanding of the potential of using Web scrapers for data collection and will serve as a stimulus for information professionals to develop new skills and innovative possibilities for professional activity. |
id |
SCAR_d9e57265a26406567e523b2fd1153ed4 |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/17166 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Graciano, Helton Luiz dos SantosRamalho, Rogério Aparecido Sáhttp://lattes.cnpq.br/5602653417743793http://lattes.cnpq.br/6704031539568694e8fd3c46-312e-46e2-a21d-2b285404749d2023-01-03T12:22:12Z2023-01-03T12:22:12Z2022-05-12GRACIANO, Helton Luiz dos Santos. ScraperCI: um protótipo de Web scraper para coleta de dados. 2022. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/17166.https://repositorio.ufscar.br/handle/ufscar/17166The technological development experienced in the last decades, the popularization of the internet and the massive production of information resources of the most varied types, has provided significant changes that culminated in the transformation of the Web environment. The objective of this research is to contribute to the expansion of the perception of the advantages of using data collection tools in the information retrieval process, using Web scrapers. The research is characterized as applied, exploratory and descriptive, with a qualitative approach that aims to identify the potential of using Web scrapers in the information retrieval process. As a result, a Web scraper prototype and a practical demonstration of its use were prepared in the Python programming language. It is concluded that the use of the Web scraper can favor the retrieval of information, expanding the possibilities and bringing greater productivity regarding the extraction of informational resources on the Web. This research will contribute to a greater understanding of the potential of using Web scrapers for data collection and will serve as a stimulus for information professionals to develop new skills and innovative possibilities for professional activity.O desenvolvimento tecnológico vivenciado nas últimas décadas, a popularização da internet e a produção massiva de recursos informacionais dos mais variados tipos, tem proporcionado mudanças significativas que culminaram na transformação do ambiente Web. O objetivo dessa pesquisa é contribuir para a ampliação da percepção das vantagens do uso de ferramentas de coleta de dados no processo de recuperação da informação, a partir do uso de Web scrapers. A pesquisa caracteriza-se como aplicada, de natureza exploratória e descritiva, com abordagem qualitativa que visa identificar as potencialidades da utilização de Web scrapers no processo de coleta de dados. Como resultado, foi elaborado na linguagem de programação Python, um protótipo de Web scraper e uma demonstração prática de sua utilização. Conclui-se que o uso do Web scraper pode favorecer a recuperação de informações, ampliando as possibilidades e trazendo maior produtividade no que tange a extração de recursos informacionais na Web. A presente pesquisa contribuirá para uma maior compreensão das potencialidades do uso de Web scrapers para a coleta de dados e servirá de estímulo aos profissionais da informação a desenvolver novas competências e possibilidades inovadoras de atuação profissional.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Informação - PPGCIUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessRecuperação da informaçãoColeta de dadosMecanismos de buscaInformation retrievalData collectionWeb ScrapingSearch enginesCIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIAScraperCI: um protótipo de Web scraper para coleta de dadosScraperCI: a Web scraper prototype for data collectioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis600600aee2fec0-32da-472a-9d3f-67d53b635c32reponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALdissertação_helton_luiz_dos_santos_graciano.pdfdissertação_helton_luiz_dos_santos_graciano.pdfapplication/pdf3106182https://repositorio.ufscar.br/bitstream/ufscar/17166/1/disserta%c3%a7%c3%a3o_helton_luiz_dos_santos_graciano.pdfee8c8b9bc0ef6ac2a30c11ef67df93f1MD51Carta Comprovante de Validação da Versão Final.pdfCarta Comprovante de Validação da Versão Final.pdfapplication/pdf58728https://repositorio.ufscar.br/bitstream/ufscar/17166/2/Carta%20Comprovante%20de%20Valida%c3%a7%c3%a3o%20da%20Vers%c3%a3o%20Final.pdf6930fd60b83d4d983790f973fd9c76a7MD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstream/ufscar/17166/3/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD53TEXTdissertação_helton_luiz_dos_santos_graciano.pdf.txtdissertação_helton_luiz_dos_santos_graciano.pdf.txtExtracted texttext/plain126495https://repositorio.ufscar.br/bitstream/ufscar/17166/4/disserta%c3%a7%c3%a3o_helton_luiz_dos_santos_graciano.pdf.txt48dc9bb8e896ed8fd22341f288415b2fMD54Carta Comprovante de Validação da Versão Final.pdf.txtCarta Comprovante de Validação da Versão Final.pdf.txtExtracted texttext/plain1301https://repositorio.ufscar.br/bitstream/ufscar/17166/6/Carta%20Comprovante%20de%20Valida%c3%a7%c3%a3o%20da%20Vers%c3%a3o%20Final.pdf.txt823b0e83f452d276cbe8d2f6e92d6d71MD56THUMBNAILdissertação_helton_luiz_dos_santos_graciano.pdf.jpgdissertação_helton_luiz_dos_santos_graciano.pdf.jpgIM Thumbnailimage/jpeg4994https://repositorio.ufscar.br/bitstream/ufscar/17166/5/disserta%c3%a7%c3%a3o_helton_luiz_dos_santos_graciano.pdf.jpgf2d7a0523e6b8c907ccd62ef7c0e2077MD55Carta Comprovante de Validação da Versão Final.pdf.jpgCarta Comprovante de Validação da Versão Final.pdf.jpgIM Thumbnailimage/jpeg6617https://repositorio.ufscar.br/bitstream/ufscar/17166/7/Carta%20Comprovante%20de%20Valida%c3%a7%c3%a3o%20da%20Vers%c3%a3o%20Final.pdf.jpg91172670d1b719f9aa63a820a39c7c56MD57ufscar/171662023-09-18 18:32:33.83oai:repositorio.ufscar.br:ufscar/17166Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:32:33Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
ScraperCI: um protótipo de Web scraper para coleta de dados |
dc.title.alternative.eng.fl_str_mv |
ScraperCI: a Web scraper prototype for data collection |
title |
ScraperCI: um protótipo de Web scraper para coleta de dados |
spellingShingle |
ScraperCI: um protótipo de Web scraper para coleta de dados Graciano, Helton Luiz dos Santos Recuperação da informação Coleta de dados Mecanismos de busca Information retrieval Data collection Web Scraping Search engines CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIA |
title_short |
ScraperCI: um protótipo de Web scraper para coleta de dados |
title_full |
ScraperCI: um protótipo de Web scraper para coleta de dados |
title_fullStr |
ScraperCI: um protótipo de Web scraper para coleta de dados |
title_full_unstemmed |
ScraperCI: um protótipo de Web scraper para coleta de dados |
title_sort |
ScraperCI: um protótipo de Web scraper para coleta de dados |
author |
Graciano, Helton Luiz dos Santos |
author_facet |
Graciano, Helton Luiz dos Santos |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/6704031539568694 |
dc.contributor.author.fl_str_mv |
Graciano, Helton Luiz dos Santos |
dc.contributor.advisor1.fl_str_mv |
Ramalho, Rogério Aparecido Sá |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/5602653417743793 |
dc.contributor.authorID.fl_str_mv |
e8fd3c46-312e-46e2-a21d-2b285404749d |
contributor_str_mv |
Ramalho, Rogério Aparecido Sá |
dc.subject.por.fl_str_mv |
Recuperação da informação Coleta de dados Mecanismos de busca |
topic |
Recuperação da informação Coleta de dados Mecanismos de busca Information retrieval Data collection Web Scraping Search engines CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIA |
dc.subject.eng.fl_str_mv |
Information retrieval Data collection Web Scraping Search engines |
dc.subject.cnpq.fl_str_mv |
CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIA |
description |
The technological development experienced in the last decades, the popularization of the internet and the massive production of information resources of the most varied types, has provided significant changes that culminated in the transformation of the Web environment. The objective of this research is to contribute to the expansion of the perception of the advantages of using data collection tools in the information retrieval process, using Web scrapers. The research is characterized as applied, exploratory and descriptive, with a qualitative approach that aims to identify the potential of using Web scrapers in the information retrieval process. As a result, a Web scraper prototype and a practical demonstration of its use were prepared in the Python programming language. It is concluded that the use of the Web scraper can favor the retrieval of information, expanding the possibilities and bringing greater productivity regarding the extraction of informational resources on the Web. This research will contribute to a greater understanding of the potential of using Web scrapers for data collection and will serve as a stimulus for information professionals to develop new skills and innovative possibilities for professional activity. |
publishDate |
2022 |
dc.date.issued.fl_str_mv |
2022-05-12 |
dc.date.accessioned.fl_str_mv |
2023-01-03T12:22:12Z |
dc.date.available.fl_str_mv |
2023-01-03T12:22:12Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
GRACIANO, Helton Luiz dos Santos. ScraperCI: um protótipo de Web scraper para coleta de dados. 2022. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/17166. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/17166 |
identifier_str_mv |
GRACIANO, Helton Luiz dos Santos. ScraperCI: um protótipo de Web scraper para coleta de dados. 2022. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/17166. |
url |
https://repositorio.ufscar.br/handle/ufscar/17166 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
600 600 |
dc.relation.authority.fl_str_mv |
aee2fec0-32da-472a-9d3f-67d53b635c32 |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Informação - PPGCI |
dc.publisher.initials.fl_str_mv |
UFSCar |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/17166/1/disserta%c3%a7%c3%a3o_helton_luiz_dos_santos_graciano.pdf https://repositorio.ufscar.br/bitstream/ufscar/17166/2/Carta%20Comprovante%20de%20Valida%c3%a7%c3%a3o%20da%20Vers%c3%a3o%20Final.pdf https://repositorio.ufscar.br/bitstream/ufscar/17166/3/license_rdf https://repositorio.ufscar.br/bitstream/ufscar/17166/4/disserta%c3%a7%c3%a3o_helton_luiz_dos_santos_graciano.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/17166/6/Carta%20Comprovante%20de%20Valida%c3%a7%c3%a3o%20da%20Vers%c3%a3o%20Final.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/17166/5/disserta%c3%a7%c3%a3o_helton_luiz_dos_santos_graciano.pdf.jpg https://repositorio.ufscar.br/bitstream/ufscar/17166/7/Carta%20Comprovante%20de%20Valida%c3%a7%c3%a3o%20da%20Vers%c3%a3o%20Final.pdf.jpg |
bitstream.checksum.fl_str_mv |
ee8c8b9bc0ef6ac2a30c11ef67df93f1 6930fd60b83d4d983790f973fd9c76a7 e39d27027a6cc9cb039ad269a5db8e34 48dc9bb8e896ed8fd22341f288415b2f 823b0e83f452d276cbe8d2f6e92d6d71 f2d7a0523e6b8c907ccd62ef7c0e2077 91172670d1b719f9aa63a820a39c7c56 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1802136415404818432 |