Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV

Detalhes bibliográficos
Autor(a) principal: Moreira, Natalia Viveiros
Data de Publicação: 2023
Outros Autores: Góes, Rafael Augusto Atanazio
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: http://app.uff.br/riuff/handle/1/30993
Resumo: A internet é hoje o principal meio de comunicação, onde um incontável número de mensagens, comentários e opiniões são postados e compartilhados diariamente. Cada fórum, plataforma de mídia ou rede social é um uma fonte riquíssima de dados e informações sobre como as pessoas pensam, agem e se comunicam. No entanto, vasculhar tal oceano de informação demanda ferramentas apropriadas, muitas vezes específicas a um determinado domínio na internet. O presente trabalho se propôs a desenvolver uma aplicação de busca e extração de dados em página da internet (web scraping), especificamente para uso na plataforma Reddit, um dos 20 sites mais utilizados no mundo. No escopo deste projeto foi realizado um levantamento de postagens e comentários referentes a medicamentos empregados no tratamento ao HIV, com o uso de palavras chaves de busca selecionados por especialistas da área de Farmácia. Foram coletados os dados de 2389 submissões e 24270 comentários, postadas no subreddit “hivaids” entre 2011 e 2021, para posterior tratamento e análise por especialistas da referida área acadêmica
id UFF-2_e3c0f61c783749c1e3f0699cac913bdf
oai_identifier_str oai:app.uff.br:1/30993
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIVWeb scrapingRedditHIVRede socialAPIExtração de dadosMineração de dados (Computação)InternetHIVA internet é hoje o principal meio de comunicação, onde um incontável número de mensagens, comentários e opiniões são postados e compartilhados diariamente. Cada fórum, plataforma de mídia ou rede social é um uma fonte riquíssima de dados e informações sobre como as pessoas pensam, agem e se comunicam. No entanto, vasculhar tal oceano de informação demanda ferramentas apropriadas, muitas vezes específicas a um determinado domínio na internet. O presente trabalho se propôs a desenvolver uma aplicação de busca e extração de dados em página da internet (web scraping), especificamente para uso na plataforma Reddit, um dos 20 sites mais utilizados no mundo. No escopo deste projeto foi realizado um levantamento de postagens e comentários referentes a medicamentos empregados no tratamento ao HIV, com o uso de palavras chaves de busca selecionados por especialistas da área de Farmácia. Foram coletados os dados de 2389 submissões e 24270 comentários, postadas no subreddit “hivaids” entre 2011 e 2021, para posterior tratamento e análise por especialistas da referida área acadêmica70 p.Mantuan, Altobelli de Britohttp://lattes.cnpq.br/5002413550846760Vasconcelos, Leonardo Piohttp://lattes.cnpq.br/3221876377732613Moreira, Natalia ViveirosGóes, Rafael Augusto Atanazio2023-10-27T14:21:12Z2023-10-27T14:21:12Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfMOREIRA, Natalia Viveiros; GÓES, Rafael Augusto Atanazio. Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV. 2021. 70 f. Trabalho de Conclusão de Curso (Graduação em Tecnologia em Sistemas de Computação) - Instituto de Computação, Universidade Federal Fluminense, Niterói, 2021.http://app.uff.br/riuff/handle/1/30993CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-10-27T14:21:17Zoai:app.uff.br:1/30993Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202023-10-27T14:21:17Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV
title Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV
spellingShingle Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV
Moreira, Natalia Viveiros
Web scraping
Reddit
HIV
Rede social
API
Extração de dados
Mineração de dados (Computação)
Internet
HIV
title_short Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV
title_full Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV
title_fullStr Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV
title_full_unstemmed Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV
title_sort Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV
author Moreira, Natalia Viveiros
author_facet Moreira, Natalia Viveiros
Góes, Rafael Augusto Atanazio
author_role author
author2 Góes, Rafael Augusto Atanazio
author2_role author
dc.contributor.none.fl_str_mv Mantuan, Altobelli de Brito
http://lattes.cnpq.br/5002413550846760
Vasconcelos, Leonardo Pio
http://lattes.cnpq.br/3221876377732613
dc.contributor.author.fl_str_mv Moreira, Natalia Viveiros
Góes, Rafael Augusto Atanazio
dc.subject.por.fl_str_mv Web scraping
Reddit
HIV
Rede social
API
Extração de dados
Mineração de dados (Computação)
Internet
HIV
topic Web scraping
Reddit
HIV
Rede social
API
Extração de dados
Mineração de dados (Computação)
Internet
HIV
description A internet é hoje o principal meio de comunicação, onde um incontável número de mensagens, comentários e opiniões são postados e compartilhados diariamente. Cada fórum, plataforma de mídia ou rede social é um uma fonte riquíssima de dados e informações sobre como as pessoas pensam, agem e se comunicam. No entanto, vasculhar tal oceano de informação demanda ferramentas apropriadas, muitas vezes específicas a um determinado domínio na internet. O presente trabalho se propôs a desenvolver uma aplicação de busca e extração de dados em página da internet (web scraping), especificamente para uso na plataforma Reddit, um dos 20 sites mais utilizados no mundo. No escopo deste projeto foi realizado um levantamento de postagens e comentários referentes a medicamentos empregados no tratamento ao HIV, com o uso de palavras chaves de busca selecionados por especialistas da área de Farmácia. Foram coletados os dados de 2389 submissões e 24270 comentários, postadas no subreddit “hivaids” entre 2011 e 2021, para posterior tratamento e análise por especialistas da referida área acadêmica
publishDate 2023
dc.date.none.fl_str_mv 2023-10-27T14:21:12Z
2023-10-27T14:21:12Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv MOREIRA, Natalia Viveiros; GÓES, Rafael Augusto Atanazio. Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV. 2021. 70 f. Trabalho de Conclusão de Curso (Graduação em Tecnologia em Sistemas de Computação) - Instituto de Computação, Universidade Federal Fluminense, Niterói, 2021.
http://app.uff.br/riuff/handle/1/30993
identifier_str_mv MOREIRA, Natalia Viveiros; GÓES, Rafael Augusto Atanazio. Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV. 2021. 70 f. Trabalho de Conclusão de Curso (Graduação em Tecnologia em Sistemas de Computação) - Instituto de Computação, Universidade Federal Fluminense, Niterói, 2021.
url http://app.uff.br/riuff/handle/1/30993
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1802135452413591552