Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Outros Autores: | |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | http://app.uff.br/riuff/handle/1/30993 |
Resumo: | A internet é hoje o principal meio de comunicação, onde um incontável número de mensagens, comentários e opiniões são postados e compartilhados diariamente. Cada fórum, plataforma de mídia ou rede social é um uma fonte riquíssima de dados e informações sobre como as pessoas pensam, agem e se comunicam. No entanto, vasculhar tal oceano de informação demanda ferramentas apropriadas, muitas vezes específicas a um determinado domínio na internet. O presente trabalho se propôs a desenvolver uma aplicação de busca e extração de dados em página da internet (web scraping), especificamente para uso na plataforma Reddit, um dos 20 sites mais utilizados no mundo. No escopo deste projeto foi realizado um levantamento de postagens e comentários referentes a medicamentos empregados no tratamento ao HIV, com o uso de palavras chaves de busca selecionados por especialistas da área de Farmácia. Foram coletados os dados de 2389 submissões e 24270 comentários, postadas no subreddit “hivaids” entre 2011 e 2021, para posterior tratamento e análise por especialistas da referida área acadêmica |
id |
UFF-2_e3c0f61c783749c1e3f0699cac913bdf |
---|---|
oai_identifier_str |
oai:app.uff.br:1/30993 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIVWeb scrapingRedditHIVRede socialAPIExtração de dadosMineração de dados (Computação)InternetHIVA internet é hoje o principal meio de comunicação, onde um incontável número de mensagens, comentários e opiniões são postados e compartilhados diariamente. Cada fórum, plataforma de mídia ou rede social é um uma fonte riquíssima de dados e informações sobre como as pessoas pensam, agem e se comunicam. No entanto, vasculhar tal oceano de informação demanda ferramentas apropriadas, muitas vezes específicas a um determinado domínio na internet. O presente trabalho se propôs a desenvolver uma aplicação de busca e extração de dados em página da internet (web scraping), especificamente para uso na plataforma Reddit, um dos 20 sites mais utilizados no mundo. No escopo deste projeto foi realizado um levantamento de postagens e comentários referentes a medicamentos empregados no tratamento ao HIV, com o uso de palavras chaves de busca selecionados por especialistas da área de Farmácia. Foram coletados os dados de 2389 submissões e 24270 comentários, postadas no subreddit “hivaids” entre 2011 e 2021, para posterior tratamento e análise por especialistas da referida área acadêmica70 p.Mantuan, Altobelli de Britohttp://lattes.cnpq.br/5002413550846760Vasconcelos, Leonardo Piohttp://lattes.cnpq.br/3221876377732613Moreira, Natalia ViveirosGóes, Rafael Augusto Atanazio2023-10-27T14:21:12Z2023-10-27T14:21:12Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfMOREIRA, Natalia Viveiros; GÓES, Rafael Augusto Atanazio. Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV. 2021. 70 f. Trabalho de Conclusão de Curso (Graduação em Tecnologia em Sistemas de Computação) - Instituto de Computação, Universidade Federal Fluminense, Niterói, 2021.http://app.uff.br/riuff/handle/1/30993CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-10-27T14:21:17Zoai:app.uff.br:1/30993Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202023-10-27T14:21:17Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV |
title |
Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV |
spellingShingle |
Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV Moreira, Natalia Viveiros Web scraping HIV Rede social API Extração de dados Mineração de dados (Computação) Internet HIV |
title_short |
Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV |
title_full |
Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV |
title_fullStr |
Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV |
title_full_unstemmed |
Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV |
title_sort |
Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV |
author |
Moreira, Natalia Viveiros |
author_facet |
Moreira, Natalia Viveiros Góes, Rafael Augusto Atanazio |
author_role |
author |
author2 |
Góes, Rafael Augusto Atanazio |
author2_role |
author |
dc.contributor.none.fl_str_mv |
Mantuan, Altobelli de Brito http://lattes.cnpq.br/5002413550846760 Vasconcelos, Leonardo Pio http://lattes.cnpq.br/3221876377732613 |
dc.contributor.author.fl_str_mv |
Moreira, Natalia Viveiros Góes, Rafael Augusto Atanazio |
dc.subject.por.fl_str_mv |
Web scraping HIV Rede social API Extração de dados Mineração de dados (Computação) Internet HIV |
topic |
Web scraping HIV Rede social API Extração de dados Mineração de dados (Computação) Internet HIV |
description |
A internet é hoje o principal meio de comunicação, onde um incontável número de mensagens, comentários e opiniões são postados e compartilhados diariamente. Cada fórum, plataforma de mídia ou rede social é um uma fonte riquíssima de dados e informações sobre como as pessoas pensam, agem e se comunicam. No entanto, vasculhar tal oceano de informação demanda ferramentas apropriadas, muitas vezes específicas a um determinado domínio na internet. O presente trabalho se propôs a desenvolver uma aplicação de busca e extração de dados em página da internet (web scraping), especificamente para uso na plataforma Reddit, um dos 20 sites mais utilizados no mundo. No escopo deste projeto foi realizado um levantamento de postagens e comentários referentes a medicamentos empregados no tratamento ao HIV, com o uso de palavras chaves de busca selecionados por especialistas da área de Farmácia. Foram coletados os dados de 2389 submissões e 24270 comentários, postadas no subreddit “hivaids” entre 2011 e 2021, para posterior tratamento e análise por especialistas da referida área acadêmica |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-10-27T14:21:12Z 2023-10-27T14:21:12Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
MOREIRA, Natalia Viveiros; GÓES, Rafael Augusto Atanazio. Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV. 2021. 70 f. Trabalho de Conclusão de Curso (Graduação em Tecnologia em Sistemas de Computação) - Instituto de Computação, Universidade Federal Fluminense, Niterói, 2021. http://app.uff.br/riuff/handle/1/30993 |
identifier_str_mv |
MOREIRA, Natalia Viveiros; GÓES, Rafael Augusto Atanazio. Web scraping: extração de submissões e comentários do reddit com opiniões de medicamentos para HIV. 2021. 70 f. Trabalho de Conclusão de Curso (Graduação em Tecnologia em Sistemas de Computação) - Instituto de Computação, Universidade Federal Fluminense, Niterói, 2021. |
url |
http://app.uff.br/riuff/handle/1/30993 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1802135452413591552 |