Análise e classificação de rumores em redes sociais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-08062020-094039/ |
Resumo: | O aumento da quantidade de pessoas com acesso à internet nos últimos anos contribuiu para o aumento da quantidade de usuários de redes sociais. Entretanto, a falta de monitoramento do que é publicado nas redes sociais pode levar ao surgimento de rumores, que são informações cuja veracidade, no momento de seu surgimento, não pode ser comprovada ou negada. A Análise de Redes Sociais é uma tarefa que envolve esforço de diferentes áreas, como a Ciência da Computação, Matemática e Psicologia, para investigar os usuários e as relações entre eles, e a disseminação de informações. A Visualização de Dados e o Aprendizado de Máquina são subáreas da Ciência da Computação que permitem a descoberta de padrões e anomalias em um conjunto de dados. Neste trabalho de mestrado foram utilizados conceitos de ambas subáreas e da Análise de Redes Sociais na realização de duas análises visuais e uma classificação supervisionada. A primeira análise visual tem como objetivo a comparação entre o Reddit e o Twitter no contexto de propagação de rumores. Essa análise possibilitou a identificação de semelhanças e diferenças existentes entre as duas redes sociais. A segunda análise visual tem como finalidade a identificação dos pontos similares entre um rumor verdadeiro e um rumor falso, e os pontos nos quais eles diferem. Uma classificação supervisionada foi também realizada com o objetivo de detectar se um usuário acredita no rumor que ele está propagando. Para isto, parte do conjunto de dados coletado foi anotado manualmente, classificado e avaliado. Os resultados obtidos mostram que a utilização de duas classes (positivo e negativo) na classificação atingiu resultados satisfatórios, ao contrário do que ocorreu quando três classes (positivo, neutro e negativo) foram utilizadas. Em conjunto, essas tarefas buscaram fornecer elementos para novas estratégias de identificação de rumores. |
id |
USP_60c0431ae2427d42c351bd2f40dfdabc |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-08062020-094039 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Análise e classificação de rumores em redes sociaisVisual analysis and classification of rumors in social networksAnálise visualAprendizado de máquinaClassificação supervisionadaData visualizationMachine learningRedes sociaisRumorSocial networksSupervised classificationVisual analysisVisualização de dadosO aumento da quantidade de pessoas com acesso à internet nos últimos anos contribuiu para o aumento da quantidade de usuários de redes sociais. Entretanto, a falta de monitoramento do que é publicado nas redes sociais pode levar ao surgimento de rumores, que são informações cuja veracidade, no momento de seu surgimento, não pode ser comprovada ou negada. A Análise de Redes Sociais é uma tarefa que envolve esforço de diferentes áreas, como a Ciência da Computação, Matemática e Psicologia, para investigar os usuários e as relações entre eles, e a disseminação de informações. A Visualização de Dados e o Aprendizado de Máquina são subáreas da Ciência da Computação que permitem a descoberta de padrões e anomalias em um conjunto de dados. Neste trabalho de mestrado foram utilizados conceitos de ambas subáreas e da Análise de Redes Sociais na realização de duas análises visuais e uma classificação supervisionada. A primeira análise visual tem como objetivo a comparação entre o Reddit e o Twitter no contexto de propagação de rumores. Essa análise possibilitou a identificação de semelhanças e diferenças existentes entre as duas redes sociais. A segunda análise visual tem como finalidade a identificação dos pontos similares entre um rumor verdadeiro e um rumor falso, e os pontos nos quais eles diferem. Uma classificação supervisionada foi também realizada com o objetivo de detectar se um usuário acredita no rumor que ele está propagando. Para isto, parte do conjunto de dados coletado foi anotado manualmente, classificado e avaliado. Os resultados obtidos mostram que a utilização de duas classes (positivo e negativo) na classificação atingiu resultados satisfatórios, ao contrário do que ocorreu quando três classes (positivo, neutro e negativo) foram utilizadas. Em conjunto, essas tarefas buscaram fornecer elementos para novas estratégias de identificação de rumores.The extense access to internet contributed to a spike in social network users. However, the lack of control in what is published may lead to the spread of rumors, which are unverified information. Social Network Analysis is a task that involves effort from different areas, such as Computer Science, Mathematics and Psychology, to investigate users and the relations between them, and information dissemination. Data Visualization and Machine Learning are Computer Science subareas that allow the discovery of patterns and anomalies of a dataset. Concepts from both subareas and Social Network Analysis were employed to perform two visual analysis and one supervised classification in this Masters research work. The goal of the first visual analysis is the comparison between Reddit and Twitter in the context of rumor propagation. This analysis allowed the identification of the existing similarities and differences between posts in either social network. The goal of the second visual analysis is the identification of similarities and differences between a true rumor and a false rumor. A supervised classification was performed to detect if a user believes in the rumor that he or she is propagating. In order to do so, part of the collected dataset was manually annotated, classified and measured. The results show that the use of two classes (positive and negative) in the classification achieved satisfactory results, as opposed to when three classes (positive, neutral and negative) were used. Together, these tasks seek to provide elements for new rumor identification strategies.Biblioteca Digitais de Teses e Dissertações da USPMinghim, RosaneSantos, Nícolas Roque dos2020-03-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-08062020-094039/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-06-08T15:49:01Zoai:teses.usp.br:tde-08062020-094039Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-06-08T15:49:01Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Análise e classificação de rumores em redes sociais Visual analysis and classification of rumors in social networks |
title |
Análise e classificação de rumores em redes sociais |
spellingShingle |
Análise e classificação de rumores em redes sociais Santos, Nícolas Roque dos Análise visual Aprendizado de máquina Classificação supervisionada Data visualization Machine learning Redes sociais Rumor Social networks Supervised classification Visual analysis Visualização de dados |
title_short |
Análise e classificação de rumores em redes sociais |
title_full |
Análise e classificação de rumores em redes sociais |
title_fullStr |
Análise e classificação de rumores em redes sociais |
title_full_unstemmed |
Análise e classificação de rumores em redes sociais |
title_sort |
Análise e classificação de rumores em redes sociais |
author |
Santos, Nícolas Roque dos |
author_facet |
Santos, Nícolas Roque dos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Minghim, Rosane |
dc.contributor.author.fl_str_mv |
Santos, Nícolas Roque dos |
dc.subject.por.fl_str_mv |
Análise visual Aprendizado de máquina Classificação supervisionada Data visualization Machine learning Redes sociais Rumor Social networks Supervised classification Visual analysis Visualização de dados |
topic |
Análise visual Aprendizado de máquina Classificação supervisionada Data visualization Machine learning Redes sociais Rumor Social networks Supervised classification Visual analysis Visualização de dados |
description |
O aumento da quantidade de pessoas com acesso à internet nos últimos anos contribuiu para o aumento da quantidade de usuários de redes sociais. Entretanto, a falta de monitoramento do que é publicado nas redes sociais pode levar ao surgimento de rumores, que são informações cuja veracidade, no momento de seu surgimento, não pode ser comprovada ou negada. A Análise de Redes Sociais é uma tarefa que envolve esforço de diferentes áreas, como a Ciência da Computação, Matemática e Psicologia, para investigar os usuários e as relações entre eles, e a disseminação de informações. A Visualização de Dados e o Aprendizado de Máquina são subáreas da Ciência da Computação que permitem a descoberta de padrões e anomalias em um conjunto de dados. Neste trabalho de mestrado foram utilizados conceitos de ambas subáreas e da Análise de Redes Sociais na realização de duas análises visuais e uma classificação supervisionada. A primeira análise visual tem como objetivo a comparação entre o Reddit e o Twitter no contexto de propagação de rumores. Essa análise possibilitou a identificação de semelhanças e diferenças existentes entre as duas redes sociais. A segunda análise visual tem como finalidade a identificação dos pontos similares entre um rumor verdadeiro e um rumor falso, e os pontos nos quais eles diferem. Uma classificação supervisionada foi também realizada com o objetivo de detectar se um usuário acredita no rumor que ele está propagando. Para isto, parte do conjunto de dados coletado foi anotado manualmente, classificado e avaliado. Os resultados obtidos mostram que a utilização de duas classes (positivo e negativo) na classificação atingiu resultados satisfatórios, ao contrário do que ocorreu quando três classes (positivo, neutro e negativo) foram utilizadas. Em conjunto, essas tarefas buscaram fornecer elementos para novas estratégias de identificação de rumores. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-03-11 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-08062020-094039/ |
url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-08062020-094039/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256803560128512 |