Análise e classificação de rumores em redes sociais

Detalhes bibliográficos
Autor(a) principal: Santos, Nícolas Roque dos
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-08062020-094039/
Resumo: O aumento da quantidade de pessoas com acesso à internet nos últimos anos contribuiu para o aumento da quantidade de usuários de redes sociais. Entretanto, a falta de monitoramento do que é publicado nas redes sociais pode levar ao surgimento de rumores, que são informações cuja veracidade, no momento de seu surgimento, não pode ser comprovada ou negada. A Análise de Redes Sociais é uma tarefa que envolve esforço de diferentes áreas, como a Ciência da Computação, Matemática e Psicologia, para investigar os usuários e as relações entre eles, e a disseminação de informações. A Visualização de Dados e o Aprendizado de Máquina são subáreas da Ciência da Computação que permitem a descoberta de padrões e anomalias em um conjunto de dados. Neste trabalho de mestrado foram utilizados conceitos de ambas subáreas e da Análise de Redes Sociais na realização de duas análises visuais e uma classificação supervisionada. A primeira análise visual tem como objetivo a comparação entre o Reddit e o Twitter no contexto de propagação de rumores. Essa análise possibilitou a identificação de semelhanças e diferenças existentes entre as duas redes sociais. A segunda análise visual tem como finalidade a identificação dos pontos similares entre um rumor verdadeiro e um rumor falso, e os pontos nos quais eles diferem. Uma classificação supervisionada foi também realizada com o objetivo de detectar se um usuário acredita no rumor que ele está propagando. Para isto, parte do conjunto de dados coletado foi anotado manualmente, classificado e avaliado. Os resultados obtidos mostram que a utilização de duas classes (positivo e negativo) na classificação atingiu resultados satisfatórios, ao contrário do que ocorreu quando três classes (positivo, neutro e negativo) foram utilizadas. Em conjunto, essas tarefas buscaram fornecer elementos para novas estratégias de identificação de rumores.
id USP_60c0431ae2427d42c351bd2f40dfdabc
oai_identifier_str oai:teses.usp.br:tde-08062020-094039
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Análise e classificação de rumores em redes sociaisVisual analysis and classification of rumors in social networksAnálise visualAprendizado de máquinaClassificação supervisionadaData visualizationMachine learningRedes sociaisRumorSocial networksSupervised classificationVisual analysisVisualização de dadosO aumento da quantidade de pessoas com acesso à internet nos últimos anos contribuiu para o aumento da quantidade de usuários de redes sociais. Entretanto, a falta de monitoramento do que é publicado nas redes sociais pode levar ao surgimento de rumores, que são informações cuja veracidade, no momento de seu surgimento, não pode ser comprovada ou negada. A Análise de Redes Sociais é uma tarefa que envolve esforço de diferentes áreas, como a Ciência da Computação, Matemática e Psicologia, para investigar os usuários e as relações entre eles, e a disseminação de informações. A Visualização de Dados e o Aprendizado de Máquina são subáreas da Ciência da Computação que permitem a descoberta de padrões e anomalias em um conjunto de dados. Neste trabalho de mestrado foram utilizados conceitos de ambas subáreas e da Análise de Redes Sociais na realização de duas análises visuais e uma classificação supervisionada. A primeira análise visual tem como objetivo a comparação entre o Reddit e o Twitter no contexto de propagação de rumores. Essa análise possibilitou a identificação de semelhanças e diferenças existentes entre as duas redes sociais. A segunda análise visual tem como finalidade a identificação dos pontos similares entre um rumor verdadeiro e um rumor falso, e os pontos nos quais eles diferem. Uma classificação supervisionada foi também realizada com o objetivo de detectar se um usuário acredita no rumor que ele está propagando. Para isto, parte do conjunto de dados coletado foi anotado manualmente, classificado e avaliado. Os resultados obtidos mostram que a utilização de duas classes (positivo e negativo) na classificação atingiu resultados satisfatórios, ao contrário do que ocorreu quando três classes (positivo, neutro e negativo) foram utilizadas. Em conjunto, essas tarefas buscaram fornecer elementos para novas estratégias de identificação de rumores.The extense access to internet contributed to a spike in social network users. However, the lack of control in what is published may lead to the spread of rumors, which are unverified information. Social Network Analysis is a task that involves effort from different areas, such as Computer Science, Mathematics and Psychology, to investigate users and the relations between them, and information dissemination. Data Visualization and Machine Learning are Computer Science subareas that allow the discovery of patterns and anomalies of a dataset. Concepts from both subareas and Social Network Analysis were employed to perform two visual analysis and one supervised classification in this Masters research work. The goal of the first visual analysis is the comparison between Reddit and Twitter in the context of rumor propagation. This analysis allowed the identification of the existing similarities and differences between posts in either social network. The goal of the second visual analysis is the identification of similarities and differences between a true rumor and a false rumor. A supervised classification was performed to detect if a user believes in the rumor that he or she is propagating. In order to do so, part of the collected dataset was manually annotated, classified and measured. The results show that the use of two classes (positive and negative) in the classification achieved satisfactory results, as opposed to when three classes (positive, neutral and negative) were used. Together, these tasks seek to provide elements for new rumor identification strategies.Biblioteca Digitais de Teses e Dissertações da USPMinghim, RosaneSantos, Nícolas Roque dos2020-03-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-08062020-094039/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-06-08T15:49:01Zoai:teses.usp.br:tde-08062020-094039Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-06-08T15:49:01Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Análise e classificação de rumores em redes sociais
Visual analysis and classification of rumors in social networks
title Análise e classificação de rumores em redes sociais
spellingShingle Análise e classificação de rumores em redes sociais
Santos, Nícolas Roque dos
Análise visual
Aprendizado de máquina
Classificação supervisionada
Data visualization
Machine learning
Redes sociais
Rumor
Social networks
Supervised classification
Visual analysis
Visualização de dados
title_short Análise e classificação de rumores em redes sociais
title_full Análise e classificação de rumores em redes sociais
title_fullStr Análise e classificação de rumores em redes sociais
title_full_unstemmed Análise e classificação de rumores em redes sociais
title_sort Análise e classificação de rumores em redes sociais
author Santos, Nícolas Roque dos
author_facet Santos, Nícolas Roque dos
author_role author
dc.contributor.none.fl_str_mv Minghim, Rosane
dc.contributor.author.fl_str_mv Santos, Nícolas Roque dos
dc.subject.por.fl_str_mv Análise visual
Aprendizado de máquina
Classificação supervisionada
Data visualization
Machine learning
Redes sociais
Rumor
Social networks
Supervised classification
Visual analysis
Visualização de dados
topic Análise visual
Aprendizado de máquina
Classificação supervisionada
Data visualization
Machine learning
Redes sociais
Rumor
Social networks
Supervised classification
Visual analysis
Visualização de dados
description O aumento da quantidade de pessoas com acesso à internet nos últimos anos contribuiu para o aumento da quantidade de usuários de redes sociais. Entretanto, a falta de monitoramento do que é publicado nas redes sociais pode levar ao surgimento de rumores, que são informações cuja veracidade, no momento de seu surgimento, não pode ser comprovada ou negada. A Análise de Redes Sociais é uma tarefa que envolve esforço de diferentes áreas, como a Ciência da Computação, Matemática e Psicologia, para investigar os usuários e as relações entre eles, e a disseminação de informações. A Visualização de Dados e o Aprendizado de Máquina são subáreas da Ciência da Computação que permitem a descoberta de padrões e anomalias em um conjunto de dados. Neste trabalho de mestrado foram utilizados conceitos de ambas subáreas e da Análise de Redes Sociais na realização de duas análises visuais e uma classificação supervisionada. A primeira análise visual tem como objetivo a comparação entre o Reddit e o Twitter no contexto de propagação de rumores. Essa análise possibilitou a identificação de semelhanças e diferenças existentes entre as duas redes sociais. A segunda análise visual tem como finalidade a identificação dos pontos similares entre um rumor verdadeiro e um rumor falso, e os pontos nos quais eles diferem. Uma classificação supervisionada foi também realizada com o objetivo de detectar se um usuário acredita no rumor que ele está propagando. Para isto, parte do conjunto de dados coletado foi anotado manualmente, classificado e avaliado. Os resultados obtidos mostram que a utilização de duas classes (positivo e negativo) na classificação atingiu resultados satisfatórios, ao contrário do que ocorreu quando três classes (positivo, neutro e negativo) foram utilizadas. Em conjunto, essas tarefas buscaram fornecer elementos para novas estratégias de identificação de rumores.
publishDate 2020
dc.date.none.fl_str_mv 2020-03-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55134/tde-08062020-094039/
url https://www.teses.usp.br/teses/disponiveis/55/55134/tde-08062020-094039/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815256803560128512