Uma abordagem para seleção de tópicos relevantes em redes sociais online

Detalhes bibliográficos
Autor(a) principal: Souza, Bruno Ábia
Data de Publicação: 2017
Outros Autores: http://lattes.cnpq.br/8539800386696490
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFAM
Texto Completo: https://tede.ufam.edu.br/handle/tede/7232
Resumo: O crescente uso das redes sociais fez com que a quantidade de informações que são compartilhadas diariamente (opiniões pessoais, notícias e eventos do tipo natural ou social) aumentasse, tornando estas redes uma fonte de informaç cãoo sobre eventos. No Brasil, acontecimentos recentes, como a Operação Lava Jato conduzida pela polícia Federal e o processo de impeachment da Presidente são exemplos de eventos que geraram repercussões nos meios de comunicação. Esses fatos marcantes, podem ser utilizados para caracterizar quais são os acontecimentos relevantes de um determinado evento. Nas redes sociais, esses acontecimentos geram discussões, compartilhamentos e novas notícias, onde informações relevantes acabam tendo mais repercussões. Contudo, processar uma elevada massa de dados a fim de eliminar ruídos e reconhecer informações torna-se muito custoso. Neste contexto, este trabalho tem como objetivo demonstrar uma abordagem para caracterização de informações relevantes de eventos, através da extração de tópicos em dados compartilhados no Twitter, onde avaliamos o desempenho de três métodos de aprendizagem de máquina (K-means, Latent Dirichlet Allocation - LDA e Non-Negative Matrix Factorization - NMF) usados para extrair tópicos sobre as bases de dados da Operação Lava Jato e do processo de impeachment da presidente do Brasil em duas arquiteturas de pré-processamento diferentes (tradicional e com reconhecimento de entidade), demonstrando que é possível utilizar uma rede social como fonte de dados para descobrir os tópicos relevantes através do sensoriamento de usuários que observam um evento. Em nossos experimentos, observamos que as técnicas de pré-processamento têm influência direta sobre o resultado da extração de tópicos. Além disso, observamos que a técnica Silhouette nos ajudou a encontrar o melhor valor de clusters para uma determinada amostra de dados. Nos resultados o NMF apresentou o melhor desempenho nas duas bases de dados, tanto na tarefa de extração de tópicos quanto no tempo de execução.
id UFAM_215a5e4a28dcf427b07c16daa053254e
oai_identifier_str oai:https://tede.ufam.edu.br/handle/:tede/7232
network_acronym_str UFAM
network_name_str Biblioteca Digital de Teses e Dissertações da UFAM
repository_id_str 6592
spelling Uma abordagem para seleção de tópicos relevantes em redes sociais onlineAprendizado do computadorRedes sociais on-lineTwitter (Rede social on-line)CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOO crescente uso das redes sociais fez com que a quantidade de informações que são compartilhadas diariamente (opiniões pessoais, notícias e eventos do tipo natural ou social) aumentasse, tornando estas redes uma fonte de informaç cãoo sobre eventos. No Brasil, acontecimentos recentes, como a Operação Lava Jato conduzida pela polícia Federal e o processo de impeachment da Presidente são exemplos de eventos que geraram repercussões nos meios de comunicação. Esses fatos marcantes, podem ser utilizados para caracterizar quais são os acontecimentos relevantes de um determinado evento. Nas redes sociais, esses acontecimentos geram discussões, compartilhamentos e novas notícias, onde informações relevantes acabam tendo mais repercussões. Contudo, processar uma elevada massa de dados a fim de eliminar ruídos e reconhecer informações torna-se muito custoso. Neste contexto, este trabalho tem como objetivo demonstrar uma abordagem para caracterização de informações relevantes de eventos, através da extração de tópicos em dados compartilhados no Twitter, onde avaliamos o desempenho de três métodos de aprendizagem de máquina (K-means, Latent Dirichlet Allocation - LDA e Non-Negative Matrix Factorization - NMF) usados para extrair tópicos sobre as bases de dados da Operação Lava Jato e do processo de impeachment da presidente do Brasil em duas arquiteturas de pré-processamento diferentes (tradicional e com reconhecimento de entidade), demonstrando que é possível utilizar uma rede social como fonte de dados para descobrir os tópicos relevantes através do sensoriamento de usuários que observam um evento. Em nossos experimentos, observamos que as técnicas de pré-processamento têm influência direta sobre o resultado da extração de tópicos. Além disso, observamos que a técnica Silhouette nos ajudou a encontrar o melhor valor de clusters para uma determinada amostra de dados. Nos resultados o NMF apresentou o melhor desempenho nas duas bases de dados, tanto na tarefa de extração de tópicos quanto no tempo de execução.The increasing use of social networks has made the amount of information that is shared daily (personal opinions, news and events of the natural or social type) increasing significantly, making social networks a source of information about events. In Brazil, recent events such as Lava Jato Operation conducted by the Federal Police and the impeachment process of the Brazil President are examples of events that have had repercussions in the traditional medias. These facts can be used to characterize the relevant informations of an event. In social networks, the events generate discussions, sharings and news posts, where relevant information have more repercussions. However, processing a large mass of data to eliminate noise and recognize the information becomes costly. In this context, this work aims to show an approach to the characterization of relevant information by extracting topics in shared data on Twitter, where we evaluate the performance of three methods of machine learning (K-means, Latent Dirichlet Allocation (LDA) and Non-Negative Matrix Factorization (NMF)) used to extract topics on Lava Jato's databases and the impeachment process of the Brazilian president in two different preprocessing architectures (traditional and with entity recognition), demonstrating that it is possible to use the social networks as a data source to discover the relevant topics through the sensing of users that observe an event. In our experiments, we observed that the preprocessing techniques have a direct influence on the result of the topics extraction. In addition, we observed that the Silhouette technique helped us to find the best value of clusters for a given data sample. In the results the NMF presented the best performance in both databases, both in the topic extraction task and in the execution timeCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorUniversidade Federal do AmazonasInstituto de ComputaçãoBrasilUFAMPrograma de Pós-graduação em InformáticaNakamura, Eduardo Freirehttp://lattes.cnpq.br/1448696292042915Figueiredo, Carlos Maurício Seródiohttp://lattes.cnpq.br/9060002746939878Costa, Elloá Barreto Guedes dahttp://lattes.cnpq.br/6466781778573760Souza, Bruno Ábiahttp://lattes.cnpq.br/85398003866964902019-07-01T19:41:40Z2017-03-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSOUZA, Bruno Ábia. Uma abordagem para seleção de tópicos relevantes em redes sociais online. 2017. 81 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2017.https://tede.ufam.edu.br/handle/tede/7232porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2019-07-02T05:03:37Zoai:https://tede.ufam.edu.br/handle/:tede/7232Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922019-07-02T05:03:37Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv Uma abordagem para seleção de tópicos relevantes em redes sociais online
title Uma abordagem para seleção de tópicos relevantes em redes sociais online
spellingShingle Uma abordagem para seleção de tópicos relevantes em redes sociais online
Souza, Bruno Ábia
Aprendizado do computador
Redes sociais on-line
Twitter (Rede social on-line)
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
title_short Uma abordagem para seleção de tópicos relevantes em redes sociais online
title_full Uma abordagem para seleção de tópicos relevantes em redes sociais online
title_fullStr Uma abordagem para seleção de tópicos relevantes em redes sociais online
title_full_unstemmed Uma abordagem para seleção de tópicos relevantes em redes sociais online
title_sort Uma abordagem para seleção de tópicos relevantes em redes sociais online
author Souza, Bruno Ábia
author_facet Souza, Bruno Ábia
http://lattes.cnpq.br/8539800386696490
author_role author
author2 http://lattes.cnpq.br/8539800386696490
author2_role author
dc.contributor.none.fl_str_mv Nakamura, Eduardo Freire
http://lattes.cnpq.br/1448696292042915
Figueiredo, Carlos Maurício Seródio
http://lattes.cnpq.br/9060002746939878
Costa, Elloá Barreto Guedes da
http://lattes.cnpq.br/6466781778573760
dc.contributor.author.fl_str_mv Souza, Bruno Ábia
http://lattes.cnpq.br/8539800386696490
dc.subject.por.fl_str_mv Aprendizado do computador
Redes sociais on-line
Twitter (Rede social on-line)
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
topic Aprendizado do computador
Redes sociais on-line
Twitter (Rede social on-line)
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description O crescente uso das redes sociais fez com que a quantidade de informações que são compartilhadas diariamente (opiniões pessoais, notícias e eventos do tipo natural ou social) aumentasse, tornando estas redes uma fonte de informaç cãoo sobre eventos. No Brasil, acontecimentos recentes, como a Operação Lava Jato conduzida pela polícia Federal e o processo de impeachment da Presidente são exemplos de eventos que geraram repercussões nos meios de comunicação. Esses fatos marcantes, podem ser utilizados para caracterizar quais são os acontecimentos relevantes de um determinado evento. Nas redes sociais, esses acontecimentos geram discussões, compartilhamentos e novas notícias, onde informações relevantes acabam tendo mais repercussões. Contudo, processar uma elevada massa de dados a fim de eliminar ruídos e reconhecer informações torna-se muito custoso. Neste contexto, este trabalho tem como objetivo demonstrar uma abordagem para caracterização de informações relevantes de eventos, através da extração de tópicos em dados compartilhados no Twitter, onde avaliamos o desempenho de três métodos de aprendizagem de máquina (K-means, Latent Dirichlet Allocation - LDA e Non-Negative Matrix Factorization - NMF) usados para extrair tópicos sobre as bases de dados da Operação Lava Jato e do processo de impeachment da presidente do Brasil em duas arquiteturas de pré-processamento diferentes (tradicional e com reconhecimento de entidade), demonstrando que é possível utilizar uma rede social como fonte de dados para descobrir os tópicos relevantes através do sensoriamento de usuários que observam um evento. Em nossos experimentos, observamos que as técnicas de pré-processamento têm influência direta sobre o resultado da extração de tópicos. Além disso, observamos que a técnica Silhouette nos ajudou a encontrar o melhor valor de clusters para uma determinada amostra de dados. Nos resultados o NMF apresentou o melhor desempenho nas duas bases de dados, tanto na tarefa de extração de tópicos quanto no tempo de execução.
publishDate 2017
dc.date.none.fl_str_mv 2017-03-24
2019-07-01T19:41:40Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SOUZA, Bruno Ábia. Uma abordagem para seleção de tópicos relevantes em redes sociais online. 2017. 81 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2017.
https://tede.ufam.edu.br/handle/tede/7232
identifier_str_mv SOUZA, Bruno Ábia. Uma abordagem para seleção de tópicos relevantes em redes sociais online. 2017. 81 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2017.
url https://tede.ufam.edu.br/handle/tede/7232
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFAM
instname:Universidade Federal do Amazonas (UFAM)
instacron:UFAM
instname_str Universidade Federal do Amazonas (UFAM)
instacron_str UFAM
institution UFAM
reponame_str Biblioteca Digital de Teses e Dissertações da UFAM
collection Biblioteca Digital de Teses e Dissertações da UFAM
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv ddbc@ufam.edu.br||ddbc@ufam.edu.br
_version_ 1809732034596175872