Uma abordagem para seleção de tópicos relevantes em redes sociais online
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Outros Autores: | |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFAM |
Texto Completo: | https://tede.ufam.edu.br/handle/tede/7232 |
Resumo: | O crescente uso das redes sociais fez com que a quantidade de informações que são compartilhadas diariamente (opiniões pessoais, notícias e eventos do tipo natural ou social) aumentasse, tornando estas redes uma fonte de informaç cãoo sobre eventos. No Brasil, acontecimentos recentes, como a Operação Lava Jato conduzida pela polícia Federal e o processo de impeachment da Presidente são exemplos de eventos que geraram repercussões nos meios de comunicação. Esses fatos marcantes, podem ser utilizados para caracterizar quais são os acontecimentos relevantes de um determinado evento. Nas redes sociais, esses acontecimentos geram discussões, compartilhamentos e novas notícias, onde informações relevantes acabam tendo mais repercussões. Contudo, processar uma elevada massa de dados a fim de eliminar ruídos e reconhecer informações torna-se muito custoso. Neste contexto, este trabalho tem como objetivo demonstrar uma abordagem para caracterização de informações relevantes de eventos, através da extração de tópicos em dados compartilhados no Twitter, onde avaliamos o desempenho de três métodos de aprendizagem de máquina (K-means, Latent Dirichlet Allocation - LDA e Non-Negative Matrix Factorization - NMF) usados para extrair tópicos sobre as bases de dados da Operação Lava Jato e do processo de impeachment da presidente do Brasil em duas arquiteturas de pré-processamento diferentes (tradicional e com reconhecimento de entidade), demonstrando que é possível utilizar uma rede social como fonte de dados para descobrir os tópicos relevantes através do sensoriamento de usuários que observam um evento. Em nossos experimentos, observamos que as técnicas de pré-processamento têm influência direta sobre o resultado da extração de tópicos. Além disso, observamos que a técnica Silhouette nos ajudou a encontrar o melhor valor de clusters para uma determinada amostra de dados. Nos resultados o NMF apresentou o melhor desempenho nas duas bases de dados, tanto na tarefa de extração de tópicos quanto no tempo de execução. |
id |
UFAM_215a5e4a28dcf427b07c16daa053254e |
---|---|
oai_identifier_str |
oai:https://tede.ufam.edu.br/handle/:tede/7232 |
network_acronym_str |
UFAM |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFAM |
repository_id_str |
6592 |
spelling |
Uma abordagem para seleção de tópicos relevantes em redes sociais onlineAprendizado do computadorRedes sociais on-lineTwitter (Rede social on-line)CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOO crescente uso das redes sociais fez com que a quantidade de informações que são compartilhadas diariamente (opiniões pessoais, notícias e eventos do tipo natural ou social) aumentasse, tornando estas redes uma fonte de informaç cãoo sobre eventos. No Brasil, acontecimentos recentes, como a Operação Lava Jato conduzida pela polícia Federal e o processo de impeachment da Presidente são exemplos de eventos que geraram repercussões nos meios de comunicação. Esses fatos marcantes, podem ser utilizados para caracterizar quais são os acontecimentos relevantes de um determinado evento. Nas redes sociais, esses acontecimentos geram discussões, compartilhamentos e novas notícias, onde informações relevantes acabam tendo mais repercussões. Contudo, processar uma elevada massa de dados a fim de eliminar ruídos e reconhecer informações torna-se muito custoso. Neste contexto, este trabalho tem como objetivo demonstrar uma abordagem para caracterização de informações relevantes de eventos, através da extração de tópicos em dados compartilhados no Twitter, onde avaliamos o desempenho de três métodos de aprendizagem de máquina (K-means, Latent Dirichlet Allocation - LDA e Non-Negative Matrix Factorization - NMF) usados para extrair tópicos sobre as bases de dados da Operação Lava Jato e do processo de impeachment da presidente do Brasil em duas arquiteturas de pré-processamento diferentes (tradicional e com reconhecimento de entidade), demonstrando que é possível utilizar uma rede social como fonte de dados para descobrir os tópicos relevantes através do sensoriamento de usuários que observam um evento. Em nossos experimentos, observamos que as técnicas de pré-processamento têm influência direta sobre o resultado da extração de tópicos. Além disso, observamos que a técnica Silhouette nos ajudou a encontrar o melhor valor de clusters para uma determinada amostra de dados. Nos resultados o NMF apresentou o melhor desempenho nas duas bases de dados, tanto na tarefa de extração de tópicos quanto no tempo de execução.The increasing use of social networks has made the amount of information that is shared daily (personal opinions, news and events of the natural or social type) increasing significantly, making social networks a source of information about events. In Brazil, recent events such as Lava Jato Operation conducted by the Federal Police and the impeachment process of the Brazil President are examples of events that have had repercussions in the traditional medias. These facts can be used to characterize the relevant informations of an event. In social networks, the events generate discussions, sharings and news posts, where relevant information have more repercussions. However, processing a large mass of data to eliminate noise and recognize the information becomes costly. In this context, this work aims to show an approach to the characterization of relevant information by extracting topics in shared data on Twitter, where we evaluate the performance of three methods of machine learning (K-means, Latent Dirichlet Allocation (LDA) and Non-Negative Matrix Factorization (NMF)) used to extract topics on Lava Jato's databases and the impeachment process of the Brazilian president in two different preprocessing architectures (traditional and with entity recognition), demonstrating that it is possible to use the social networks as a data source to discover the relevant topics through the sensing of users that observe an event. In our experiments, we observed that the preprocessing techniques have a direct influence on the result of the topics extraction. In addition, we observed that the Silhouette technique helped us to find the best value of clusters for a given data sample. In the results the NMF presented the best performance in both databases, both in the topic extraction task and in the execution timeCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorUniversidade Federal do AmazonasInstituto de ComputaçãoBrasilUFAMPrograma de Pós-graduação em InformáticaNakamura, Eduardo Freirehttp://lattes.cnpq.br/1448696292042915Figueiredo, Carlos Maurício Seródiohttp://lattes.cnpq.br/9060002746939878Costa, Elloá Barreto Guedes dahttp://lattes.cnpq.br/6466781778573760Souza, Bruno Ábiahttp://lattes.cnpq.br/85398003866964902019-07-01T19:41:40Z2017-03-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSOUZA, Bruno Ábia. Uma abordagem para seleção de tópicos relevantes em redes sociais online. 2017. 81 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2017.https://tede.ufam.edu.br/handle/tede/7232porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2019-07-02T05:03:37Zoai:https://tede.ufam.edu.br/handle/:tede/7232Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922019-07-02T05:03:37Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false |
dc.title.none.fl_str_mv |
Uma abordagem para seleção de tópicos relevantes em redes sociais online |
title |
Uma abordagem para seleção de tópicos relevantes em redes sociais online |
spellingShingle |
Uma abordagem para seleção de tópicos relevantes em redes sociais online Souza, Bruno Ábia Aprendizado do computador Redes sociais on-line Twitter (Rede social on-line) CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
title_short |
Uma abordagem para seleção de tópicos relevantes em redes sociais online |
title_full |
Uma abordagem para seleção de tópicos relevantes em redes sociais online |
title_fullStr |
Uma abordagem para seleção de tópicos relevantes em redes sociais online |
title_full_unstemmed |
Uma abordagem para seleção de tópicos relevantes em redes sociais online |
title_sort |
Uma abordagem para seleção de tópicos relevantes em redes sociais online |
author |
Souza, Bruno Ábia |
author_facet |
Souza, Bruno Ábia http://lattes.cnpq.br/8539800386696490 |
author_role |
author |
author2 |
http://lattes.cnpq.br/8539800386696490 |
author2_role |
author |
dc.contributor.none.fl_str_mv |
Nakamura, Eduardo Freire http://lattes.cnpq.br/1448696292042915 Figueiredo, Carlos Maurício Seródio http://lattes.cnpq.br/9060002746939878 Costa, Elloá Barreto Guedes da http://lattes.cnpq.br/6466781778573760 |
dc.contributor.author.fl_str_mv |
Souza, Bruno Ábia http://lattes.cnpq.br/8539800386696490 |
dc.subject.por.fl_str_mv |
Aprendizado do computador Redes sociais on-line Twitter (Rede social on-line) CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
topic |
Aprendizado do computador Redes sociais on-line Twitter (Rede social on-line) CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
description |
O crescente uso das redes sociais fez com que a quantidade de informações que são compartilhadas diariamente (opiniões pessoais, notícias e eventos do tipo natural ou social) aumentasse, tornando estas redes uma fonte de informaç cãoo sobre eventos. No Brasil, acontecimentos recentes, como a Operação Lava Jato conduzida pela polícia Federal e o processo de impeachment da Presidente são exemplos de eventos que geraram repercussões nos meios de comunicação. Esses fatos marcantes, podem ser utilizados para caracterizar quais são os acontecimentos relevantes de um determinado evento. Nas redes sociais, esses acontecimentos geram discussões, compartilhamentos e novas notícias, onde informações relevantes acabam tendo mais repercussões. Contudo, processar uma elevada massa de dados a fim de eliminar ruídos e reconhecer informações torna-se muito custoso. Neste contexto, este trabalho tem como objetivo demonstrar uma abordagem para caracterização de informações relevantes de eventos, através da extração de tópicos em dados compartilhados no Twitter, onde avaliamos o desempenho de três métodos de aprendizagem de máquina (K-means, Latent Dirichlet Allocation - LDA e Non-Negative Matrix Factorization - NMF) usados para extrair tópicos sobre as bases de dados da Operação Lava Jato e do processo de impeachment da presidente do Brasil em duas arquiteturas de pré-processamento diferentes (tradicional e com reconhecimento de entidade), demonstrando que é possível utilizar uma rede social como fonte de dados para descobrir os tópicos relevantes através do sensoriamento de usuários que observam um evento. Em nossos experimentos, observamos que as técnicas de pré-processamento têm influência direta sobre o resultado da extração de tópicos. Além disso, observamos que a técnica Silhouette nos ajudou a encontrar o melhor valor de clusters para uma determinada amostra de dados. Nos resultados o NMF apresentou o melhor desempenho nas duas bases de dados, tanto na tarefa de extração de tópicos quanto no tempo de execução. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-03-24 2019-07-01T19:41:40Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SOUZA, Bruno Ábia. Uma abordagem para seleção de tópicos relevantes em redes sociais online. 2017. 81 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2017. https://tede.ufam.edu.br/handle/tede/7232 |
identifier_str_mv |
SOUZA, Bruno Ábia. Uma abordagem para seleção de tópicos relevantes em redes sociais online. 2017. 81 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2017. |
url |
https://tede.ufam.edu.br/handle/tede/7232 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática |
publisher.none.fl_str_mv |
Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFAM instname:Universidade Federal do Amazonas (UFAM) instacron:UFAM |
instname_str |
Universidade Federal do Amazonas (UFAM) |
instacron_str |
UFAM |
institution |
UFAM |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFAM |
collection |
Biblioteca Digital de Teses e Dissertações da UFAM |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM) |
repository.mail.fl_str_mv |
ddbc@ufam.edu.br||ddbc@ufam.edu.br |
_version_ |
1809732034596175872 |