Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/10053 |
Resumo: | Orientadores: Leonardo Tomazeli Duarte, Priscila Pereira Coltri |
id |
UNICAMP-30_89a1b949958f70ef64a8f085da2c4281 |
---|---|
oai_identifier_str |
oai::1313375 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCCA study on topic modeling based on non-negative matrix factorizations : analysis of the impact generated by the IPCC reportsMineração de dados (Computação)Análise de sentimentosData miningSentiment analysisOrientadores: Leonardo Tomazeli Duarte, Priscila Pereira ColtriDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciências AplicadasResumo: Um problema típico da análise de dados de textos consiste em determinar as características que os dados compartilham, como por exemplo, o contexto geral de conjuntos documentos. A fim de lidar com tal problema, abordagens de modelagem de tópicos vêm sendo utilizadas em diversas aplicações, como ferramentas para avaliação de dados e descoberta de informações latentes presentes em documentos de textos. Vários métodos de modelagem de tópicos vêm sendo desenvolvidos, os quais podem ser adaptados para diferentes conjuntos de dados. Nos últimos anos, as plataformas de mídia social se tornaram canais importantes para divulgação de informações e comunicação. Porém, os dados gerados através delas são caracterizados como textos curtos, o que representa um desafio adicional aos principais métodos de modelagem de tópicos existentes. Frente à relevância do tema, nosso trabalho visa contribuir investigando técnicas de modelagem de tópicos apropriadas para a análise de textos curtos, característicos de redes sociais. Nesta dissertação de mestrado, a abordagem de modelagem de tópicos baseada na fatoração não negativa de matrizes (NMF) foi explorada e comparada com uma variação não linear de NMF que incorpora interações entre os tópicos. Como aplicação, foram desenvolvidos alguns experimentos no projeto, utilizamos dados de notícias de jornais para teste das abordagens de modelagem de tópicos e dados da rede social Twitter, no contexto da receptividade dos relatórios do Painel Intergovernamental de Mudanças Climáticas (IPCC). O objetivo dessa última aplicação é analisar a repercussão gerada nas redes sociais pela publicação dos últimos relatórios de avaliação do clima desenvolvidos pelo IPCC, comparando a percepção do público em períodos anteriores à publicação dos relatórios com períodos posteriores à publicação. Além da abordagem de modelagem de tópicos utilizada no trabalho, exploramos uma aplicação baseada em análise de sentimentos para contribuir com a investigação da repercussão dos relatórios do IPCC. Com a metodologia investigada, foi possível obter uma compreensão interessante sobre a repercussão dos relatórios, especialmente no que fiz respeito à identificação dos principais temas abordados pelo público do Twitter no contexto investigado, como forma de validar se a estratégia de comunicação do IPCC, empregada em seus relatórios, tem sido satisfatória. Com base em nossos experimentos e nos resultados alcançados, pretendemos contribuir para a discussão sobre o uso de técnicas como a modelagem de tópicos e a análise de sentimentos, em problemas que envolvam a análise de dados de textos. Além disso, pretendemos motivar o desenvolvimento de trabalhos futuros sobre este assuntoAbstract: A typical problem of text data analysis is to determine the characteristics that the data share, such as the general context of document sets. In order to deal with this problem, topic modeling approaches have been used in several applications, such as tools for data evaluation and discovery of latent information present in text documents. Several topic modeling methods have been developed, which can be adapted to different data sets. In recent years, social media platforms have become important channels for information dissemination and communication. However, the data generated through them are characterized as short texts, which represents an additional challenge to the main existing topic modeling methods. Given the relevance of the topic, our work aims to contribute by investigating topic modeling techniques appropriate for the analysis of short texts, characteristic of social networks. In this master’s dissertation, the topic modeling approach based on non-negative matrix factorization (NMF) was explored and compared with a non-linear variation of NMF that incorporates interactions between topics. As an application, some experiments were developed in the project, we used newspaper news data to test topic modeling approaches and data from the social network Twitter, in the context of the receptivity of the Intergovernmental Panel on Climate Change (IPCC) reports. The purpose of this last application is to analyze the impact generated on social networks by the publication of the latest climate assessment reports developed by the IPCC, comparing the public’s perception in periods before the publication of the reports with periods after the publication. In addition to the topic modeling approach used in the work, we explored an application based on sentiment analysis to contribute to the investigation of the impact of IPCC reports. With the methodology investigated, it was possible to obtain an interesting understanding of the impact of the reports, especially with regard to the identification of the main topics addressed by the Twitter audience in the investigated context, as a way of validating whether the IPCC communication strategy, used in their reports, has been satisfactory. Based on our experiments and the results achieved, we intend to contribute to the discussion on the use of techniques such as topic modeling and sentiment analysis, in problems involving the analysis of text data. Furthermore, we intend to motivate the development of future works on this subjectMestradoPesquisa Operacional e Gestão de ProcessosMestra em Engenharia de Produção e de Manufatura[s.n.]Duarte, Leonardo Tomazeli, 1982-Torezzan, CristianoSuyama, RicardoUniversidade Estadual de Campinas (UNICAMP). Faculdade de Ciências AplicadasPrograma de Pós-Graduação em Engenharia de Produção e de ManufaturaUNIVERSIDADE ESTADUAL DE CAMPINASSouza, Beatriz Vilas Boas Spaggiari, 1997-20222022-12-06T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (86 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/10053SOUZA, Beatriz Vilas Boas Spaggiari. Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes: análise da repercussão gerada pelos relatórios do IPCC. 2022. 1 recurso online (86 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciências Aplicadas, Limeira, SP. Disponível em: https://hdl.handle.net/20.500.12733/10053. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1313375Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2023-06-02T10:20:30Zoai::1313375Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2023-06-02T10:20:30Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC A study on topic modeling based on non-negative matrix factorizations : analysis of the impact generated by the IPCC reports |
title |
Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC |
spellingShingle |
Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC Souza, Beatriz Vilas Boas Spaggiari, 1997- Mineração de dados (Computação) Análise de sentimentos Data mining Sentiment analysis |
title_short |
Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC |
title_full |
Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC |
title_fullStr |
Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC |
title_full_unstemmed |
Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC |
title_sort |
Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC |
author |
Souza, Beatriz Vilas Boas Spaggiari, 1997- |
author_facet |
Souza, Beatriz Vilas Boas Spaggiari, 1997- |
author_role |
author |
dc.contributor.none.fl_str_mv |
Duarte, Leonardo Tomazeli, 1982- Torezzan, Cristiano Suyama, Ricardo Universidade Estadual de Campinas (UNICAMP). Faculdade de Ciências Aplicadas Programa de Pós-Graduação em Engenharia de Produção e de Manufatura UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Souza, Beatriz Vilas Boas Spaggiari, 1997- |
dc.subject.por.fl_str_mv |
Mineração de dados (Computação) Análise de sentimentos Data mining Sentiment analysis |
topic |
Mineração de dados (Computação) Análise de sentimentos Data mining Sentiment analysis |
description |
Orientadores: Leonardo Tomazeli Duarte, Priscila Pereira Coltri |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022 2022-12-06T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/10053 SOUZA, Beatriz Vilas Boas Spaggiari. Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes: análise da repercussão gerada pelos relatórios do IPCC. 2022. 1 recurso online (86 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciências Aplicadas, Limeira, SP. Disponível em: https://hdl.handle.net/20.500.12733/10053. Acesso em: 3 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/10053 |
identifier_str_mv |
SOUZA, Beatriz Vilas Boas Spaggiari. Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes: análise da repercussão gerada pelos relatórios do IPCC. 2022. 1 recurso online (86 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciências Aplicadas, Limeira, SP. Disponível em: https://hdl.handle.net/20.500.12733/10053. Acesso em: 3 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/1313375 Requisitos do sistema: Software para leitura de arquivo em PDF |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 1 recurso online (86 p.) : il., digital, arquivo PDF. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189190021152768 |