Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC

Detalhes bibliográficos
Autor(a) principal: Souza, Beatriz Vilas Boas Spaggiari, 1997-
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/10053
Resumo: Orientadores: Leonardo Tomazeli Duarte, Priscila Pereira Coltri
id UNICAMP-30_89a1b949958f70ef64a8f085da2c4281
oai_identifier_str oai::1313375
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCCA study on topic modeling based on non-negative matrix factorizations : analysis of the impact generated by the IPCC reportsMineração de dados (Computação)Análise de sentimentosData miningSentiment analysisOrientadores: Leonardo Tomazeli Duarte, Priscila Pereira ColtriDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciências AplicadasResumo: Um problema típico da análise de dados de textos consiste em determinar as características que os dados compartilham, como por exemplo, o contexto geral de conjuntos documentos. A fim de lidar com tal problema, abordagens de modelagem de tópicos vêm sendo utilizadas em diversas aplicações, como ferramentas para avaliação de dados e descoberta de informações latentes presentes em documentos de textos. Vários métodos de modelagem de tópicos vêm sendo desenvolvidos, os quais podem ser adaptados para diferentes conjuntos de dados. Nos últimos anos, as plataformas de mídia social se tornaram canais importantes para divulgação de informações e comunicação. Porém, os dados gerados através delas são caracterizados como textos curtos, o que representa um desafio adicional aos principais métodos de modelagem de tópicos existentes. Frente à relevância do tema, nosso trabalho visa contribuir investigando técnicas de modelagem de tópicos apropriadas para a análise de textos curtos, característicos de redes sociais. Nesta dissertação de mestrado, a abordagem de modelagem de tópicos baseada na fatoração não negativa de matrizes (NMF) foi explorada e comparada com uma variação não linear de NMF que incorpora interações entre os tópicos. Como aplicação, foram desenvolvidos alguns experimentos no projeto, utilizamos dados de notícias de jornais para teste das abordagens de modelagem de tópicos e dados da rede social Twitter, no contexto da receptividade dos relatórios do Painel Intergovernamental de Mudanças Climáticas (IPCC). O objetivo dessa última aplicação é analisar a repercussão gerada nas redes sociais pela publicação dos últimos relatórios de avaliação do clima desenvolvidos pelo IPCC, comparando a percepção do público em períodos anteriores à publicação dos relatórios com períodos posteriores à publicação. Além da abordagem de modelagem de tópicos utilizada no trabalho, exploramos uma aplicação baseada em análise de sentimentos para contribuir com a investigação da repercussão dos relatórios do IPCC. Com a metodologia investigada, foi possível obter uma compreensão interessante sobre a repercussão dos relatórios, especialmente no que fiz respeito à identificação dos principais temas abordados pelo público do Twitter no contexto investigado, como forma de validar se a estratégia de comunicação do IPCC, empregada em seus relatórios, tem sido satisfatória. Com base em nossos experimentos e nos resultados alcançados, pretendemos contribuir para a discussão sobre o uso de técnicas como a modelagem de tópicos e a análise de sentimentos, em problemas que envolvam a análise de dados de textos. Além disso, pretendemos motivar o desenvolvimento de trabalhos futuros sobre este assuntoAbstract: A typical problem of text data analysis is to determine the characteristics that the data share, such as the general context of document sets. In order to deal with this problem, topic modeling approaches have been used in several applications, such as tools for data evaluation and discovery of latent information present in text documents. Several topic modeling methods have been developed, which can be adapted to different data sets. In recent years, social media platforms have become important channels for information dissemination and communication. However, the data generated through them are characterized as short texts, which represents an additional challenge to the main existing topic modeling methods. Given the relevance of the topic, our work aims to contribute by investigating topic modeling techniques appropriate for the analysis of short texts, characteristic of social networks. In this master’s dissertation, the topic modeling approach based on non-negative matrix factorization (NMF) was explored and compared with a non-linear variation of NMF that incorporates interactions between topics. As an application, some experiments were developed in the project, we used newspaper news data to test topic modeling approaches and data from the social network Twitter, in the context of the receptivity of the Intergovernmental Panel on Climate Change (IPCC) reports. The purpose of this last application is to analyze the impact generated on social networks by the publication of the latest climate assessment reports developed by the IPCC, comparing the public’s perception in periods before the publication of the reports with periods after the publication. In addition to the topic modeling approach used in the work, we explored an application based on sentiment analysis to contribute to the investigation of the impact of IPCC reports. With the methodology investigated, it was possible to obtain an interesting understanding of the impact of the reports, especially with regard to the identification of the main topics addressed by the Twitter audience in the investigated context, as a way of validating whether the IPCC communication strategy, used in their reports, has been satisfactory. Based on our experiments and the results achieved, we intend to contribute to the discussion on the use of techniques such as topic modeling and sentiment analysis, in problems involving the analysis of text data. Furthermore, we intend to motivate the development of future works on this subjectMestradoPesquisa Operacional e Gestão de ProcessosMestra em Engenharia de Produção e de Manufatura[s.n.]Duarte, Leonardo Tomazeli, 1982-Torezzan, CristianoSuyama, RicardoUniversidade Estadual de Campinas. Faculdade de Ciências AplicadasPrograma de Pós-Graduação em Engenharia de Produção e de ManufaturaUNIVERSIDADE ESTADUAL DE CAMPINASSouza, Beatriz Vilas Boas Spaggiari, 1997-20222022-12-06T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (86 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/10053SOUZA, Beatriz Vilas Boas Spaggiari. Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes: análise da repercussão gerada pelos relatórios do IPCC. 2022. 1 recurso online (86 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciências Aplicadas, Limeira, SP. Disponível em: https://hdl.handle.net/20.500.12733/10053. Acesso em: 15 mai. 2024.https://repositorio.unicamp.br/acervo/detalhe/1313375Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2023-06-02T10:20:30Zoai::1313375Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2023-06-02T10:20:30Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC
A study on topic modeling based on non-negative matrix factorizations : analysis of the impact generated by the IPCC reports
title Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC
spellingShingle Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC
Souza, Beatriz Vilas Boas Spaggiari, 1997-
Mineração de dados (Computação)
Análise de sentimentos
Data mining
Sentiment analysis
title_short Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC
title_full Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC
title_fullStr Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC
title_full_unstemmed Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC
title_sort Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes : análise da repercussão gerada pelos relatórios do IPCC
author Souza, Beatriz Vilas Boas Spaggiari, 1997-
author_facet Souza, Beatriz Vilas Boas Spaggiari, 1997-
author_role author
dc.contributor.none.fl_str_mv Duarte, Leonardo Tomazeli, 1982-
Torezzan, Cristiano
Suyama, Ricardo
Universidade Estadual de Campinas. Faculdade de Ciências Aplicadas
Programa de Pós-Graduação em Engenharia de Produção e de Manufatura
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Souza, Beatriz Vilas Boas Spaggiari, 1997-
dc.subject.por.fl_str_mv Mineração de dados (Computação)
Análise de sentimentos
Data mining
Sentiment analysis
topic Mineração de dados (Computação)
Análise de sentimentos
Data mining
Sentiment analysis
description Orientadores: Leonardo Tomazeli Duarte, Priscila Pereira Coltri
publishDate 2022
dc.date.none.fl_str_mv 2022
2022-12-06T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/10053
SOUZA, Beatriz Vilas Boas Spaggiari. Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes: análise da repercussão gerada pelos relatórios do IPCC. 2022. 1 recurso online (86 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciências Aplicadas, Limeira, SP. Disponível em: https://hdl.handle.net/20.500.12733/10053. Acesso em: 15 mai. 2024.
url https://hdl.handle.net/20.500.12733/10053
identifier_str_mv SOUZA, Beatriz Vilas Boas Spaggiari. Um estudo sobre modelagem de tópicos baseado em fatoração não negativa de matrizes: análise da repercussão gerada pelos relatórios do IPCC. 2022. 1 recurso online (86 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciências Aplicadas, Limeira, SP. Disponível em: https://hdl.handle.net/20.500.12733/10053. Acesso em: 15 mai. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1313375
Requisitos do sistema: Software para leitura de arquivo em PDF
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
1 recurso online (86 p.) : il., digital, arquivo PDF.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1799138578619432960