Previsão de emoções a partir de mineração de texto no Twitter
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.26/38737 |
Resumo: | As emoções tiveram um papel fundamental para a adaptação e sobrevivência humana ao longo de toda história da nossa civilização, tendo ganho mais destaque na comunicação social nos últimos tempos com a criação e avanço das redes sociais. Na área de inteligência artificial, robôs têm simulado emoções humanas e por meio da visão computacional as expressões faciais têm sido detetadas. No marketing elas se destacam ao proporcionar experiências marcantes conectando o cliente ao consumidor. Com propósito de cooperar no estudo das emoções, ainda que minimamente, esse trabalho objetivou desenvolver uma forma de identificar as emoções nos textos do Twitter, no cenário político brasileiro. Além de buscar padrões semânticos que diferenciasse as emoções, também foram aplicadas técnicas de classificação por meio de aprendizado de máquina. A metodologia adotada neste estudo foi a CRISP-DM. A investigação baseou-se nas seis emoções primárias: tristeza, raiva, surpresa, medo, nojo e alegria. O conjunto de dados constituído por 3556 tweets foi retirado do Twitter, utilizando 190 Tred Topics sobre assuntos políticos do dia 22 de junho de 2020 até o dia 24 de agosto 2020. Uma das principais contribuições deste estudo foi a forma como se fez a identificação e classificação das emoções nos textos foi desenvolvida a partir dos temas e gatilhos inatos. Alguns padrões se mostraram relevantes, como por exemplo, para raiva e nojo-desprezo onde os usuários tendem a utilizar palavras com significado de afastamento de grupo, enquanto para alegria mais palavras com sentimento de pertencimento a grupo. A precisão média do classificador foi de 75,61%. O estudo evidenciou a polarização política num sentido onde as pessoas se opuseram completamente umas contra as outras, discordando, demonstrando emoções maioritariamente pesadas, desejando o mal e até a morte umas das outras. Uma limitação importante foi a falta de mais poder computacional, limitando assim a afinação dos classificadores por meio de GridSearch. Outra limitação foi a de que alguns tweets possuíam duas emoções, como raiva e alegria, dificultado a sua classificação em uma única emoção. Algumas propostas de trabalhos futuros foram também avançadas. |
id |
RCAP_384ccc6f4f12ce1cca3984786e64d5a4 |
---|---|
oai_identifier_str |
oai:comum.rcaap.pt:10400.26/38737 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Previsão de emoções a partir de mineração de texto no TwitterMineração de textoDeteção de emoçõesGatilhos emocionaisClassificação de emoçõesTwitterPythonPLNLinear SVMPolíticaAs emoções tiveram um papel fundamental para a adaptação e sobrevivência humana ao longo de toda história da nossa civilização, tendo ganho mais destaque na comunicação social nos últimos tempos com a criação e avanço das redes sociais. Na área de inteligência artificial, robôs têm simulado emoções humanas e por meio da visão computacional as expressões faciais têm sido detetadas. No marketing elas se destacam ao proporcionar experiências marcantes conectando o cliente ao consumidor. Com propósito de cooperar no estudo das emoções, ainda que minimamente, esse trabalho objetivou desenvolver uma forma de identificar as emoções nos textos do Twitter, no cenário político brasileiro. Além de buscar padrões semânticos que diferenciasse as emoções, também foram aplicadas técnicas de classificação por meio de aprendizado de máquina. A metodologia adotada neste estudo foi a CRISP-DM. A investigação baseou-se nas seis emoções primárias: tristeza, raiva, surpresa, medo, nojo e alegria. O conjunto de dados constituído por 3556 tweets foi retirado do Twitter, utilizando 190 Tred Topics sobre assuntos políticos do dia 22 de junho de 2020 até o dia 24 de agosto 2020. Uma das principais contribuições deste estudo foi a forma como se fez a identificação e classificação das emoções nos textos foi desenvolvida a partir dos temas e gatilhos inatos. Alguns padrões se mostraram relevantes, como por exemplo, para raiva e nojo-desprezo onde os usuários tendem a utilizar palavras com significado de afastamento de grupo, enquanto para alegria mais palavras com sentimento de pertencimento a grupo. A precisão média do classificador foi de 75,61%. O estudo evidenciou a polarização política num sentido onde as pessoas se opuseram completamente umas contra as outras, discordando, demonstrando emoções maioritariamente pesadas, desejando o mal e até a morte umas das outras. Uma limitação importante foi a falta de mais poder computacional, limitando assim a afinação dos classificadores por meio de GridSearch. Outra limitação foi a de que alguns tweets possuíam duas emoções, como raiva e alegria, dificultado a sua classificação em uma única emoção. Algumas propostas de trabalhos futuros foram também avançadas.Belfo, Fernando Paulo dos Santos RodriguesRibeiro, António Rui TrigoRepositório ComumRoça, Hallan Patrick de Oliveira2022-01-10T15:57:32Z2021-01-01T00:00:00Z2021-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.26/38737202850900porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-09-05T15:41:32Zoai:comum.rcaap.pt:10400.26/38737Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T15:17:15.343779Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Previsão de emoções a partir de mineração de texto no Twitter |
title |
Previsão de emoções a partir de mineração de texto no Twitter |
spellingShingle |
Previsão de emoções a partir de mineração de texto no Twitter Roça, Hallan Patrick de Oliveira Mineração de texto Deteção de emoções Gatilhos emocionais Classificação de emoções Python PLN Linear SVM Política |
title_short |
Previsão de emoções a partir de mineração de texto no Twitter |
title_full |
Previsão de emoções a partir de mineração de texto no Twitter |
title_fullStr |
Previsão de emoções a partir de mineração de texto no Twitter |
title_full_unstemmed |
Previsão de emoções a partir de mineração de texto no Twitter |
title_sort |
Previsão de emoções a partir de mineração de texto no Twitter |
author |
Roça, Hallan Patrick de Oliveira |
author_facet |
Roça, Hallan Patrick de Oliveira |
author_role |
author |
dc.contributor.none.fl_str_mv |
Belfo, Fernando Paulo dos Santos Rodrigues Ribeiro, António Rui Trigo Repositório Comum |
dc.contributor.author.fl_str_mv |
Roça, Hallan Patrick de Oliveira |
dc.subject.por.fl_str_mv |
Mineração de texto Deteção de emoções Gatilhos emocionais Classificação de emoções Python PLN Linear SVM Política |
topic |
Mineração de texto Deteção de emoções Gatilhos emocionais Classificação de emoções Python PLN Linear SVM Política |
description |
As emoções tiveram um papel fundamental para a adaptação e sobrevivência humana ao longo de toda história da nossa civilização, tendo ganho mais destaque na comunicação social nos últimos tempos com a criação e avanço das redes sociais. Na área de inteligência artificial, robôs têm simulado emoções humanas e por meio da visão computacional as expressões faciais têm sido detetadas. No marketing elas se destacam ao proporcionar experiências marcantes conectando o cliente ao consumidor. Com propósito de cooperar no estudo das emoções, ainda que minimamente, esse trabalho objetivou desenvolver uma forma de identificar as emoções nos textos do Twitter, no cenário político brasileiro. Além de buscar padrões semânticos que diferenciasse as emoções, também foram aplicadas técnicas de classificação por meio de aprendizado de máquina. A metodologia adotada neste estudo foi a CRISP-DM. A investigação baseou-se nas seis emoções primárias: tristeza, raiva, surpresa, medo, nojo e alegria. O conjunto de dados constituído por 3556 tweets foi retirado do Twitter, utilizando 190 Tred Topics sobre assuntos políticos do dia 22 de junho de 2020 até o dia 24 de agosto 2020. Uma das principais contribuições deste estudo foi a forma como se fez a identificação e classificação das emoções nos textos foi desenvolvida a partir dos temas e gatilhos inatos. Alguns padrões se mostraram relevantes, como por exemplo, para raiva e nojo-desprezo onde os usuários tendem a utilizar palavras com significado de afastamento de grupo, enquanto para alegria mais palavras com sentimento de pertencimento a grupo. A precisão média do classificador foi de 75,61%. O estudo evidenciou a polarização política num sentido onde as pessoas se opuseram completamente umas contra as outras, discordando, demonstrando emoções maioritariamente pesadas, desejando o mal e até a morte umas das outras. Uma limitação importante foi a falta de mais poder computacional, limitando assim a afinação dos classificadores por meio de GridSearch. Outra limitação foi a de que alguns tweets possuíam duas emoções, como raiva e alegria, dificultado a sua classificação em uma única emoção. Algumas propostas de trabalhos futuros foram também avançadas. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-01-01T00:00:00Z 2021-01-01T00:00:00Z 2022-01-10T15:57:32Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.26/38737 202850900 |
url |
http://hdl.handle.net/10400.26/38737 |
identifier_str_mv |
202850900 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799130035364298752 |