Uma abordagem sistêmico-funcional da Análise de Sentimentos em português brasileiro orientada para aplicações multilíngues

Detalhes bibliográficos
Autor(a) principal: Julia Santos Nunes Rodrigues
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/LETR-AX2HPS
Resumo: Esta dissertação introduz uma abordagem sistêmico-funcional (HALLIDAY; MATTHIESSEN, 2014) para a Análise de Sentimentos em português brasileiro. A pesquisa buscou examinar padrões gramaticais que podem ser associados à caracterização das emoções na linguagem. Para tal fim, foi utilizada uma amostra de um corpus de linhas finas de notícias escritas em português brasileiro, compiladas previamente por pesquisadores da PUC/PR e anotadas por professores do ensino superior com experiência em linguística da PUC/PR e da Universidade Tecnológica Federal do Paraná (UTFPR) com categorias correspondentes às emoções humanas definidas por Ekman (1970) Tristeza, Repugnância, Medo, Raiva, Neutro, Alegria e Surpresa. A amostra foi segmentada em orações, as quais foram anotadas manualmente de acordo com as categorias relativas aos sistemas de cada uma das Metafunções da linguagem Interpessoal, Ideacional e Textual como estabelecidas por Halliday e Matthiessen (2014). Dois scripts foram desenvolvidos no software e ambiente computacional R (R CORE TEAM, 2018), o primeiro destinado à identificação de padrões gramaticais nas orações anotadas e o segundo à análise de agrupamento das categorias correspondentes às emoções humanas, realizada com base nos sistemas gramaticais selecionados para as orações anotadas. Os resultados obtidos por meio do primeiro script evidenciaram que há sistemas gramaticais que apresentaram maior potencial para caracterizar as categorias correspondentes às emoções. O sistema da Transitividade foi um dos sistemas anotados que mais contribuiu para essa caracterização. O sistema de Dêixis e a presença ou ausência de Complementos e/ou Adjuntos também tiveram impacto sob essa caracterização. Ainda, o Tema Ideacional e o Tema Textual apresentaram resultados que auxiliaram essa caracterização. Foram observados sistemas que não apresentaram potencial para caracterizar as categorias correspondentes às emoções, como os sistemas de Sujeitabilidade: Número e Sujeitabilidade: Pressuposição, no escopo da Metafunção Interpessoal, e o sistema de Tema Interpessoal no escopo da Metafunção Textual, uma vez que os resultados obtidos apontaram escolhas predominantes para a maior parte das orações anotadas. Os resultados encontrados através do segundo script mostraram que as configurações obtidas para as categorias correspondentes às emoções Alegria e Surpresa são consideradas gramaticalmente semelhantes. As categorias correspondentes às emoções Tristeza e Repugnância apresentaram configurações gramaticais diferentes por formarem um agrupamento isolado das outras categorias correspondentes às demais emoções. Os resultados encontrados a partir da anotação das orações pertencentes às categorias correspondentes à emoção Medo, à ausência de emoção, Neutro e, por último, à Raiva são considerados gramaticalmente similares aos obtidos para as categorias correspondentes às emoções que se agruparam primeiro Alegria e Surpresa. O impacto deste trabalho diz respeito ao potencial da metodologia com base gramatical para aplicações multilíngues proposta neste estudo, a qual pode beneficiar as pesquisas que lidam com a Análise de Sentimentos, uma vez que os padrões encontrados podem subsidiar o desenvolvimento de um algoritmo para aprendizado de máquina.
id UFMG_24d192ec51823e90a26d072ed84d9c77
oai_identifier_str oai:repositorio.ufmg.br:1843/LETR-AX2HPS
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Adriana Silvina PaganoHeloisa de Carvalho TorresLeonardo Pereira NunesKelen Cristina Sant Anna de LimaJulia Santos Nunes Rodrigues2019-08-13T12:47:21Z2019-08-13T12:47:21Z2018-02-09http://hdl.handle.net/1843/LETR-AX2HPSEsta dissertação introduz uma abordagem sistêmico-funcional (HALLIDAY; MATTHIESSEN, 2014) para a Análise de Sentimentos em português brasileiro. A pesquisa buscou examinar padrões gramaticais que podem ser associados à caracterização das emoções na linguagem. Para tal fim, foi utilizada uma amostra de um corpus de linhas finas de notícias escritas em português brasileiro, compiladas previamente por pesquisadores da PUC/PR e anotadas por professores do ensino superior com experiência em linguística da PUC/PR e da Universidade Tecnológica Federal do Paraná (UTFPR) com categorias correspondentes às emoções humanas definidas por Ekman (1970) Tristeza, Repugnância, Medo, Raiva, Neutro, Alegria e Surpresa. A amostra foi segmentada em orações, as quais foram anotadas manualmente de acordo com as categorias relativas aos sistemas de cada uma das Metafunções da linguagem Interpessoal, Ideacional e Textual como estabelecidas por Halliday e Matthiessen (2014). Dois scripts foram desenvolvidos no software e ambiente computacional R (R CORE TEAM, 2018), o primeiro destinado à identificação de padrões gramaticais nas orações anotadas e o segundo à análise de agrupamento das categorias correspondentes às emoções humanas, realizada com base nos sistemas gramaticais selecionados para as orações anotadas. Os resultados obtidos por meio do primeiro script evidenciaram que há sistemas gramaticais que apresentaram maior potencial para caracterizar as categorias correspondentes às emoções. O sistema da Transitividade foi um dos sistemas anotados que mais contribuiu para essa caracterização. O sistema de Dêixis e a presença ou ausência de Complementos e/ou Adjuntos também tiveram impacto sob essa caracterização. Ainda, o Tema Ideacional e o Tema Textual apresentaram resultados que auxiliaram essa caracterização. Foram observados sistemas que não apresentaram potencial para caracterizar as categorias correspondentes às emoções, como os sistemas de Sujeitabilidade: Número e Sujeitabilidade: Pressuposição, no escopo da Metafunção Interpessoal, e o sistema de Tema Interpessoal no escopo da Metafunção Textual, uma vez que os resultados obtidos apontaram escolhas predominantes para a maior parte das orações anotadas. Os resultados encontrados através do segundo script mostraram que as configurações obtidas para as categorias correspondentes às emoções Alegria e Surpresa são consideradas gramaticalmente semelhantes. As categorias correspondentes às emoções Tristeza e Repugnância apresentaram configurações gramaticais diferentes por formarem um agrupamento isolado das outras categorias correspondentes às demais emoções. Os resultados encontrados a partir da anotação das orações pertencentes às categorias correspondentes à emoção Medo, à ausência de emoção, Neutro e, por último, à Raiva são considerados gramaticalmente similares aos obtidos para as categorias correspondentes às emoções que se agruparam primeiro Alegria e Surpresa. O impacto deste trabalho diz respeito ao potencial da metodologia com base gramatical para aplicações multilíngues proposta neste estudo, a qual pode beneficiar as pesquisas que lidam com a Análise de Sentimentos, uma vez que os padrões encontrados podem subsidiar o desenvolvimento de um algoritmo para aprendizado de máquina.This thesis introduces a systemic-functional approach (HALLIDAY; MATTHIESSEN, 2014) to Sentiment Analysis in Brazilian Portuguese. It focuses on grammatical patterns that can be associated with characterization of emotions in language. The text sample herein analyzed was retrieved from a corpus of sub headlines of newspaper articles written in Brazilian Portuguese, previously compiled by researchers at PURC/PR and annotated with categories naming emotions as defined by Ekman (1970), namely Sadness, Disgust, Fear, Anger, Neutral, Happiness, and Surprise, by language lecturers at PUC/PR and Federal University of Technology Paraná (UTFPR). The sample was segmented into clauses, which were manually annotated according to grammatical categories pertaining to the three language Metafunctions Interpersonal, Ideational, and Textual as established by Halliday e Matthiessen (2014). Two scripts were developed within the R software and environment (R CORE TEAM, 2018), the first one designed for identification of grammatical patterns in annotated clauses and the second one for cluster analysis of categories naming emotions based on selected categories for each group of annotated clauses. The first script yielded results showing grammatical systems potentially useful to characterize categories naming emotions. The Transitivity system was one of the annotated systems that contributed the most to characterization of categories naming emotions. The system of Deixis and presence or absence of Complements and/or Adjuncts had impact on characterization of categories naming emotions as well. Ideational Theme and Textual Theme pointed out results that also supported characterization of categories naming emotions. There were systems that did not show potential to characterize these categories naming emotions, as the systems of Subject Number and Subject Presumption pertaining to the Interpersonal Metafunction and the system of Interpersonal Theme regarding the Textual Metafunction, as these systems presented predominant choices to most of the annotated clauses. Results yielded by the second script showed that configurations obtained for categories corresponding to emotions of Happiness and Surprise were grammatically similar. Categories corresponding to emotions of Sadness and Disgust had different configurations in comparison to categories that corresponded to other emotions, because they composed an isolated group. Results obtained for category corresponding to emotion of Fear, for category corresponding to absence of emotion, Neutral, and, finally, for category corresponding to emotion of Anger were grammatically similar to those obtained for categories corresponding to emotions that formed the first group Happiness and Surprise. The impact of this study has to do with potential multilingual applications of the grammatical approach herein proposed, which may enhance research on Sentiment Analysis, since grammatical patterns can be useful to support the development of an algorithm for machine learning.Universidade Federal de Minas GeraisUFMGFuncionalismo (Linguística)Traduções Estudo e ensinoLíngua portuguesa GramáticaTradução e interpretaçãoLinguística Sistêmico-Funcionalpadrões gramaticaisAnálise de Sentimentostexto jornalísticoUma abordagem sistêmico-funcional da Análise de Sentimentos em português brasileiro orientada para aplicações multilínguesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINAL1884m.pdfapplication/pdf2453647https://repositorio.ufmg.br/bitstream/1843/LETR-AX2HPS/1/1884m.pdfb019f30d76b8d40b19c32b373c74844eMD51TEXT1884m.pdf.txt1884m.pdf.txtExtracted texttext/plain392444https://repositorio.ufmg.br/bitstream/1843/LETR-AX2HPS/2/1884m.pdf.txt104d07e774994eaf2a27636086ad3801MD521843/LETR-AX2HPS2019-11-14 23:01:48.306oai:repositorio.ufmg.br:1843/LETR-AX2HPSRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-15T02:01:48Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Uma abordagem sistêmico-funcional da Análise de Sentimentos em português brasileiro orientada para aplicações multilíngues
title Uma abordagem sistêmico-funcional da Análise de Sentimentos em português brasileiro orientada para aplicações multilíngues
spellingShingle Uma abordagem sistêmico-funcional da Análise de Sentimentos em português brasileiro orientada para aplicações multilíngues
Julia Santos Nunes Rodrigues
Linguística Sistêmico-Funcional
padrões gramaticais
Análise de Sentimentos
texto jornalístico
Funcionalismo (Linguística)
Traduções Estudo e ensino
Língua portuguesa Gramática
Tradução e interpretação
title_short Uma abordagem sistêmico-funcional da Análise de Sentimentos em português brasileiro orientada para aplicações multilíngues
title_full Uma abordagem sistêmico-funcional da Análise de Sentimentos em português brasileiro orientada para aplicações multilíngues
title_fullStr Uma abordagem sistêmico-funcional da Análise de Sentimentos em português brasileiro orientada para aplicações multilíngues
title_full_unstemmed Uma abordagem sistêmico-funcional da Análise de Sentimentos em português brasileiro orientada para aplicações multilíngues
title_sort Uma abordagem sistêmico-funcional da Análise de Sentimentos em português brasileiro orientada para aplicações multilíngues
author Julia Santos Nunes Rodrigues
author_facet Julia Santos Nunes Rodrigues
author_role author
dc.contributor.advisor1.fl_str_mv Adriana Silvina Pagano
dc.contributor.advisor-co1.fl_str_mv Heloisa de Carvalho Torres
dc.contributor.referee1.fl_str_mv Leonardo Pereira Nunes
dc.contributor.referee2.fl_str_mv Kelen Cristina Sant Anna de Lima
dc.contributor.author.fl_str_mv Julia Santos Nunes Rodrigues
contributor_str_mv Adriana Silvina Pagano
Heloisa de Carvalho Torres
Leonardo Pereira Nunes
Kelen Cristina Sant Anna de Lima
dc.subject.por.fl_str_mv Linguística Sistêmico-Funcional
padrões gramaticais
Análise de Sentimentos
texto jornalístico
topic Linguística Sistêmico-Funcional
padrões gramaticais
Análise de Sentimentos
texto jornalístico
Funcionalismo (Linguística)
Traduções Estudo e ensino
Língua portuguesa Gramática
Tradução e interpretação
dc.subject.other.pt_BR.fl_str_mv Funcionalismo (Linguística)
Traduções Estudo e ensino
Língua portuguesa Gramática
Tradução e interpretação
description Esta dissertação introduz uma abordagem sistêmico-funcional (HALLIDAY; MATTHIESSEN, 2014) para a Análise de Sentimentos em português brasileiro. A pesquisa buscou examinar padrões gramaticais que podem ser associados à caracterização das emoções na linguagem. Para tal fim, foi utilizada uma amostra de um corpus de linhas finas de notícias escritas em português brasileiro, compiladas previamente por pesquisadores da PUC/PR e anotadas por professores do ensino superior com experiência em linguística da PUC/PR e da Universidade Tecnológica Federal do Paraná (UTFPR) com categorias correspondentes às emoções humanas definidas por Ekman (1970) Tristeza, Repugnância, Medo, Raiva, Neutro, Alegria e Surpresa. A amostra foi segmentada em orações, as quais foram anotadas manualmente de acordo com as categorias relativas aos sistemas de cada uma das Metafunções da linguagem Interpessoal, Ideacional e Textual como estabelecidas por Halliday e Matthiessen (2014). Dois scripts foram desenvolvidos no software e ambiente computacional R (R CORE TEAM, 2018), o primeiro destinado à identificação de padrões gramaticais nas orações anotadas e o segundo à análise de agrupamento das categorias correspondentes às emoções humanas, realizada com base nos sistemas gramaticais selecionados para as orações anotadas. Os resultados obtidos por meio do primeiro script evidenciaram que há sistemas gramaticais que apresentaram maior potencial para caracterizar as categorias correspondentes às emoções. O sistema da Transitividade foi um dos sistemas anotados que mais contribuiu para essa caracterização. O sistema de Dêixis e a presença ou ausência de Complementos e/ou Adjuntos também tiveram impacto sob essa caracterização. Ainda, o Tema Ideacional e o Tema Textual apresentaram resultados que auxiliaram essa caracterização. Foram observados sistemas que não apresentaram potencial para caracterizar as categorias correspondentes às emoções, como os sistemas de Sujeitabilidade: Número e Sujeitabilidade: Pressuposição, no escopo da Metafunção Interpessoal, e o sistema de Tema Interpessoal no escopo da Metafunção Textual, uma vez que os resultados obtidos apontaram escolhas predominantes para a maior parte das orações anotadas. Os resultados encontrados através do segundo script mostraram que as configurações obtidas para as categorias correspondentes às emoções Alegria e Surpresa são consideradas gramaticalmente semelhantes. As categorias correspondentes às emoções Tristeza e Repugnância apresentaram configurações gramaticais diferentes por formarem um agrupamento isolado das outras categorias correspondentes às demais emoções. Os resultados encontrados a partir da anotação das orações pertencentes às categorias correspondentes à emoção Medo, à ausência de emoção, Neutro e, por último, à Raiva são considerados gramaticalmente similares aos obtidos para as categorias correspondentes às emoções que se agruparam primeiro Alegria e Surpresa. O impacto deste trabalho diz respeito ao potencial da metodologia com base gramatical para aplicações multilíngues proposta neste estudo, a qual pode beneficiar as pesquisas que lidam com a Análise de Sentimentos, uma vez que os padrões encontrados podem subsidiar o desenvolvimento de um algoritmo para aprendizado de máquina.
publishDate 2018
dc.date.issued.fl_str_mv 2018-02-09
dc.date.accessioned.fl_str_mv 2019-08-13T12:47:21Z
dc.date.available.fl_str_mv 2019-08-13T12:47:21Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/LETR-AX2HPS
url http://hdl.handle.net/1843/LETR-AX2HPS
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/LETR-AX2HPS/1/1884m.pdf
https://repositorio.ufmg.br/bitstream/1843/LETR-AX2HPS/2/1884m.pdf.txt
bitstream.checksum.fl_str_mv b019f30d76b8d40b19c32b373c74844e
104d07e774994eaf2a27636086ad3801
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589479196262400