Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual

Detalhes bibliográficos
Autor(a) principal: Becker, Willian Eduardo
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo: http://tede2.pucrs.br/tede2/handle/tede/8269
Resumo: Nowadays, the use of social media has become a daily activity of our society. The huge and uninterrupt flow of information in these spaces opens up the possibility of exploring this data in different ways. Sentiment Analysis (SA) is a task that aims to obtain knowledge about the polarity of a given text relying on several techniques of Natural Language Processing, with most of solutions dealing with only one language at a time. However, approaches that are not restricted to explore only one language are more related to extract the whole knowledge and possibilities of these data. Recent approaches based on Machine Learning propose to solve SA by using mainly Deep Learning Neural Networks have obtained good results in this task. In this work is proposed three Convolutional Neural Network architectures that deal with multilingual Twitter data of four languages. The first and second proposed models are characterized by the fact they require substantially less learnable parameters than other considered baselines while are more accurate than several other Deep Neural architectures. The third proposed model is able to perform a multitask classification by identifying the polarity of a given sentences and also its language. This model reaches an accuracy of 74.43% for SA and 98.40% for Language Identification in the four-language multilingual dataset. Results confirm that proposed model is the best choice for both sentiment and language classification by outperforming the considered baselines.
id P_RS_9e0fac3be4aaccfcb9399bed520719ad
oai_identifier_str oai:tede2.pucrs.br:tede/8269
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Barros, Rodrigo Coelhohttp://lattes.cnpq.br/8172124241767828http://lattes.cnpq.br/2402939756131967Becker, Willian Eduardo2018-09-04T14:57:29Z2017-11-24http://tede2.pucrs.br/tede2/handle/tede/8269Nowadays, the use of social media has become a daily activity of our society. The huge and uninterrupt flow of information in these spaces opens up the possibility of exploring this data in different ways. Sentiment Analysis (SA) is a task that aims to obtain knowledge about the polarity of a given text relying on several techniques of Natural Language Processing, with most of solutions dealing with only one language at a time. However, approaches that are not restricted to explore only one language are more related to extract the whole knowledge and possibilities of these data. Recent approaches based on Machine Learning propose to solve SA by using mainly Deep Learning Neural Networks have obtained good results in this task. In this work is proposed three Convolutional Neural Network architectures that deal with multilingual Twitter data of four languages. The first and second proposed models are characterized by the fact they require substantially less learnable parameters than other considered baselines while are more accurate than several other Deep Neural architectures. The third proposed model is able to perform a multitask classification by identifying the polarity of a given sentences and also its language. This model reaches an accuracy of 74.43% for SA and 98.40% for Language Identification in the four-language multilingual dataset. Results confirm that proposed model is the best choice for both sentiment and language classification by outperforming the considered baselines.A utilização de redes sociais tornou-se uma atividade cotidiana na sociedade atual. Com o enorme, e ininterrupto, fluxo de informações geradas nestes espaços, abre-se a possibilidade de explorar estes dados de diversas formas. A Análise de Sentimento (AS) é uma tarefa que visa obter conhecimento sobre a polaridade das mensagens postadas, através de diversas técnicas de Processamento de Linguagem Natural, onde a maioria das soluções lida com somente um idioma de cada vez. Entretanto, abordagens que não restringem se a explorar somente uma língua, estão mais próximas de extraírem todo o conhecimento e possibilidades destes dados. Abordagens recentes baseadas em Aprendizado de Máquina propõem-se a resolver a AS apoiando-se principalmente nas Redes Neurais Profundas (Deep Learning), as quais obtiveram bons resultados nesta tarefa. Neste trabalho são propostas três arquiteturas de Redes Neurais Convolucionais que lidam com dados multi-linguais extraídos do Twitter contendo quatro línguas. Os dois primeiros modelos propostos caracterizam-se pelo fato de possuírem um total de parâmetros muito menor que os demais baselines considerados, e ainda assim, obtêm resultados superiores com uma boa margem de diferença. O último modelo proposto é capaz de realizar uma classificação multitarefa, identificando a polaridade das sentenças e também a língua. Com este último modelo obtém-se uma acurácia de 74.43% para AS e 98.40% para Identificação da Língua em um dataset com quatro línguas, mostrando-se a melhor escolha entre todos os baselines analisados.Submitted by PPG Ciência da Computação (ppgcc@pucrs.br) on 2018-09-03T14:11:33Z No. of bitstreams: 1 WILLIAN EDUARDO BECKER_DIS.pdf: 2142751 bytes, checksum: e6501a586bb81f7cbad7fa5ef35d32f2 (MD5)Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2018-09-04T14:43:25Z (GMT) No. of bitstreams: 1 WILLIAN EDUARDO BECKER_DIS.pdf: 2142751 bytes, checksum: e6501a586bb81f7cbad7fa5ef35d32f2 (MD5)Made available in DSpace on 2018-09-04T14:57:29Z (GMT). No. of bitstreams: 1 WILLIAN EDUARDO BECKER_DIS.pdf: 2142751 bytes, checksum: e6501a586bb81f7cbad7fa5ef35d32f2 (MD5) Previous issue date: 2017-11-24application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/173127/WILLIAN%20EDUARDO%20BECKER_DIS.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBrasilEscola PolitécnicaRedes Neurais ConvolucionaisInteligência ArtificialAnálise de SentimentoAprendizado ProfundoPLNConvolutional Neural NetworksArtificial IntelligenceSentiment AnalysisDeep LearningNLPCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOUma abordagem de redes neurais convolucionais para análise de sentimento multi-lingualinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTrabalho não apresenta restrição para publicação1974996533081274470500500-862078257083325301info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILWILLIAN EDUARDO BECKER_DIS.pdf.jpgWILLIAN EDUARDO BECKER_DIS.pdf.jpgimage/jpeg5119http://tede2.pucrs.br/tede2/bitstream/tede/8269/4/WILLIAN+EDUARDO+BECKER_DIS.pdf.jpg6df97dfaf0281309b7b3ca99cd363457MD54TEXTWILLIAN EDUARDO BECKER_DIS.pdf.txtWILLIAN EDUARDO BECKER_DIS.pdf.txttext/plain187541http://tede2.pucrs.br/tede2/bitstream/tede/8269/3/WILLIAN+EDUARDO+BECKER_DIS.pdf.txt206483680c302f2060b6a9d2e80ee3beMD53ORIGINALWILLIAN EDUARDO BECKER_DIS.pdfWILLIAN EDUARDO BECKER_DIS.pdfapplication/pdf2142751http://tede2.pucrs.br/tede2/bitstream/tede/8269/2/WILLIAN+EDUARDO+BECKER_DIS.pdfe6501a586bb81f7cbad7fa5ef35d32f2MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8610http://tede2.pucrs.br/tede2/bitstream/tede/8269/1/license.txt5a9d6006225b368ef605ba16b4f6d1beMD51tede/82692018-09-04 12:01:16.045oai:tede2.pucrs.br:tede/8269QXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBFbGV0csO0bmljYTogQ29tIGJhc2Ugbm8gZGlzcG9zdG8gbmEgTGVpIEZlZGVyYWwgbsK6OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYcOnw6NvIGVsZXRyw7RuaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWbDrWNpYSBVbml2ZXJzaWRhZGUgQ2F0w7NsaWNhIGRvIFJpbyBHcmFuZGUgZG8gU3VsLCBzZWRpYWRhIGEgQXYuIElwaXJhbmdhIDY2ODEsIFBvcnRvIEFsZWdyZSwgUmlvIEdyYW5kZSBkbyBTdWwsIGNvbSByZWdpc3RybyBkZSBDTlBKIDg4NjMwNDEzMDAwMi04MSBiZW0gY29tbyBlbSBvdXRyYXMgYmlibGlvdGVjYXMgZGlnaXRhaXMsIG5hY2lvbmFpcyBlIGludGVybmFjaW9uYWlzLCBjb25zw7NyY2lvcyBlIHJlZGVzIMOgcyBxdWFpcyBhIGJpYmxpb3RlY2EgZGEgUFVDUlMgcG9zc2EgYSB2aXIgcGFydGljaXBhciwgc2VtIMO0bnVzIGFsdXNpdm8gYW9zIGRpcmVpdG9zIGF1dG9yYWlzLCBhIHTDrXR1bG8gZGUgZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EuCg==Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2018-09-04T15:01:16Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
title Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
spellingShingle Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
Becker, Willian Eduardo
Redes Neurais Convolucionais
Inteligência Artificial
Análise de Sentimento
Aprendizado Profundo
PLN
Convolutional Neural Networks
Artificial Intelligence
Sentiment Analysis
Deep Learning
NLP
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
title_full Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
title_fullStr Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
title_full_unstemmed Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
title_sort Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
author Becker, Willian Eduardo
author_facet Becker, Willian Eduardo
author_role author
dc.contributor.advisor1.fl_str_mv Barros, Rodrigo Coelho
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8172124241767828
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/2402939756131967
dc.contributor.author.fl_str_mv Becker, Willian Eduardo
contributor_str_mv Barros, Rodrigo Coelho
dc.subject.por.fl_str_mv Redes Neurais Convolucionais
Inteligência Artificial
Análise de Sentimento
Aprendizado Profundo
PLN
topic Redes Neurais Convolucionais
Inteligência Artificial
Análise de Sentimento
Aprendizado Profundo
PLN
Convolutional Neural Networks
Artificial Intelligence
Sentiment Analysis
Deep Learning
NLP
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Convolutional Neural Networks
Artificial Intelligence
Sentiment Analysis
Deep Learning
NLP
dc.subject.cnpq.fl_str_mv CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description Nowadays, the use of social media has become a daily activity of our society. The huge and uninterrupt flow of information in these spaces opens up the possibility of exploring this data in different ways. Sentiment Analysis (SA) is a task that aims to obtain knowledge about the polarity of a given text relying on several techniques of Natural Language Processing, with most of solutions dealing with only one language at a time. However, approaches that are not restricted to explore only one language are more related to extract the whole knowledge and possibilities of these data. Recent approaches based on Machine Learning propose to solve SA by using mainly Deep Learning Neural Networks have obtained good results in this task. In this work is proposed three Convolutional Neural Network architectures that deal with multilingual Twitter data of four languages. The first and second proposed models are characterized by the fact they require substantially less learnable parameters than other considered baselines while are more accurate than several other Deep Neural architectures. The third proposed model is able to perform a multitask classification by identifying the polarity of a given sentences and also its language. This model reaches an accuracy of 74.43% for SA and 98.40% for Language Identification in the four-language multilingual dataset. Results confirm that proposed model is the best choice for both sentiment and language classification by outperforming the considered baselines.
publishDate 2017
dc.date.issued.fl_str_mv 2017-11-24
dc.date.accessioned.fl_str_mv 2018-09-04T14:57:29Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/8269
url http://tede2.pucrs.br/tede2/handle/tede/8269
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 1974996533081274470
dc.relation.confidence.fl_str_mv 500
500
dc.relation.cnpq.fl_str_mv -862078257083325301
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Escola Politécnica
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/8269/4/WILLIAN+EDUARDO+BECKER_DIS.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/8269/3/WILLIAN+EDUARDO+BECKER_DIS.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/8269/2/WILLIAN+EDUARDO+BECKER_DIS.pdf
http://tede2.pucrs.br/tede2/bitstream/tede/8269/1/license.txt
bitstream.checksum.fl_str_mv 6df97dfaf0281309b7b3ca99cd363457
206483680c302f2060b6a9d2e80ee3be
e6501a586bb81f7cbad7fa5ef35d32f2
5a9d6006225b368ef605ba16b4f6d1be
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765335771971584