Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da PUC_RS |
Texto Completo: | http://tede2.pucrs.br/tede2/handle/tede/8269 |
Resumo: | Nowadays, the use of social media has become a daily activity of our society. The huge and uninterrupt flow of information in these spaces opens up the possibility of exploring this data in different ways. Sentiment Analysis (SA) is a task that aims to obtain knowledge about the polarity of a given text relying on several techniques of Natural Language Processing, with most of solutions dealing with only one language at a time. However, approaches that are not restricted to explore only one language are more related to extract the whole knowledge and possibilities of these data. Recent approaches based on Machine Learning propose to solve SA by using mainly Deep Learning Neural Networks have obtained good results in this task. In this work is proposed three Convolutional Neural Network architectures that deal with multilingual Twitter data of four languages. The first and second proposed models are characterized by the fact they require substantially less learnable parameters than other considered baselines while are more accurate than several other Deep Neural architectures. The third proposed model is able to perform a multitask classification by identifying the polarity of a given sentences and also its language. This model reaches an accuracy of 74.43% for SA and 98.40% for Language Identification in the four-language multilingual dataset. Results confirm that proposed model is the best choice for both sentiment and language classification by outperforming the considered baselines. |
id |
P_RS_9e0fac3be4aaccfcb9399bed520719ad |
---|---|
oai_identifier_str |
oai:tede2.pucrs.br:tede/8269 |
network_acronym_str |
P_RS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
repository_id_str |
|
spelling |
Barros, Rodrigo Coelhohttp://lattes.cnpq.br/8172124241767828http://lattes.cnpq.br/2402939756131967Becker, Willian Eduardo2018-09-04T14:57:29Z2017-11-24http://tede2.pucrs.br/tede2/handle/tede/8269Nowadays, the use of social media has become a daily activity of our society. The huge and uninterrupt flow of information in these spaces opens up the possibility of exploring this data in different ways. Sentiment Analysis (SA) is a task that aims to obtain knowledge about the polarity of a given text relying on several techniques of Natural Language Processing, with most of solutions dealing with only one language at a time. However, approaches that are not restricted to explore only one language are more related to extract the whole knowledge and possibilities of these data. Recent approaches based on Machine Learning propose to solve SA by using mainly Deep Learning Neural Networks have obtained good results in this task. In this work is proposed three Convolutional Neural Network architectures that deal with multilingual Twitter data of four languages. The first and second proposed models are characterized by the fact they require substantially less learnable parameters than other considered baselines while are more accurate than several other Deep Neural architectures. The third proposed model is able to perform a multitask classification by identifying the polarity of a given sentences and also its language. This model reaches an accuracy of 74.43% for SA and 98.40% for Language Identification in the four-language multilingual dataset. Results confirm that proposed model is the best choice for both sentiment and language classification by outperforming the considered baselines.A utilização de redes sociais tornou-se uma atividade cotidiana na sociedade atual. Com o enorme, e ininterrupto, fluxo de informações geradas nestes espaços, abre-se a possibilidade de explorar estes dados de diversas formas. A Análise de Sentimento (AS) é uma tarefa que visa obter conhecimento sobre a polaridade das mensagens postadas, através de diversas técnicas de Processamento de Linguagem Natural, onde a maioria das soluções lida com somente um idioma de cada vez. Entretanto, abordagens que não restringem se a explorar somente uma língua, estão mais próximas de extraírem todo o conhecimento e possibilidades destes dados. Abordagens recentes baseadas em Aprendizado de Máquina propõem-se a resolver a AS apoiando-se principalmente nas Redes Neurais Profundas (Deep Learning), as quais obtiveram bons resultados nesta tarefa. Neste trabalho são propostas três arquiteturas de Redes Neurais Convolucionais que lidam com dados multi-linguais extraídos do Twitter contendo quatro línguas. Os dois primeiros modelos propostos caracterizam-se pelo fato de possuírem um total de parâmetros muito menor que os demais baselines considerados, e ainda assim, obtêm resultados superiores com uma boa margem de diferença. O último modelo proposto é capaz de realizar uma classificação multitarefa, identificando a polaridade das sentenças e também a língua. Com este último modelo obtém-se uma acurácia de 74.43% para AS e 98.40% para Identificação da Língua em um dataset com quatro línguas, mostrando-se a melhor escolha entre todos os baselines analisados.Submitted by PPG Ciência da Computação (ppgcc@pucrs.br) on 2018-09-03T14:11:33Z No. of bitstreams: 1 WILLIAN EDUARDO BECKER_DIS.pdf: 2142751 bytes, checksum: e6501a586bb81f7cbad7fa5ef35d32f2 (MD5)Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2018-09-04T14:43:25Z (GMT) No. of bitstreams: 1 WILLIAN EDUARDO BECKER_DIS.pdf: 2142751 bytes, checksum: e6501a586bb81f7cbad7fa5ef35d32f2 (MD5)Made available in DSpace on 2018-09-04T14:57:29Z (GMT). No. of bitstreams: 1 WILLIAN EDUARDO BECKER_DIS.pdf: 2142751 bytes, checksum: e6501a586bb81f7cbad7fa5ef35d32f2 (MD5) Previous issue date: 2017-11-24application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/173127/WILLIAN%20EDUARDO%20BECKER_DIS.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBrasilEscola PolitécnicaRedes Neurais ConvolucionaisInteligência ArtificialAnálise de SentimentoAprendizado ProfundoPLNConvolutional Neural NetworksArtificial IntelligenceSentiment AnalysisDeep LearningNLPCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOUma abordagem de redes neurais convolucionais para análise de sentimento multi-lingualinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTrabalho não apresenta restrição para publicação1974996533081274470500500-862078257083325301info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILWILLIAN EDUARDO BECKER_DIS.pdf.jpgWILLIAN EDUARDO BECKER_DIS.pdf.jpgimage/jpeg5119http://tede2.pucrs.br/tede2/bitstream/tede/8269/4/WILLIAN+EDUARDO+BECKER_DIS.pdf.jpg6df97dfaf0281309b7b3ca99cd363457MD54TEXTWILLIAN EDUARDO BECKER_DIS.pdf.txtWILLIAN EDUARDO BECKER_DIS.pdf.txttext/plain187541http://tede2.pucrs.br/tede2/bitstream/tede/8269/3/WILLIAN+EDUARDO+BECKER_DIS.pdf.txt206483680c302f2060b6a9d2e80ee3beMD53ORIGINALWILLIAN EDUARDO BECKER_DIS.pdfWILLIAN EDUARDO BECKER_DIS.pdfapplication/pdf2142751http://tede2.pucrs.br/tede2/bitstream/tede/8269/2/WILLIAN+EDUARDO+BECKER_DIS.pdfe6501a586bb81f7cbad7fa5ef35d32f2MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8610http://tede2.pucrs.br/tede2/bitstream/tede/8269/1/license.txt5a9d6006225b368ef605ba16b4f6d1beMD51tede/82692018-09-04 12:01:16.045oai:tede2.pucrs.br:tede/8269QXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBFbGV0csO0bmljYTogQ29tIGJhc2Ugbm8gZGlzcG9zdG8gbmEgTGVpIEZlZGVyYWwgbsK6OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYcOnw6NvIGVsZXRyw7RuaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWbDrWNpYSBVbml2ZXJzaWRhZGUgQ2F0w7NsaWNhIGRvIFJpbyBHcmFuZGUgZG8gU3VsLCBzZWRpYWRhIGEgQXYuIElwaXJhbmdhIDY2ODEsIFBvcnRvIEFsZWdyZSwgUmlvIEdyYW5kZSBkbyBTdWwsIGNvbSByZWdpc3RybyBkZSBDTlBKIDg4NjMwNDEzMDAwMi04MSBiZW0gY29tbyBlbSBvdXRyYXMgYmlibGlvdGVjYXMgZGlnaXRhaXMsIG5hY2lvbmFpcyBlIGludGVybmFjaW9uYWlzLCBjb25zw7NyY2lvcyBlIHJlZGVzIMOgcyBxdWFpcyBhIGJpYmxpb3RlY2EgZGEgUFVDUlMgcG9zc2EgYSB2aXIgcGFydGljaXBhciwgc2VtIMO0bnVzIGFsdXNpdm8gYW9zIGRpcmVpdG9zIGF1dG9yYWlzLCBhIHTDrXR1bG8gZGUgZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EuCg==Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2018-09-04T15:01:16Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
dc.title.por.fl_str_mv |
Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual |
title |
Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual |
spellingShingle |
Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual Becker, Willian Eduardo Redes Neurais Convolucionais Inteligência Artificial Análise de Sentimento Aprendizado Profundo PLN Convolutional Neural Networks Artificial Intelligence Sentiment Analysis Deep Learning NLP CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
title_short |
Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual |
title_full |
Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual |
title_fullStr |
Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual |
title_full_unstemmed |
Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual |
title_sort |
Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual |
author |
Becker, Willian Eduardo |
author_facet |
Becker, Willian Eduardo |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Barros, Rodrigo Coelho |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/8172124241767828 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/2402939756131967 |
dc.contributor.author.fl_str_mv |
Becker, Willian Eduardo |
contributor_str_mv |
Barros, Rodrigo Coelho |
dc.subject.por.fl_str_mv |
Redes Neurais Convolucionais Inteligência Artificial Análise de Sentimento Aprendizado Profundo PLN |
topic |
Redes Neurais Convolucionais Inteligência Artificial Análise de Sentimento Aprendizado Profundo PLN Convolutional Neural Networks Artificial Intelligence Sentiment Analysis Deep Learning NLP CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Convolutional Neural Networks Artificial Intelligence Sentiment Analysis Deep Learning NLP |
dc.subject.cnpq.fl_str_mv |
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
description |
Nowadays, the use of social media has become a daily activity of our society. The huge and uninterrupt flow of information in these spaces opens up the possibility of exploring this data in different ways. Sentiment Analysis (SA) is a task that aims to obtain knowledge about the polarity of a given text relying on several techniques of Natural Language Processing, with most of solutions dealing with only one language at a time. However, approaches that are not restricted to explore only one language are more related to extract the whole knowledge and possibilities of these data. Recent approaches based on Machine Learning propose to solve SA by using mainly Deep Learning Neural Networks have obtained good results in this task. In this work is proposed three Convolutional Neural Network architectures that deal with multilingual Twitter data of four languages. The first and second proposed models are characterized by the fact they require substantially less learnable parameters than other considered baselines while are more accurate than several other Deep Neural architectures. The third proposed model is able to perform a multitask classification by identifying the polarity of a given sentences and also its language. This model reaches an accuracy of 74.43% for SA and 98.40% for Language Identification in the four-language multilingual dataset. Results confirm that proposed model is the best choice for both sentiment and language classification by outperforming the considered baselines. |
publishDate |
2017 |
dc.date.issued.fl_str_mv |
2017-11-24 |
dc.date.accessioned.fl_str_mv |
2018-09-04T14:57:29Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://tede2.pucrs.br/tede2/handle/tede/8269 |
url |
http://tede2.pucrs.br/tede2/handle/tede/8269 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.program.fl_str_mv |
1974996533081274470 |
dc.relation.confidence.fl_str_mv |
500 500 |
dc.relation.cnpq.fl_str_mv |
-862078257083325301 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
PUCRS |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Escola Politécnica |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
instacron_str |
PUC_RS |
institution |
PUC_RS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
bitstream.url.fl_str_mv |
http://tede2.pucrs.br/tede2/bitstream/tede/8269/4/WILLIAN+EDUARDO+BECKER_DIS.pdf.jpg http://tede2.pucrs.br/tede2/bitstream/tede/8269/3/WILLIAN+EDUARDO+BECKER_DIS.pdf.txt http://tede2.pucrs.br/tede2/bitstream/tede/8269/2/WILLIAN+EDUARDO+BECKER_DIS.pdf http://tede2.pucrs.br/tede2/bitstream/tede/8269/1/license.txt |
bitstream.checksum.fl_str_mv |
6df97dfaf0281309b7b3ca99cd363457 206483680c302f2060b6a9d2e80ee3be e6501a586bb81f7cbad7fa5ef35d32f2 5a9d6006225b368ef605ba16b4f6d1be |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
_version_ |
1799765335771971584 |