Análise de sentimento baseada em aspectos usando aprendizado profundo: uma proposta aplicada à língua portuguesa
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPel - Guaiaca |
Texto Completo: | http://guaiaca.ufpel.edu.br/handle/prefix/7433 |
Resumo: | Uma grande quantidade de textos opinativos se tornou disponível publicamente com o aumento do acesso à Internet e a popularização de sistemas onde o usuário é coautor do conteúdo. Nesses textos, pode-se encontrar muitas informações valiosas, tanto para indivíduos quanto para entidades (privadas ou governamentais). No entanto, dado o grande volume de dados disponíveis, extrair informações relevantes destas fontes pode ser um desafio. A Análise de Sentimento é a área da Ciência da Computação focada em extrair de documentos os sentimentos expressos por indivíduos com relação às entidades, por exemplo, produtos ou serviços. Entretanto, embora a área venha crescendo ano a ano, há reconhecida carência de trabalhos focados na Língua Portuguesa. Quanto mais complexas as tarefas, mais difícil é encontrar soluções para o português. A Análise de Sentimento em Nível de Aspectos é uma dessas tarefas complexas, lidando com um tipo específico de análise de sentimento abordagem que realiza análises de sentimentos expressos em um nível bastante específico, buscando explicar quais aspectos (partes ou propriedades) das entidades estão despertando o sentimento descrito no texto. Este trabalho colabora para suprir essa deficiência. Neste trabalho criamos um corpus de reviews de hotéis anotados em nível de aspectos e o utilizamos para criar uma solução para o problema de Análise de Sentimento em Nível de Aspectos em textos escritos em Língua Portuguesa usando Redes Neurais Convolucionais com entradas em Nível de Caractere. Em nossos experimentos, os resultados obtidos por nossas abordagens demonstram que o método proposto possui desempenho superior aos do método estado da arte para a Língua Portuguesa, baseado em léxicos de sentimento. Também comparamos nossos resultados com um método do estado da arte para a Língua Inglesa, baseado em LSTM com mecanismos de atenção. |
id |
UFPL_0e9468140a077c09de1107f76dd9ca66 |
---|---|
oai_identifier_str |
oai:guaiaca.ufpel.edu.br:prefix/7433 |
network_acronym_str |
UFPL |
network_name_str |
Repositório Institucional da UFPel - Guaiaca |
repository_id_str |
|
spelling |
2021-05-04T22:34:09Z2021-05-04T22:34:09Z2021-03-22CORRÊA, Ulisses Brisolara. Análise de Sentimento Baseada em Aspectos Usando Aprendizado Profundo: uma Proposta Aplicada à Língua Portuguesa. Orientador: Ricardo Matsumura Araujo. 2021. 123 f. Tese (Doutorado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2021.http://guaiaca.ufpel.edu.br/handle/prefix/7433Uma grande quantidade de textos opinativos se tornou disponível publicamente com o aumento do acesso à Internet e a popularização de sistemas onde o usuário é coautor do conteúdo. Nesses textos, pode-se encontrar muitas informações valiosas, tanto para indivíduos quanto para entidades (privadas ou governamentais). No entanto, dado o grande volume de dados disponíveis, extrair informações relevantes destas fontes pode ser um desafio. A Análise de Sentimento é a área da Ciência da Computação focada em extrair de documentos os sentimentos expressos por indivíduos com relação às entidades, por exemplo, produtos ou serviços. Entretanto, embora a área venha crescendo ano a ano, há reconhecida carência de trabalhos focados na Língua Portuguesa. Quanto mais complexas as tarefas, mais difícil é encontrar soluções para o português. A Análise de Sentimento em Nível de Aspectos é uma dessas tarefas complexas, lidando com um tipo específico de análise de sentimento abordagem que realiza análises de sentimentos expressos em um nível bastante específico, buscando explicar quais aspectos (partes ou propriedades) das entidades estão despertando o sentimento descrito no texto. Este trabalho colabora para suprir essa deficiência. Neste trabalho criamos um corpus de reviews de hotéis anotados em nível de aspectos e o utilizamos para criar uma solução para o problema de Análise de Sentimento em Nível de Aspectos em textos escritos em Língua Portuguesa usando Redes Neurais Convolucionais com entradas em Nível de Caractere. Em nossos experimentos, os resultados obtidos por nossas abordagens demonstram que o método proposto possui desempenho superior aos do método estado da arte para a Língua Portuguesa, baseado em léxicos de sentimento. Também comparamos nossos resultados com um método do estado da arte para a Língua Inglesa, baseado em LSTM com mecanismos de atenção.he increase in Internet access and the popularization of User Generated Content systems make a large number of opinionated texts became publicly available. Lots of valuable information can be found in this kind of text. Individuals and entities (private or governmental) can take advantage of that information. However, it is a lot of data to be manually processed, extracting relevant information from these sources is challenging. Sentiment Analysis is the Computer Science area focused on extracting people‘s opinions towards entities, like companies or products. However, despite the growth of this area year by year, there is a recognized lack of works developed for Portuguese. This work aims to help fill this gap. We propose an approach using Character Level Convolutional Neural Networks to solve Aspect Based Sentiment Analysis (ABSA) tasks in Portuguese texts. ABSA is a type of approach that analyzes sentiment expressed at a very specific level, seeking to explain which parts or properties (aspects) of the entities are arousing the sentiment presented in the text. In this work, we created a corpus of hotel reviews with aspect-level annotations. Based on this corpus, we developed a new approach for ABSA. Obtained results demonstrate that the proposed method has superior performance than the state-of-the-art method for Portuguese. We also compared our results with an attention-based LSTM method, with state-of-the-art performance for English.Sem bolsaporUniversidade Federal de PelotasPrograma de Pós-Graduação em ComputaçãoUFPelBrasilCentro de Desenvolvimento TecnológicoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOComputaçãoAnálise de sentimento baseada em aspectosMineração de opiniãoAprendizado profundoRedes neurais convolucionais em nível de caractereAspect-based sentiment analysisOpinion miningDeep learningChar Level convolutional neural networksAnálise de sentimento baseada em aspectos usando aprendizado profundo: uma proposta aplicada à língua portuguesainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttp://lattes.cnpq.br/0011651263573884http://lattes.cnpq.br/1544604888519188Araújo, Ricardo Matsumura deCorrêa, Ulisses Brisolarainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPel - Guaiacainstname:Universidade Federal de Pelotas (UFPEL)instacron:UFPELTEXTTese_Ulisses_Brisolara_Corrêa.pdf.txtTese_Ulisses_Brisolara_Corrêa.pdf.txtExtracted texttext/plain223741http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/7433/6/Tese_Ulisses_Brisolara_Corr%c3%aaa.pdf.txt6896eb2d0d84de950895d9210c198e8bMD56open accessTHUMBNAILTese_Ulisses_Brisolara_Corrêa.pdf.jpgTese_Ulisses_Brisolara_Corrêa.pdf.jpgGenerated Thumbnailimage/jpeg1255http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/7433/7/Tese_Ulisses_Brisolara_Corr%c3%aaa.pdf.jpgbeb7eaa9a5feff7f578b88aa26aaee14MD57open accessORIGINALTese_Ulisses_Brisolara_Corrêa.pdfTese_Ulisses_Brisolara_Corrêa.pdfapplication/pdf6410241http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/7433/1/Tese_Ulisses_Brisolara_Corr%c3%aaa.pdf168fad9bf306f08a331965f818223f79MD51open accessCC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/7433/2/license_url924993ce0b3ba389f79f32a1b2735415MD52open accesslicense_textlicense_texttext/html; charset=utf-80http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/7433/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53open accesslicense_rdflicense_rdfapplication/rdf+xml; charset=utf-80http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/7433/4/license_rdfd41d8cd98f00b204e9800998ecf8427eMD54open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-81866http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/7433/5/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD55open accessprefix/74332023-07-13 05:24:52.746open accessoai:guaiaca.ufpel.edu.br:prefix/7433TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório InstitucionalPUBhttp://repositorio.ufpel.edu.br/oai/requestrippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.bropendoar:2023-07-13T08:24:52Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)false |
dc.title.pt_BR.fl_str_mv |
Análise de sentimento baseada em aspectos usando aprendizado profundo: uma proposta aplicada à língua portuguesa |
title |
Análise de sentimento baseada em aspectos usando aprendizado profundo: uma proposta aplicada à língua portuguesa |
spellingShingle |
Análise de sentimento baseada em aspectos usando aprendizado profundo: uma proposta aplicada à língua portuguesa Corrêa, Ulisses Brisolara CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Computação Análise de sentimento baseada em aspectos Mineração de opinião Aprendizado profundo Redes neurais convolucionais em nível de caractere Aspect-based sentiment analysis Opinion mining Deep learning Char Level convolutional neural networks |
title_short |
Análise de sentimento baseada em aspectos usando aprendizado profundo: uma proposta aplicada à língua portuguesa |
title_full |
Análise de sentimento baseada em aspectos usando aprendizado profundo: uma proposta aplicada à língua portuguesa |
title_fullStr |
Análise de sentimento baseada em aspectos usando aprendizado profundo: uma proposta aplicada à língua portuguesa |
title_full_unstemmed |
Análise de sentimento baseada em aspectos usando aprendizado profundo: uma proposta aplicada à língua portuguesa |
title_sort |
Análise de sentimento baseada em aspectos usando aprendizado profundo: uma proposta aplicada à língua portuguesa |
author |
Corrêa, Ulisses Brisolara |
author_facet |
Corrêa, Ulisses Brisolara |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/0011651263573884 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/1544604888519188 |
dc.contributor.advisor1.fl_str_mv |
Araújo, Ricardo Matsumura de |
dc.contributor.author.fl_str_mv |
Corrêa, Ulisses Brisolara |
contributor_str_mv |
Araújo, Ricardo Matsumura de |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Computação Análise de sentimento baseada em aspectos Mineração de opinião Aprendizado profundo Redes neurais convolucionais em nível de caractere Aspect-based sentiment analysis Opinion mining Deep learning Char Level convolutional neural networks |
dc.subject.por.fl_str_mv |
Computação Análise de sentimento baseada em aspectos Mineração de opinião Aprendizado profundo Redes neurais convolucionais em nível de caractere Aspect-based sentiment analysis Opinion mining Deep learning Char Level convolutional neural networks |
description |
Uma grande quantidade de textos opinativos se tornou disponível publicamente com o aumento do acesso à Internet e a popularização de sistemas onde o usuário é coautor do conteúdo. Nesses textos, pode-se encontrar muitas informações valiosas, tanto para indivíduos quanto para entidades (privadas ou governamentais). No entanto, dado o grande volume de dados disponíveis, extrair informações relevantes destas fontes pode ser um desafio. A Análise de Sentimento é a área da Ciência da Computação focada em extrair de documentos os sentimentos expressos por indivíduos com relação às entidades, por exemplo, produtos ou serviços. Entretanto, embora a área venha crescendo ano a ano, há reconhecida carência de trabalhos focados na Língua Portuguesa. Quanto mais complexas as tarefas, mais difícil é encontrar soluções para o português. A Análise de Sentimento em Nível de Aspectos é uma dessas tarefas complexas, lidando com um tipo específico de análise de sentimento abordagem que realiza análises de sentimentos expressos em um nível bastante específico, buscando explicar quais aspectos (partes ou propriedades) das entidades estão despertando o sentimento descrito no texto. Este trabalho colabora para suprir essa deficiência. Neste trabalho criamos um corpus de reviews de hotéis anotados em nível de aspectos e o utilizamos para criar uma solução para o problema de Análise de Sentimento em Nível de Aspectos em textos escritos em Língua Portuguesa usando Redes Neurais Convolucionais com entradas em Nível de Caractere. Em nossos experimentos, os resultados obtidos por nossas abordagens demonstram que o método proposto possui desempenho superior aos do método estado da arte para a Língua Portuguesa, baseado em léxicos de sentimento. Também comparamos nossos resultados com um método do estado da arte para a Língua Inglesa, baseado em LSTM com mecanismos de atenção. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-05-04T22:34:09Z |
dc.date.available.fl_str_mv |
2021-05-04T22:34:09Z |
dc.date.issued.fl_str_mv |
2021-03-22 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
CORRÊA, Ulisses Brisolara. Análise de Sentimento Baseada em Aspectos Usando Aprendizado Profundo: uma Proposta Aplicada à Língua Portuguesa. Orientador: Ricardo Matsumura Araujo. 2021. 123 f. Tese (Doutorado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2021. |
dc.identifier.uri.fl_str_mv |
http://guaiaca.ufpel.edu.br/handle/prefix/7433 |
identifier_str_mv |
CORRÊA, Ulisses Brisolara. Análise de Sentimento Baseada em Aspectos Usando Aprendizado Profundo: uma Proposta Aplicada à Língua Portuguesa. Orientador: Ricardo Matsumura Araujo. 2021. 123 f. Tese (Doutorado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2021. |
url |
http://guaiaca.ufpel.edu.br/handle/prefix/7433 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pelotas |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Computação |
dc.publisher.initials.fl_str_mv |
UFPel |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Centro de Desenvolvimento Tecnológico |
publisher.none.fl_str_mv |
Universidade Federal de Pelotas |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPel - Guaiaca instname:Universidade Federal de Pelotas (UFPEL) instacron:UFPEL |
instname_str |
Universidade Federal de Pelotas (UFPEL) |
instacron_str |
UFPEL |
institution |
UFPEL |
reponame_str |
Repositório Institucional da UFPel - Guaiaca |
collection |
Repositório Institucional da UFPel - Guaiaca |
bitstream.url.fl_str_mv |
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/7433/6/Tese_Ulisses_Brisolara_Corr%c3%aaa.pdf.txt http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/7433/7/Tese_Ulisses_Brisolara_Corr%c3%aaa.pdf.jpg http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/7433/1/Tese_Ulisses_Brisolara_Corr%c3%aaa.pdf http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/7433/2/license_url http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/7433/3/license_text http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/7433/4/license_rdf http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/7433/5/license.txt |
bitstream.checksum.fl_str_mv |
6896eb2d0d84de950895d9210c198e8b beb7eaa9a5feff7f578b88aa26aaee14 168fad9bf306f08a331965f818223f79 924993ce0b3ba389f79f32a1b2735415 d41d8cd98f00b204e9800998ecf8427e d41d8cd98f00b204e9800998ecf8427e 43cd690d6a359e86c1fe3d5b7cba0c9b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL) |
repository.mail.fl_str_mv |
rippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.br |
_version_ |
1813710148160454656 |