Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos

Detalhes bibliográficos
Autor(a) principal: ARAÚJO, Débora da Conceição
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
dARK ID: ark:/64986/001300000drfg
Texto Completo: https://repositorio.ufpe.br/handle/123456789/33691
Resumo: Análise de Sentimentos é o problema que explora documentos escritos em linguagem natural visando classificá-los em polaridades de sentimentos (classes) pré-estabelecidas. Os algortimos Naive Bayes e Suport Vector Machine estão frequentemente associados a este tipo de tarefa, porém estes classificadores apontam para um problema iminente quando se trata da análise de sentimentos em um universo não-binário de classes. Classificadores de aprendizado profundo aparecem, cada vez mais, na literatura como alternativa aos modelos tradicionais de aprendizado de máquina, apresentando bons desempenhos. Diante disto, esta pesquisa apresenta uma avaliação de desempenho entre métodos de aprendizado de máquina tradicional, métodos de aprendizado profundo e comitês de classificadores que combinam as duas abordagens. Os comitês construídos fazem uso de modelos de aprendizado profundo com um menor número de épocas de treinamento, a intenção foi desenvolver modelos com menor tempo de execução sem perder em acurácia, devido ao conhecimento dos demais modelos combinados. Para avaliar o desempenho das diferentes abordagens, foram utilizadas cinco bases de dados com múltiplas classes: Stanford Sentiment Treebank, IMDb Review, Yelp 2013, Yelp 2014 e Yelp 2015. O desempenho dos modelos foram avaliados através de um conjunto de métricas e técnicas estatísticas. Com base nos resultados obtidos, foi possível concluir que os algoritmos de aprendizado profundo e os comitês alcançaram desempenhos médios estatisticamente superiores em relação aos algoritmos de aprendizado de máquina tradicional. Apesar do maior desempenho, vale salientar que os comitês e os modelos de aprendizado profundo possuem tempo de treinamento superior em relação aos algoritmos tradicionais.
id UFPE_00fb6e4787f7ec9857052e7b67d9aeba
oai_identifier_str oai:repositorio.ufpe.br:123456789/33691
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling ARAÚJO, Débora da Conceiçãohttp://lattes.cnpq.br/7398012565477976http://lattes.cnpq.br/8513145553846486ALMEIDA, Leandro Maciel2019-09-26T17:45:01Z2019-09-26T17:45:01Z2019-02-20https://repositorio.ufpe.br/handle/123456789/33691ark:/64986/001300000drfgAnálise de Sentimentos é o problema que explora documentos escritos em linguagem natural visando classificá-los em polaridades de sentimentos (classes) pré-estabelecidas. Os algortimos Naive Bayes e Suport Vector Machine estão frequentemente associados a este tipo de tarefa, porém estes classificadores apontam para um problema iminente quando se trata da análise de sentimentos em um universo não-binário de classes. Classificadores de aprendizado profundo aparecem, cada vez mais, na literatura como alternativa aos modelos tradicionais de aprendizado de máquina, apresentando bons desempenhos. Diante disto, esta pesquisa apresenta uma avaliação de desempenho entre métodos de aprendizado de máquina tradicional, métodos de aprendizado profundo e comitês de classificadores que combinam as duas abordagens. Os comitês construídos fazem uso de modelos de aprendizado profundo com um menor número de épocas de treinamento, a intenção foi desenvolver modelos com menor tempo de execução sem perder em acurácia, devido ao conhecimento dos demais modelos combinados. Para avaliar o desempenho das diferentes abordagens, foram utilizadas cinco bases de dados com múltiplas classes: Stanford Sentiment Treebank, IMDb Review, Yelp 2013, Yelp 2014 e Yelp 2015. O desempenho dos modelos foram avaliados através de um conjunto de métricas e técnicas estatísticas. Com base nos resultados obtidos, foi possível concluir que os algoritmos de aprendizado profundo e os comitês alcançaram desempenhos médios estatisticamente superiores em relação aos algoritmos de aprendizado de máquina tradicional. Apesar do maior desempenho, vale salientar que os comitês e os modelos de aprendizado profundo possuem tempo de treinamento superior em relação aos algoritmos tradicionais.CNPqSentiment Analysis is the problem that explores documents written in natural language aiming to classify them into pre-established polarities of feelings (classes). The Naive Bayes and Suport Vector Machine algorithms are often associated with this type of task, but these classifiers point to an imminent problem when it comes to the sentiment analysis in a non-binary universe of classes. In the light of this, this research presents an alternative to the traditional methods used for the sentiment analysis, by means of deep learning cassifiers and ensembles of classifiers that mix algorithms of learning of traditional machine and deep learning, considering that these types of approaches have been showing good results in several problems of the literature. To address this problem, this research presents an alternative to the traditional methods used for the sentiment analysis by means of deep learning cassifiers and ensembles of classifiers that mix traditional machine learning algorithms and deep learning, since these types of approaches come demonstrating good results in several problems of the literature. We compared the performances of the single classifiers, traditional machine learning and deep learning, and classifier combinations, in order to observe if there is a statistical difference between the acuracies reached and the relation between the performance of the model and its execution time. To evaluate the performance of the different approaches, 5 databases were used: Stanford Sentiment Treebank, IMDb Review, Yelp Challange Dataset 2013, 2014 e 2015. The performance of the models were evaluated through a set of metrics and statistical techniques. Based on the results obtained, it is possible to infer that the deep learning algorithms and ensemble classifiers achieved statistically superior average performances in relation to the algorithms of traditional machine learning. Despite the higher performance, it is worth noting that ensembles and deep learning classifiers have a computational cost higher than the cost of traditional algorithms.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência computacionalAprendizagem de máquinaAvaliação de comitês com classificadores tradicionais e profundos para análise de sentimentosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDISSERTAÇÃO Débora da Conceição Araújo.pdf.jpgDISSERTAÇÃO Débora da Conceição Araújo.pdf.jpgGenerated Thumbnailimage/jpeg1284https://repositorio.ufpe.br/bitstream/123456789/33691/5/DISSERTA%c3%87%c3%83O%20D%c3%a9bora%20da%20Concei%c3%a7%c3%a3o%20Ara%c3%bajo.pdf.jpg114993da456179a2d5ce68450f82ddadMD55ORIGINALDISSERTAÇÃO Débora da Conceição Araújo.pdfDISSERTAÇÃO Débora da Conceição Araújo.pdfapplication/pdf1511890https://repositorio.ufpe.br/bitstream/123456789/33691/1/DISSERTA%c3%87%c3%83O%20D%c3%a9bora%20da%20Concei%c3%a7%c3%a3o%20Ara%c3%bajo.pdfaab7c709ba52a5c020b68876ac898dc7MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/33691/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82310https://repositorio.ufpe.br/bitstream/123456789/33691/3/license.txtbd573a5ca8288eb7272482765f819534MD53TEXTDISSERTAÇÃO Débora da Conceição Araújo.pdf.txtDISSERTAÇÃO Débora da Conceição Araújo.pdf.txtExtracted texttext/plain193031https://repositorio.ufpe.br/bitstream/123456789/33691/4/DISSERTA%c3%87%c3%83O%20D%c3%a9bora%20da%20Concei%c3%a7%c3%a3o%20Ara%c3%bajo.pdf.txt2a6964ac36b24e949683e0f223890264MD54123456789/336912021-07-15 18:44:11.229oai:repositorio.ufpe.br:123456789/33691TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLCBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91IGFjb3Jkby4KCkEgVUZQRSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBub21lKHMpIGRvKHMpIGF1dG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50byBlbnRyZWd1ZSBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZG8gcHJldmlzdG8gbmEgYWzDrW5lYSBjKS4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212021-07-15T21:44:11Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos
title Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos
spellingShingle Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos
ARAÚJO, Débora da Conceição
Inteligência computacional
Aprendizagem de máquina
title_short Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos
title_full Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos
title_fullStr Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos
title_full_unstemmed Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos
title_sort Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos
author ARAÚJO, Débora da Conceição
author_facet ARAÚJO, Débora da Conceição
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/7398012565477976
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/8513145553846486
dc.contributor.author.fl_str_mv ARAÚJO, Débora da Conceição
dc.contributor.advisor1.fl_str_mv ALMEIDA, Leandro Maciel
contributor_str_mv ALMEIDA, Leandro Maciel
dc.subject.por.fl_str_mv Inteligência computacional
Aprendizagem de máquina
topic Inteligência computacional
Aprendizagem de máquina
description Análise de Sentimentos é o problema que explora documentos escritos em linguagem natural visando classificá-los em polaridades de sentimentos (classes) pré-estabelecidas. Os algortimos Naive Bayes e Suport Vector Machine estão frequentemente associados a este tipo de tarefa, porém estes classificadores apontam para um problema iminente quando se trata da análise de sentimentos em um universo não-binário de classes. Classificadores de aprendizado profundo aparecem, cada vez mais, na literatura como alternativa aos modelos tradicionais de aprendizado de máquina, apresentando bons desempenhos. Diante disto, esta pesquisa apresenta uma avaliação de desempenho entre métodos de aprendizado de máquina tradicional, métodos de aprendizado profundo e comitês de classificadores que combinam as duas abordagens. Os comitês construídos fazem uso de modelos de aprendizado profundo com um menor número de épocas de treinamento, a intenção foi desenvolver modelos com menor tempo de execução sem perder em acurácia, devido ao conhecimento dos demais modelos combinados. Para avaliar o desempenho das diferentes abordagens, foram utilizadas cinco bases de dados com múltiplas classes: Stanford Sentiment Treebank, IMDb Review, Yelp 2013, Yelp 2014 e Yelp 2015. O desempenho dos modelos foram avaliados através de um conjunto de métricas e técnicas estatísticas. Com base nos resultados obtidos, foi possível concluir que os algoritmos de aprendizado profundo e os comitês alcançaram desempenhos médios estatisticamente superiores em relação aos algoritmos de aprendizado de máquina tradicional. Apesar do maior desempenho, vale salientar que os comitês e os modelos de aprendizado profundo possuem tempo de treinamento superior em relação aos algoritmos tradicionais.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-09-26T17:45:01Z
dc.date.available.fl_str_mv 2019-09-26T17:45:01Z
dc.date.issued.fl_str_mv 2019-02-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/33691
dc.identifier.dark.fl_str_mv ark:/64986/001300000drfg
url https://repositorio.ufpe.br/handle/123456789/33691
identifier_str_mv ark:/64986/001300000drfg
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/33691/5/DISSERTA%c3%87%c3%83O%20D%c3%a9bora%20da%20Concei%c3%a7%c3%a3o%20Ara%c3%bajo.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/33691/1/DISSERTA%c3%87%c3%83O%20D%c3%a9bora%20da%20Concei%c3%a7%c3%a3o%20Ara%c3%bajo.pdf
https://repositorio.ufpe.br/bitstream/123456789/33691/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/33691/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/33691/4/DISSERTA%c3%87%c3%83O%20D%c3%a9bora%20da%20Concei%c3%a7%c3%a3o%20Ara%c3%bajo.pdf.txt
bitstream.checksum.fl_str_mv 114993da456179a2d5ce68450f82ddad
aab7c709ba52a5c020b68876ac898dc7
e39d27027a6cc9cb039ad269a5db8e34
bd573a5ca8288eb7272482765f819534
2a6964ac36b24e949683e0f223890264
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1815172801509720064