Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
dARK ID: | ark:/64986/001300000drfg |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/33691 |
Resumo: | Análise de Sentimentos é o problema que explora documentos escritos em linguagem natural visando classificá-los em polaridades de sentimentos (classes) pré-estabelecidas. Os algortimos Naive Bayes e Suport Vector Machine estão frequentemente associados a este tipo de tarefa, porém estes classificadores apontam para um problema iminente quando se trata da análise de sentimentos em um universo não-binário de classes. Classificadores de aprendizado profundo aparecem, cada vez mais, na literatura como alternativa aos modelos tradicionais de aprendizado de máquina, apresentando bons desempenhos. Diante disto, esta pesquisa apresenta uma avaliação de desempenho entre métodos de aprendizado de máquina tradicional, métodos de aprendizado profundo e comitês de classificadores que combinam as duas abordagens. Os comitês construídos fazem uso de modelos de aprendizado profundo com um menor número de épocas de treinamento, a intenção foi desenvolver modelos com menor tempo de execução sem perder em acurácia, devido ao conhecimento dos demais modelos combinados. Para avaliar o desempenho das diferentes abordagens, foram utilizadas cinco bases de dados com múltiplas classes: Stanford Sentiment Treebank, IMDb Review, Yelp 2013, Yelp 2014 e Yelp 2015. O desempenho dos modelos foram avaliados através de um conjunto de métricas e técnicas estatísticas. Com base nos resultados obtidos, foi possível concluir que os algoritmos de aprendizado profundo e os comitês alcançaram desempenhos médios estatisticamente superiores em relação aos algoritmos de aprendizado de máquina tradicional. Apesar do maior desempenho, vale salientar que os comitês e os modelos de aprendizado profundo possuem tempo de treinamento superior em relação aos algoritmos tradicionais. |
id |
UFPE_00fb6e4787f7ec9857052e7b67d9aeba |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/33691 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
ARAÚJO, Débora da Conceiçãohttp://lattes.cnpq.br/7398012565477976http://lattes.cnpq.br/8513145553846486ALMEIDA, Leandro Maciel2019-09-26T17:45:01Z2019-09-26T17:45:01Z2019-02-20https://repositorio.ufpe.br/handle/123456789/33691ark:/64986/001300000drfgAnálise de Sentimentos é o problema que explora documentos escritos em linguagem natural visando classificá-los em polaridades de sentimentos (classes) pré-estabelecidas. Os algortimos Naive Bayes e Suport Vector Machine estão frequentemente associados a este tipo de tarefa, porém estes classificadores apontam para um problema iminente quando se trata da análise de sentimentos em um universo não-binário de classes. Classificadores de aprendizado profundo aparecem, cada vez mais, na literatura como alternativa aos modelos tradicionais de aprendizado de máquina, apresentando bons desempenhos. Diante disto, esta pesquisa apresenta uma avaliação de desempenho entre métodos de aprendizado de máquina tradicional, métodos de aprendizado profundo e comitês de classificadores que combinam as duas abordagens. Os comitês construídos fazem uso de modelos de aprendizado profundo com um menor número de épocas de treinamento, a intenção foi desenvolver modelos com menor tempo de execução sem perder em acurácia, devido ao conhecimento dos demais modelos combinados. Para avaliar o desempenho das diferentes abordagens, foram utilizadas cinco bases de dados com múltiplas classes: Stanford Sentiment Treebank, IMDb Review, Yelp 2013, Yelp 2014 e Yelp 2015. O desempenho dos modelos foram avaliados através de um conjunto de métricas e técnicas estatísticas. Com base nos resultados obtidos, foi possível concluir que os algoritmos de aprendizado profundo e os comitês alcançaram desempenhos médios estatisticamente superiores em relação aos algoritmos de aprendizado de máquina tradicional. Apesar do maior desempenho, vale salientar que os comitês e os modelos de aprendizado profundo possuem tempo de treinamento superior em relação aos algoritmos tradicionais.CNPqSentiment Analysis is the problem that explores documents written in natural language aiming to classify them into pre-established polarities of feelings (classes). The Naive Bayes and Suport Vector Machine algorithms are often associated with this type of task, but these classifiers point to an imminent problem when it comes to the sentiment analysis in a non-binary universe of classes. In the light of this, this research presents an alternative to the traditional methods used for the sentiment analysis, by means of deep learning cassifiers and ensembles of classifiers that mix algorithms of learning of traditional machine and deep learning, considering that these types of approaches have been showing good results in several problems of the literature. To address this problem, this research presents an alternative to the traditional methods used for the sentiment analysis by means of deep learning cassifiers and ensembles of classifiers that mix traditional machine learning algorithms and deep learning, since these types of approaches come demonstrating good results in several problems of the literature. We compared the performances of the single classifiers, traditional machine learning and deep learning, and classifier combinations, in order to observe if there is a statistical difference between the acuracies reached and the relation between the performance of the model and its execution time. To evaluate the performance of the different approaches, 5 databases were used: Stanford Sentiment Treebank, IMDb Review, Yelp Challange Dataset 2013, 2014 e 2015. The performance of the models were evaluated through a set of metrics and statistical techniques. Based on the results obtained, it is possible to infer that the deep learning algorithms and ensemble classifiers achieved statistically superior average performances in relation to the algorithms of traditional machine learning. Despite the higher performance, it is worth noting that ensembles and deep learning classifiers have a computational cost higher than the cost of traditional algorithms.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência computacionalAprendizagem de máquinaAvaliação de comitês com classificadores tradicionais e profundos para análise de sentimentosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDISSERTAÇÃO Débora da Conceição Araújo.pdf.jpgDISSERTAÇÃO Débora da Conceição Araújo.pdf.jpgGenerated Thumbnailimage/jpeg1284https://repositorio.ufpe.br/bitstream/123456789/33691/5/DISSERTA%c3%87%c3%83O%20D%c3%a9bora%20da%20Concei%c3%a7%c3%a3o%20Ara%c3%bajo.pdf.jpg114993da456179a2d5ce68450f82ddadMD55ORIGINALDISSERTAÇÃO Débora da Conceição Araújo.pdfDISSERTAÇÃO Débora da Conceição Araújo.pdfapplication/pdf1511890https://repositorio.ufpe.br/bitstream/123456789/33691/1/DISSERTA%c3%87%c3%83O%20D%c3%a9bora%20da%20Concei%c3%a7%c3%a3o%20Ara%c3%bajo.pdfaab7c709ba52a5c020b68876ac898dc7MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/33691/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82310https://repositorio.ufpe.br/bitstream/123456789/33691/3/license.txtbd573a5ca8288eb7272482765f819534MD53TEXTDISSERTAÇÃO Débora da Conceição Araújo.pdf.txtDISSERTAÇÃO Débora da Conceição Araújo.pdf.txtExtracted texttext/plain193031https://repositorio.ufpe.br/bitstream/123456789/33691/4/DISSERTA%c3%87%c3%83O%20D%c3%a9bora%20da%20Concei%c3%a7%c3%a3o%20Ara%c3%bajo.pdf.txt2a6964ac36b24e949683e0f223890264MD54123456789/336912021-07-15 18:44:11.229oai:repositorio.ufpe.br:123456789/33691TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLCBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91IGFjb3Jkby4KCkEgVUZQRSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBub21lKHMpIGRvKHMpIGF1dG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50byBlbnRyZWd1ZSBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZG8gcHJldmlzdG8gbmEgYWzDrW5lYSBjKS4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212021-07-15T21:44:11Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos |
title |
Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos |
spellingShingle |
Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos ARAÚJO, Débora da Conceição Inteligência computacional Aprendizagem de máquina |
title_short |
Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos |
title_full |
Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos |
title_fullStr |
Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos |
title_full_unstemmed |
Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos |
title_sort |
Avaliação de comitês com classificadores tradicionais e profundos para análise de sentimentos |
author |
ARAÚJO, Débora da Conceição |
author_facet |
ARAÚJO, Débora da Conceição |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/7398012565477976 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/8513145553846486 |
dc.contributor.author.fl_str_mv |
ARAÚJO, Débora da Conceição |
dc.contributor.advisor1.fl_str_mv |
ALMEIDA, Leandro Maciel |
contributor_str_mv |
ALMEIDA, Leandro Maciel |
dc.subject.por.fl_str_mv |
Inteligência computacional Aprendizagem de máquina |
topic |
Inteligência computacional Aprendizagem de máquina |
description |
Análise de Sentimentos é o problema que explora documentos escritos em linguagem natural visando classificá-los em polaridades de sentimentos (classes) pré-estabelecidas. Os algortimos Naive Bayes e Suport Vector Machine estão frequentemente associados a este tipo de tarefa, porém estes classificadores apontam para um problema iminente quando se trata da análise de sentimentos em um universo não-binário de classes. Classificadores de aprendizado profundo aparecem, cada vez mais, na literatura como alternativa aos modelos tradicionais de aprendizado de máquina, apresentando bons desempenhos. Diante disto, esta pesquisa apresenta uma avaliação de desempenho entre métodos de aprendizado de máquina tradicional, métodos de aprendizado profundo e comitês de classificadores que combinam as duas abordagens. Os comitês construídos fazem uso de modelos de aprendizado profundo com um menor número de épocas de treinamento, a intenção foi desenvolver modelos com menor tempo de execução sem perder em acurácia, devido ao conhecimento dos demais modelos combinados. Para avaliar o desempenho das diferentes abordagens, foram utilizadas cinco bases de dados com múltiplas classes: Stanford Sentiment Treebank, IMDb Review, Yelp 2013, Yelp 2014 e Yelp 2015. O desempenho dos modelos foram avaliados através de um conjunto de métricas e técnicas estatísticas. Com base nos resultados obtidos, foi possível concluir que os algoritmos de aprendizado profundo e os comitês alcançaram desempenhos médios estatisticamente superiores em relação aos algoritmos de aprendizado de máquina tradicional. Apesar do maior desempenho, vale salientar que os comitês e os modelos de aprendizado profundo possuem tempo de treinamento superior em relação aos algoritmos tradicionais. |
publishDate |
2019 |
dc.date.accessioned.fl_str_mv |
2019-09-26T17:45:01Z |
dc.date.available.fl_str_mv |
2019-09-26T17:45:01Z |
dc.date.issued.fl_str_mv |
2019-02-20 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/33691 |
dc.identifier.dark.fl_str_mv |
ark:/64986/001300000drfg |
url |
https://repositorio.ufpe.br/handle/123456789/33691 |
identifier_str_mv |
ark:/64986/001300000drfg |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/33691/5/DISSERTA%c3%87%c3%83O%20D%c3%a9bora%20da%20Concei%c3%a7%c3%a3o%20Ara%c3%bajo.pdf.jpg https://repositorio.ufpe.br/bitstream/123456789/33691/1/DISSERTA%c3%87%c3%83O%20D%c3%a9bora%20da%20Concei%c3%a7%c3%a3o%20Ara%c3%bajo.pdf https://repositorio.ufpe.br/bitstream/123456789/33691/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/33691/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/33691/4/DISSERTA%c3%87%c3%83O%20D%c3%a9bora%20da%20Concei%c3%a7%c3%a3o%20Ara%c3%bajo.pdf.txt |
bitstream.checksum.fl_str_mv |
114993da456179a2d5ce68450f82ddad aab7c709ba52a5c020b68876ac898dc7 e39d27027a6cc9cb039ad269a5db8e34 bd573a5ca8288eb7272482765f819534 2a6964ac36b24e949683e0f223890264 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1815172801509720064 |