Mineração de opinião em mídias sociais com aprendizado de máquina
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFG |
dARK ID: | ark:/38995/0013000005qvm |
Texto Completo: | http://repositorio.bc.ufg.br/tede/handle/tede/11185 |
Resumo: | The aim of this work is to develop a tool for that optimizes supervised machine learning models in order to classify polarity of opinions in tweets. Five different datasets are used, which are prepared, preprocessed and then used as input for the training and evaluation stage of machine learning models. The best accuracy results obtained in the training and evaluation of the models are 82.45% for the data without preprocessing × 78.83% with all the proposed preprocessing for the dataset using the Naive Bayes classifier. Finally, hyperparametric optimization of the classifiers and selection of the model that obtains the best accuracy is performed. The optimized model achieves an accuracy greater than 90% for some data sets. The supervised learning techniques depend on labeled data for training, the proposed method produces similar performances for datasets of varying sizes, which allows the development of optimized classification models with reduced amount of labeled data. |
id |
UFG-2_65e44a96c14db3187292d8fd5d6b83a4 |
---|---|
oai_identifier_str |
oai:repositorio.bc.ufg.br:tede/11185 |
network_acronym_str |
UFG-2 |
network_name_str |
Repositório Institucional da UFG |
repository_id_str |
|
spelling |
Calixto, Wesley Pachecohttps://orcid.org/0000-0002-1928-4432Calixto, Wesley PachecoRibeiro, Luiz Eduardo BentoReis, Márcio Rodrigues da CunhaCruz Junior, Gelson daMarques, Leonardo Garciahttp://lattes.cnpq.br/7322489654843870Brandão, Jhonathan de Godoi2021-03-23T19:43:18Z2021-03-23T19:43:18Z2020-10-14BRANDÃO, J. G. Mineração de opinião em mídias sociais com aprendizado de máquina. 2020. 70 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2020.http://repositorio.bc.ufg.br/tede/handle/tede/11185ark:/38995/0013000005qvmThe aim of this work is to develop a tool for that optimizes supervised machine learning models in order to classify polarity of opinions in tweets. Five different datasets are used, which are prepared, preprocessed and then used as input for the training and evaluation stage of machine learning models. The best accuracy results obtained in the training and evaluation of the models are 82.45% for the data without preprocessing × 78.83% with all the proposed preprocessing for the dataset using the Naive Bayes classifier. Finally, hyperparametric optimization of the classifiers and selection of the model that obtains the best accuracy is performed. The optimized model achieves an accuracy greater than 90% for some data sets. The supervised learning techniques depend on labeled data for training, the proposed method produces similar performances for datasets of varying sizes, which allows the development of optimized classification models with reduced amount of labeled data.O objetivo deste trabalho é desenvolver ferramenta que otimize modelos de aprendizado supervisionado de máquina para classificar polaridade de opiniões em tuítes. São utilizados cinco conjuntos de dados distintos que são preparados, preprocessados e então utilizados como entrada para a etapa de treinamento e avaliação dos modelos de aprendizado de máquina. Os melhores resultados de acurácia obtidos no treinamento e avaliação dos modelos são de 82,45% para os dados sem preprocessamento × 78,83% com todos os preprocessamentos propostos para o conjunto de dados utilizando classificador Naive Bayes. Por fim, é realizada otimização hiperparamétrica dos classificadores e seleção do modelo que obtém a melhor acurácia. O modelo otimizado obtém acurácia maior que 90% para alguns conjuntos de dados. As técnicas de aprendizado supervisionados apresentam dependência de dados rotulados para treinamento, o método proposto produz desempenhos semelhantes para conjuntos de dados de tamanhos variados, o que possibilita o desenvolvimento de modelos de classificação otimizados com quantidade reduzida de dados rotulados.Submitted by Franciele Moreira (francielemoreyra@gmail.com) on 2021-03-19T19:23:14Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Jhonathan de Godoi Brandão - 2020.pdf: 2630291 bytes, checksum: e8f23b1d577fd2e62bc013e64ad8a02a (MD5)Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2021-03-23T19:43:18Z (GMT) No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Jhonathan de Godoi Brandão - 2020.pdf: 2630291 bytes, checksum: e8f23b1d577fd2e62bc013e64ad8a02a (MD5)Made available in DSpace on 2021-03-23T19:43:18Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Jhonathan de Godoi Brandão - 2020.pdf: 2630291 bytes, checksum: e8f23b1d577fd2e62bc013e64ad8a02a (MD5) Previous issue date: 2020-10-14Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPqporUniversidade Federal de GoiásPrograma de Pós-graduação em Engenharia Elétrica e da Computação (EMC)UFGBrasilEscola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG)Attribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessAnálise de sentimentosMineração de opiniãoAprendizado de máquinaSentiment analysisOpinion miningMachine learningENGENHARIASMineração de opinião em mídias sociais com aprendizado de máquinaOpinion mining on social media with machine learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis4750050050050044840reponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.bc.ufg.br/tede/bitstreams/f8572b79-cc39-4cfa-a219-c5e0b4229a30/download4460e5956bc1d1639be9ae6146a50347MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.bc.ufg.br/tede/bitstreams/b593250b-480b-4ac8-9c7f-92d835492342/download8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALDissertação - Jhonathan de Godoi Brandão - 2020.pdfDissertação - Jhonathan de Godoi Brandão - 2020.pdfapplication/pdf2630291http://repositorio.bc.ufg.br/tede/bitstreams/a2b2a023-2ce0-4927-aff8-f1771fb8ecee/downloade8f23b1d577fd2e62bc013e64ad8a02aMD53tede/111852021-03-23 16:43:19.288http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internationalopen.accessoai:repositorio.bc.ufg.br:tede/11185http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttp://repositorio.bc.ufg.br/oai/requesttasesdissertacoes.bc@ufg.bropendoar:2021-03-23T19:43:19Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
dc.title.pt_BR.fl_str_mv |
Mineração de opinião em mídias sociais com aprendizado de máquina |
dc.title.alternative.eng.fl_str_mv |
Opinion mining on social media with machine learning |
title |
Mineração de opinião em mídias sociais com aprendizado de máquina |
spellingShingle |
Mineração de opinião em mídias sociais com aprendizado de máquina Brandão, Jhonathan de Godoi Análise de sentimentos Mineração de opinião Aprendizado de máquina Sentiment analysis Opinion mining Machine learning ENGENHARIAS |
title_short |
Mineração de opinião em mídias sociais com aprendizado de máquina |
title_full |
Mineração de opinião em mídias sociais com aprendizado de máquina |
title_fullStr |
Mineração de opinião em mídias sociais com aprendizado de máquina |
title_full_unstemmed |
Mineração de opinião em mídias sociais com aprendizado de máquina |
title_sort |
Mineração de opinião em mídias sociais com aprendizado de máquina |
author |
Brandão, Jhonathan de Godoi |
author_facet |
Brandão, Jhonathan de Godoi |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Calixto, Wesley Pacheco |
dc.contributor.advisor1Lattes.fl_str_mv |
https://orcid.org/0000-0002-1928-4432 |
dc.contributor.referee1.fl_str_mv |
Calixto, Wesley Pacheco |
dc.contributor.referee2.fl_str_mv |
Ribeiro, Luiz Eduardo Bento |
dc.contributor.referee3.fl_str_mv |
Reis, Márcio Rodrigues da Cunha |
dc.contributor.referee4.fl_str_mv |
Cruz Junior, Gelson da |
dc.contributor.referee5.fl_str_mv |
Marques, Leonardo Garcia |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/7322489654843870 |
dc.contributor.author.fl_str_mv |
Brandão, Jhonathan de Godoi |
contributor_str_mv |
Calixto, Wesley Pacheco Calixto, Wesley Pacheco Ribeiro, Luiz Eduardo Bento Reis, Márcio Rodrigues da Cunha Cruz Junior, Gelson da Marques, Leonardo Garcia |
dc.subject.por.fl_str_mv |
Análise de sentimentos Mineração de opinião Aprendizado de máquina |
topic |
Análise de sentimentos Mineração de opinião Aprendizado de máquina Sentiment analysis Opinion mining Machine learning ENGENHARIAS |
dc.subject.eng.fl_str_mv |
Sentiment analysis Opinion mining Machine learning |
dc.subject.cnpq.fl_str_mv |
ENGENHARIAS |
description |
The aim of this work is to develop a tool for that optimizes supervised machine learning models in order to classify polarity of opinions in tweets. Five different datasets are used, which are prepared, preprocessed and then used as input for the training and evaluation stage of machine learning models. The best accuracy results obtained in the training and evaluation of the models are 82.45% for the data without preprocessing × 78.83% with all the proposed preprocessing for the dataset using the Naive Bayes classifier. Finally, hyperparametric optimization of the classifiers and selection of the model that obtains the best accuracy is performed. The optimized model achieves an accuracy greater than 90% for some data sets. The supervised learning techniques depend on labeled data for training, the proposed method produces similar performances for datasets of varying sizes, which allows the development of optimized classification models with reduced amount of labeled data. |
publishDate |
2020 |
dc.date.issued.fl_str_mv |
2020-10-14 |
dc.date.accessioned.fl_str_mv |
2021-03-23T19:43:18Z |
dc.date.available.fl_str_mv |
2021-03-23T19:43:18Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
BRANDÃO, J. G. Mineração de opinião em mídias sociais com aprendizado de máquina. 2020. 70 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2020. |
dc.identifier.uri.fl_str_mv |
http://repositorio.bc.ufg.br/tede/handle/tede/11185 |
dc.identifier.dark.fl_str_mv |
ark:/38995/0013000005qvm |
identifier_str_mv |
BRANDÃO, J. G. Mineração de opinião em mídias sociais com aprendizado de máquina. 2020. 70 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2020. ark:/38995/0013000005qvm |
url |
http://repositorio.bc.ufg.br/tede/handle/tede/11185 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.program.fl_str_mv |
47 |
dc.relation.confidence.fl_str_mv |
500 500 500 500 |
dc.relation.department.fl_str_mv |
4 |
dc.relation.cnpq.fl_str_mv |
484 |
dc.relation.sponsorship.fl_str_mv |
0 |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International http://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Goiás |
dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Engenharia Elétrica e da Computação (EMC) |
dc.publisher.initials.fl_str_mv |
UFG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Escola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG) |
publisher.none.fl_str_mv |
Universidade Federal de Goiás |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFG instname:Universidade Federal de Goiás (UFG) instacron:UFG |
instname_str |
Universidade Federal de Goiás (UFG) |
instacron_str |
UFG |
institution |
UFG |
reponame_str |
Repositório Institucional da UFG |
collection |
Repositório Institucional da UFG |
bitstream.url.fl_str_mv |
http://repositorio.bc.ufg.br/tede/bitstreams/f8572b79-cc39-4cfa-a219-c5e0b4229a30/download http://repositorio.bc.ufg.br/tede/bitstreams/b593250b-480b-4ac8-9c7f-92d835492342/download http://repositorio.bc.ufg.br/tede/bitstreams/a2b2a023-2ce0-4927-aff8-f1771fb8ecee/download |
bitstream.checksum.fl_str_mv |
4460e5956bc1d1639be9ae6146a50347 8a4605be74aa9ea9d79846c1fba20a33 e8f23b1d577fd2e62bc013e64ad8a02a |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFG - Universidade Federal de Goiás (UFG) |
repository.mail.fl_str_mv |
tasesdissertacoes.bc@ufg.br |
_version_ |
1815172570497941504 |