Mineração de opinião em mídias sociais com aprendizado de máquina

Detalhes bibliográficos
Autor(a) principal: Brandão, Jhonathan de Godoi
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFG
dARK ID: ark:/38995/0013000005qvm
Texto Completo: http://repositorio.bc.ufg.br/tede/handle/tede/11185
Resumo: The aim of this work is to develop a tool for that optimizes supervised machine learning models in order to classify polarity of opinions in tweets. Five different datasets are used, which are prepared, preprocessed and then used as input for the training and evaluation stage of machine learning models. The best accuracy results obtained in the training and evaluation of the models are 82.45% for the data without preprocessing × 78.83% with all the proposed preprocessing for the dataset using the Naive Bayes classifier. Finally, hyperparametric optimization of the classifiers and selection of the model that obtains the best accuracy is performed. The optimized model achieves an accuracy greater than 90% for some data sets. The supervised learning techniques depend on labeled data for training, the proposed method produces similar performances for datasets of varying sizes, which allows the development of optimized classification models with reduced amount of labeled data.
id UFG-2_65e44a96c14db3187292d8fd5d6b83a4
oai_identifier_str oai:repositorio.bc.ufg.br:tede/11185
network_acronym_str UFG-2
network_name_str Repositório Institucional da UFG
repository_id_str
spelling Calixto, Wesley Pachecohttps://orcid.org/0000-0002-1928-4432Calixto, Wesley PachecoRibeiro, Luiz Eduardo BentoReis, Márcio Rodrigues da CunhaCruz Junior, Gelson daMarques, Leonardo Garciahttp://lattes.cnpq.br/7322489654843870Brandão, Jhonathan de Godoi2021-03-23T19:43:18Z2021-03-23T19:43:18Z2020-10-14BRANDÃO, J. G. Mineração de opinião em mídias sociais com aprendizado de máquina. 2020. 70 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2020.http://repositorio.bc.ufg.br/tede/handle/tede/11185ark:/38995/0013000005qvmThe aim of this work is to develop a tool for that optimizes supervised machine learning models in order to classify polarity of opinions in tweets. Five different datasets are used, which are prepared, preprocessed and then used as input for the training and evaluation stage of machine learning models. The best accuracy results obtained in the training and evaluation of the models are 82.45% for the data without preprocessing × 78.83% with all the proposed preprocessing for the dataset using the Naive Bayes classifier. Finally, hyperparametric optimization of the classifiers and selection of the model that obtains the best accuracy is performed. The optimized model achieves an accuracy greater than 90% for some data sets. The supervised learning techniques depend on labeled data for training, the proposed method produces similar performances for datasets of varying sizes, which allows the development of optimized classification models with reduced amount of labeled data.O objetivo deste trabalho é desenvolver ferramenta que otimize modelos de aprendizado supervisionado de máquina para classificar polaridade de opiniões em tuítes. São utilizados cinco conjuntos de dados distintos que são preparados, preprocessados e então utilizados como entrada para a etapa de treinamento e avaliação dos modelos de aprendizado de máquina. Os melhores resultados de acurácia obtidos no treinamento e avaliação dos modelos são de 82,45% para os dados sem preprocessamento × 78,83% com todos os preprocessamentos propostos para o conjunto de dados utilizando classificador Naive Bayes. Por fim, é realizada otimização hiperparamétrica dos classificadores e seleção do modelo que obtém a melhor acurácia. O modelo otimizado obtém acurácia maior que 90% para alguns conjuntos de dados. As técnicas de aprendizado supervisionados apresentam dependência de dados rotulados para treinamento, o método proposto produz desempenhos semelhantes para conjuntos de dados de tamanhos variados, o que possibilita o desenvolvimento de modelos de classificação otimizados com quantidade reduzida de dados rotulados.Submitted by Franciele Moreira (francielemoreyra@gmail.com) on 2021-03-19T19:23:14Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Jhonathan de Godoi Brandão - 2020.pdf: 2630291 bytes, checksum: e8f23b1d577fd2e62bc013e64ad8a02a (MD5)Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2021-03-23T19:43:18Z (GMT) No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Jhonathan de Godoi Brandão - 2020.pdf: 2630291 bytes, checksum: e8f23b1d577fd2e62bc013e64ad8a02a (MD5)Made available in DSpace on 2021-03-23T19:43:18Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Jhonathan de Godoi Brandão - 2020.pdf: 2630291 bytes, checksum: e8f23b1d577fd2e62bc013e64ad8a02a (MD5) Previous issue date: 2020-10-14Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPqporUniversidade Federal de GoiásPrograma de Pós-graduação em Engenharia Elétrica e da Computação (EMC)UFGBrasilEscola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG)Attribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessAnálise de sentimentosMineração de opiniãoAprendizado de máquinaSentiment analysisOpinion miningMachine learningENGENHARIASMineração de opinião em mídias sociais com aprendizado de máquinaOpinion mining on social media with machine learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis4750050050050044840reponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.bc.ufg.br/tede/bitstreams/f8572b79-cc39-4cfa-a219-c5e0b4229a30/download4460e5956bc1d1639be9ae6146a50347MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.bc.ufg.br/tede/bitstreams/b593250b-480b-4ac8-9c7f-92d835492342/download8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALDissertação - Jhonathan de Godoi Brandão - 2020.pdfDissertação - Jhonathan de Godoi Brandão - 2020.pdfapplication/pdf2630291http://repositorio.bc.ufg.br/tede/bitstreams/a2b2a023-2ce0-4927-aff8-f1771fb8ecee/downloade8f23b1d577fd2e62bc013e64ad8a02aMD53tede/111852021-03-23 16:43:19.288http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internationalopen.accessoai:repositorio.bc.ufg.br:tede/11185http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttp://repositorio.bc.ufg.br/oai/requesttasesdissertacoes.bc@ufg.bropendoar:2021-03-23T19:43:19Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
dc.title.pt_BR.fl_str_mv Mineração de opinião em mídias sociais com aprendizado de máquina
dc.title.alternative.eng.fl_str_mv Opinion mining on social media with machine learning
title Mineração de opinião em mídias sociais com aprendizado de máquina
spellingShingle Mineração de opinião em mídias sociais com aprendizado de máquina
Brandão, Jhonathan de Godoi
Análise de sentimentos
Mineração de opinião
Aprendizado de máquina
Sentiment analysis
Opinion mining
Machine learning
ENGENHARIAS
title_short Mineração de opinião em mídias sociais com aprendizado de máquina
title_full Mineração de opinião em mídias sociais com aprendizado de máquina
title_fullStr Mineração de opinião em mídias sociais com aprendizado de máquina
title_full_unstemmed Mineração de opinião em mídias sociais com aprendizado de máquina
title_sort Mineração de opinião em mídias sociais com aprendizado de máquina
author Brandão, Jhonathan de Godoi
author_facet Brandão, Jhonathan de Godoi
author_role author
dc.contributor.advisor1.fl_str_mv Calixto, Wesley Pacheco
dc.contributor.advisor1Lattes.fl_str_mv https://orcid.org/0000-0002-1928-4432
dc.contributor.referee1.fl_str_mv Calixto, Wesley Pacheco
dc.contributor.referee2.fl_str_mv Ribeiro, Luiz Eduardo Bento
dc.contributor.referee3.fl_str_mv Reis, Márcio Rodrigues da Cunha
dc.contributor.referee4.fl_str_mv Cruz Junior, Gelson da
dc.contributor.referee5.fl_str_mv Marques, Leonardo Garcia
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/7322489654843870
dc.contributor.author.fl_str_mv Brandão, Jhonathan de Godoi
contributor_str_mv Calixto, Wesley Pacheco
Calixto, Wesley Pacheco
Ribeiro, Luiz Eduardo Bento
Reis, Márcio Rodrigues da Cunha
Cruz Junior, Gelson da
Marques, Leonardo Garcia
dc.subject.por.fl_str_mv Análise de sentimentos
Mineração de opinião
Aprendizado de máquina
topic Análise de sentimentos
Mineração de opinião
Aprendizado de máquina
Sentiment analysis
Opinion mining
Machine learning
ENGENHARIAS
dc.subject.eng.fl_str_mv Sentiment analysis
Opinion mining
Machine learning
dc.subject.cnpq.fl_str_mv ENGENHARIAS
description The aim of this work is to develop a tool for that optimizes supervised machine learning models in order to classify polarity of opinions in tweets. Five different datasets are used, which are prepared, preprocessed and then used as input for the training and evaluation stage of machine learning models. The best accuracy results obtained in the training and evaluation of the models are 82.45% for the data without preprocessing × 78.83% with all the proposed preprocessing for the dataset using the Naive Bayes classifier. Finally, hyperparametric optimization of the classifiers and selection of the model that obtains the best accuracy is performed. The optimized model achieves an accuracy greater than 90% for some data sets. The supervised learning techniques depend on labeled data for training, the proposed method produces similar performances for datasets of varying sizes, which allows the development of optimized classification models with reduced amount of labeled data.
publishDate 2020
dc.date.issued.fl_str_mv 2020-10-14
dc.date.accessioned.fl_str_mv 2021-03-23T19:43:18Z
dc.date.available.fl_str_mv 2021-03-23T19:43:18Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv BRANDÃO, J. G. Mineração de opinião em mídias sociais com aprendizado de máquina. 2020. 70 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2020.
dc.identifier.uri.fl_str_mv http://repositorio.bc.ufg.br/tede/handle/tede/11185
dc.identifier.dark.fl_str_mv ark:/38995/0013000005qvm
identifier_str_mv BRANDÃO, J. G. Mineração de opinião em mídias sociais com aprendizado de máquina. 2020. 70 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2020.
ark:/38995/0013000005qvm
url http://repositorio.bc.ufg.br/tede/handle/tede/11185
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 47
dc.relation.confidence.fl_str_mv 500
500
500
500
dc.relation.department.fl_str_mv 4
dc.relation.cnpq.fl_str_mv 484
dc.relation.sponsorship.fl_str_mv 0
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Goiás
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Engenharia Elétrica e da Computação (EMC)
dc.publisher.initials.fl_str_mv UFG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Escola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG)
publisher.none.fl_str_mv Universidade Federal de Goiás
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFG
instname:Universidade Federal de Goiás (UFG)
instacron:UFG
instname_str Universidade Federal de Goiás (UFG)
instacron_str UFG
institution UFG
reponame_str Repositório Institucional da UFG
collection Repositório Institucional da UFG
bitstream.url.fl_str_mv http://repositorio.bc.ufg.br/tede/bitstreams/f8572b79-cc39-4cfa-a219-c5e0b4229a30/download
http://repositorio.bc.ufg.br/tede/bitstreams/b593250b-480b-4ac8-9c7f-92d835492342/download
http://repositorio.bc.ufg.br/tede/bitstreams/a2b2a023-2ce0-4927-aff8-f1771fb8ecee/download
bitstream.checksum.fl_str_mv 4460e5956bc1d1639be9ae6146a50347
8a4605be74aa9ea9d79846c1fba20a33
e8f23b1d577fd2e62bc013e64ad8a02a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)
repository.mail.fl_str_mv tasesdissertacoes.bc@ufg.br
_version_ 1815172570497941504