Mineração de opinião em textos opinativos utilizando algoritmos de classificação

Detalhes bibliográficos
Autor(a) principal: Santos, Fernando Leandro dos
Data de Publicação: 2013
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Monografias da UnB
Texto Completo: http://bdm.unb.br/handle/10483/7711
Resumo: Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2013.
id UNB-2_30df14e83e7bb9ac6c9f3b4868831de1
oai_identifier_str oai:bdm.unb.br:10483/7711
network_acronym_str UNB-2
network_name_str Biblioteca Digital de Monografias da UnB
repository_id_str 11571
spelling Santos, Fernando Leandro dosLadeira, MarceloSANTOS, Fernando. Mineração de opinião em textos opinativos utilizando algoritmos de classificação. 2013. xi, 60 f., il. Monografia (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2013.http://bdm.unb.br/handle/10483/7711Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2013.Este trabalho descreve uma análise de mineração de opinião realizada sobre uma base de dados extraída da intenet e composta de comentários que contêm gírias, abreviações e outros jargões da internet. A mineração de opinião é a área de estudos que tenta identificar e classificar a subjetividade, como opiniões, emoções ou sentimentos na linguagem natural. Nesta pesquisa, 759 mil comentários em português foram extraídos da loja de aplicativos Google Play. Devido à grande quantidade de comentários, foram necessárias técnicas de processamento distribuído, envolvendo ferramentas poderosas como o Hadoop e o Mahout. O trabalho teve como principal constatação a verificação da baixa eficácia do pré-processamento em textos para a tarefa de mineração de opinião no domínio tratado. O trabalho também contribuiu com a criação de um corpus composto por 759 mil comentários e um dicionário de gírias, abreviações da Internet. _____________________________________________________________________________ ABSTRACTThis work describes an opinion mining aplication over a dataset extracted from the web and composed of reviews with lots of internet slangs, abbreviations and typo errors. Opinion mining is a study field that tries to identify and classify subjectivity, such as opinions, emotions or sentiments in natural language. In this research, 759 thousand portuguese reviews were extracted from the app store Google Play. Due to the large amount of reviews, large scale processing techniques were needed, envolving powerful frameworks such as Hadoop and Mahout. The main contribution of this research was to verify the low efficiency of pre-processing techniques in the opinion mining task for the treated domain. The work also contributed to the creation of a corpus consisting of 759 thousand reviews and a dictionary of slangs and abbreviations commonly used in the Internet.Submitted by Ruthlea Nascimento (ruthlea.nascimento@gmail.com) on 2014-06-18T10:37:15Z No. of bitstreams: 1 2013_FernandoLeandrodosSantos.pdf: 1841807 bytes, checksum: a54cff4367792f809e4af62b6ec67557 (MD5)Approved for entry into archive by Elna Araujo (elna@bce.unb.br) on 2014-06-18T18:55:32Z (GMT) No. of bitstreams: 1 2013_FernandoLeandrodosSantos.pdf: 1841807 bytes, checksum: a54cff4367792f809e4af62b6ec67557 (MD5)Made available in DSpace on 2014-06-18T18:55:32Z (GMT). No. of bitstreams: 1 2013_FernandoLeandrodosSantos.pdf: 1841807 bytes, checksum: a54cff4367792f809e4af62b6ec67557 (MD5)Mineração de dadosMineração de textoProcessamento eletrônico de dadosMineração de opinião em textos opinativos utilizando algoritmos de classificaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2014-06-18T18:55:32Z2014-06-18T18:55:32Z2014-06-18T18:55:32Z2013-12-20info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2013_FernandoLeandrodosSantos.pdf2013_FernandoLeandrodosSantos.pdfapplication/pdf1841807http://bdm.unb.br/xmlui/bitstream/10483/7711/1/2013_FernandoLeandrodosSantos.pdfa54cff4367792f809e4af62b6ec67557MD51CC-LICENSElicense_urllicense_urltext/plain43http://bdm.unb.br/xmlui/bitstream/10483/7711/2/license_url321f3992dd3875151d8801b773ab32edMD52license_textlicense_textapplication/octet-stream0http://bdm.unb.br/xmlui/bitstream/10483/7711/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/octet-stream19874http://bdm.unb.br/xmlui/bitstream/10483/7711/4/license_rdf38cb62ef53e6f513db2fb7e337df6485MD54LICENSElicense.txtlicense.txttext/plain1859http://bdm.unb.br/xmlui/bitstream/10483/7711/5/license.txt70ea8b5be25b691674433dc82f5cdd3dMD5510483/77112016-03-14 15:27:02.052oai:bdm.unb.br:10483/7711TGljZW5zZSBncmFudGVkIGJ5IFJ1dGhsZWEgTmFzY2ltZW50byAocnV0aGxlYS5uYXNjaW1lbnRvQGdtYWlsLmNvbSkgb24gMjAxNC0wNi0xOFQxMDozNzoxNVogKEdNVCk6CgrDiSBuZWNlc3PDoXJpbyBjb25jb3JkYXIgY29tIGEgbGljZW7Dp2EgZGUgZGlzdHJpYnVpw6fDo28gbsOjby1leGNsdXNpdmEsCmFudGVzIHF1ZSBvIGRvY3VtZW50byBwb3NzYSBhcGFyZWNlciBubyBSZXBvc2l0w7NyaW8uIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712016-03-14T18:27:02Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false
dc.title.en.fl_str_mv Mineração de opinião em textos opinativos utilizando algoritmos de classificação
title Mineração de opinião em textos opinativos utilizando algoritmos de classificação
spellingShingle Mineração de opinião em textos opinativos utilizando algoritmos de classificação
Santos, Fernando Leandro dos
Mineração de dados
Mineração de texto
Processamento eletrônico de dados
title_short Mineração de opinião em textos opinativos utilizando algoritmos de classificação
title_full Mineração de opinião em textos opinativos utilizando algoritmos de classificação
title_fullStr Mineração de opinião em textos opinativos utilizando algoritmos de classificação
title_full_unstemmed Mineração de opinião em textos opinativos utilizando algoritmos de classificação
title_sort Mineração de opinião em textos opinativos utilizando algoritmos de classificação
author Santos, Fernando Leandro dos
author_facet Santos, Fernando Leandro dos
author_role author
dc.contributor.author.fl_str_mv Santos, Fernando Leandro dos
dc.contributor.advisor1.fl_str_mv Ladeira, Marcelo
contributor_str_mv Ladeira, Marcelo
dc.subject.keyword.en.fl_str_mv Mineração de dados
Mineração de texto
Processamento eletrônico de dados
topic Mineração de dados
Mineração de texto
Processamento eletrônico de dados
description Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2013.
publishDate 2013
dc.date.submitted.none.fl_str_mv 2013-12-20
dc.date.accessioned.fl_str_mv 2014-06-18T18:55:32Z
dc.date.available.fl_str_mv 2014-06-18T18:55:32Z
dc.date.issued.fl_str_mv 2014-06-18T18:55:32Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SANTOS, Fernando. Mineração de opinião em textos opinativos utilizando algoritmos de classificação. 2013. xi, 60 f., il. Monografia (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2013.
dc.identifier.uri.fl_str_mv http://bdm.unb.br/handle/10483/7711
identifier_str_mv SANTOS, Fernando. Mineração de opinião em textos opinativos utilizando algoritmos de classificação. 2013. xi, 60 f., il. Monografia (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2013.
url http://bdm.unb.br/handle/10483/7711
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Monografias da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Biblioteca Digital de Monografias da UnB
collection Biblioteca Digital de Monografias da UnB
bitstream.url.fl_str_mv http://bdm.unb.br/xmlui/bitstream/10483/7711/1/2013_FernandoLeandrodosSantos.pdf
http://bdm.unb.br/xmlui/bitstream/10483/7711/2/license_url
http://bdm.unb.br/xmlui/bitstream/10483/7711/3/license_text
http://bdm.unb.br/xmlui/bitstream/10483/7711/4/license_rdf
http://bdm.unb.br/xmlui/bitstream/10483/7711/5/license.txt
bitstream.checksum.fl_str_mv a54cff4367792f809e4af62b6ec67557
321f3992dd3875151d8801b773ab32ed
d41d8cd98f00b204e9800998ecf8427e
38cb62ef53e6f513db2fb7e337df6485
70ea8b5be25b691674433dc82f5cdd3d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv bdm@bce.unb.br||patricia@bce.unb.br
_version_ 1813907811285860352