Mineração de opinião em textos opinativos utilizando algoritmos de classificação
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Monografias da UnB |
Texto Completo: | http://bdm.unb.br/handle/10483/7711 |
Resumo: | Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2013. |
id |
UNB-2_30df14e83e7bb9ac6c9f3b4868831de1 |
---|---|
oai_identifier_str |
oai:bdm.unb.br:10483/7711 |
network_acronym_str |
UNB-2 |
network_name_str |
Biblioteca Digital de Monografias da UnB |
repository_id_str |
11571 |
spelling |
Santos, Fernando Leandro dosLadeira, MarceloSANTOS, Fernando. Mineração de opinião em textos opinativos utilizando algoritmos de classificação. 2013. xi, 60 f., il. Monografia (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2013.http://bdm.unb.br/handle/10483/7711Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2013.Este trabalho descreve uma análise de mineração de opinião realizada sobre uma base de dados extraída da intenet e composta de comentários que contêm gírias, abreviações e outros jargões da internet. A mineração de opinião é a área de estudos que tenta identificar e classificar a subjetividade, como opiniões, emoções ou sentimentos na linguagem natural. Nesta pesquisa, 759 mil comentários em português foram extraídos da loja de aplicativos Google Play. Devido à grande quantidade de comentários, foram necessárias técnicas de processamento distribuído, envolvendo ferramentas poderosas como o Hadoop e o Mahout. O trabalho teve como principal constatação a verificação da baixa eficácia do pré-processamento em textos para a tarefa de mineração de opinião no domínio tratado. O trabalho também contribuiu com a criação de um corpus composto por 759 mil comentários e um dicionário de gírias, abreviações da Internet. _____________________________________________________________________________ ABSTRACTThis work describes an opinion mining aplication over a dataset extracted from the web and composed of reviews with lots of internet slangs, abbreviations and typo errors. Opinion mining is a study field that tries to identify and classify subjectivity, such as opinions, emotions or sentiments in natural language. In this research, 759 thousand portuguese reviews were extracted from the app store Google Play. Due to the large amount of reviews, large scale processing techniques were needed, envolving powerful frameworks such as Hadoop and Mahout. The main contribution of this research was to verify the low efficiency of pre-processing techniques in the opinion mining task for the treated domain. The work also contributed to the creation of a corpus consisting of 759 thousand reviews and a dictionary of slangs and abbreviations commonly used in the Internet.Submitted by Ruthlea Nascimento (ruthlea.nascimento@gmail.com) on 2014-06-18T10:37:15Z No. of bitstreams: 1 2013_FernandoLeandrodosSantos.pdf: 1841807 bytes, checksum: a54cff4367792f809e4af62b6ec67557 (MD5)Approved for entry into archive by Elna Araujo (elna@bce.unb.br) on 2014-06-18T18:55:32Z (GMT) No. of bitstreams: 1 2013_FernandoLeandrodosSantos.pdf: 1841807 bytes, checksum: a54cff4367792f809e4af62b6ec67557 (MD5)Made available in DSpace on 2014-06-18T18:55:32Z (GMT). No. of bitstreams: 1 2013_FernandoLeandrodosSantos.pdf: 1841807 bytes, checksum: a54cff4367792f809e4af62b6ec67557 (MD5)Mineração de dadosMineração de textoProcessamento eletrônico de dadosMineração de opinião em textos opinativos utilizando algoritmos de classificaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2014-06-18T18:55:32Z2014-06-18T18:55:32Z2014-06-18T18:55:32Z2013-12-20info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2013_FernandoLeandrodosSantos.pdf2013_FernandoLeandrodosSantos.pdfapplication/pdf1841807http://bdm.unb.br/xmlui/bitstream/10483/7711/1/2013_FernandoLeandrodosSantos.pdfa54cff4367792f809e4af62b6ec67557MD51CC-LICENSElicense_urllicense_urltext/plain43http://bdm.unb.br/xmlui/bitstream/10483/7711/2/license_url321f3992dd3875151d8801b773ab32edMD52license_textlicense_textapplication/octet-stream0http://bdm.unb.br/xmlui/bitstream/10483/7711/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/octet-stream19874http://bdm.unb.br/xmlui/bitstream/10483/7711/4/license_rdf38cb62ef53e6f513db2fb7e337df6485MD54LICENSElicense.txtlicense.txttext/plain1859http://bdm.unb.br/xmlui/bitstream/10483/7711/5/license.txt70ea8b5be25b691674433dc82f5cdd3dMD5510483/77112016-03-14 15:27:02.052oai:bdm.unb.br:10483/7711TGljZW5zZSBncmFudGVkIGJ5IFJ1dGhsZWEgTmFzY2ltZW50byAocnV0aGxlYS5uYXNjaW1lbnRvQGdtYWlsLmNvbSkgb24gMjAxNC0wNi0xOFQxMDozNzoxNVogKEdNVCk6CgrDiSBuZWNlc3PDoXJpbyBjb25jb3JkYXIgY29tIGEgbGljZW7Dp2EgZGUgZGlzdHJpYnVpw6fDo28gbsOjby1leGNsdXNpdmEsCmFudGVzIHF1ZSBvIGRvY3VtZW50byBwb3NzYSBhcGFyZWNlciBubyBSZXBvc2l0w7NyaW8uIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712016-03-14T18:27:02Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false |
dc.title.en.fl_str_mv |
Mineração de opinião em textos opinativos utilizando algoritmos de classificação |
title |
Mineração de opinião em textos opinativos utilizando algoritmos de classificação |
spellingShingle |
Mineração de opinião em textos opinativos utilizando algoritmos de classificação Santos, Fernando Leandro dos Mineração de dados Mineração de texto Processamento eletrônico de dados |
title_short |
Mineração de opinião em textos opinativos utilizando algoritmos de classificação |
title_full |
Mineração de opinião em textos opinativos utilizando algoritmos de classificação |
title_fullStr |
Mineração de opinião em textos opinativos utilizando algoritmos de classificação |
title_full_unstemmed |
Mineração de opinião em textos opinativos utilizando algoritmos de classificação |
title_sort |
Mineração de opinião em textos opinativos utilizando algoritmos de classificação |
author |
Santos, Fernando Leandro dos |
author_facet |
Santos, Fernando Leandro dos |
author_role |
author |
dc.contributor.author.fl_str_mv |
Santos, Fernando Leandro dos |
dc.contributor.advisor1.fl_str_mv |
Ladeira, Marcelo |
contributor_str_mv |
Ladeira, Marcelo |
dc.subject.keyword.en.fl_str_mv |
Mineração de dados Mineração de texto Processamento eletrônico de dados |
topic |
Mineração de dados Mineração de texto Processamento eletrônico de dados |
description |
Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2013. |
publishDate |
2013 |
dc.date.submitted.none.fl_str_mv |
2013-12-20 |
dc.date.accessioned.fl_str_mv |
2014-06-18T18:55:32Z |
dc.date.available.fl_str_mv |
2014-06-18T18:55:32Z |
dc.date.issued.fl_str_mv |
2014-06-18T18:55:32Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SANTOS, Fernando. Mineração de opinião em textos opinativos utilizando algoritmos de classificação. 2013. xi, 60 f., il. Monografia (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2013. |
dc.identifier.uri.fl_str_mv |
http://bdm.unb.br/handle/10483/7711 |
identifier_str_mv |
SANTOS, Fernando. Mineração de opinião em textos opinativos utilizando algoritmos de classificação. 2013. xi, 60 f., il. Monografia (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2013. |
url |
http://bdm.unb.br/handle/10483/7711 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Monografias da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
instname_str |
Universidade de Brasília (UnB) |
instacron_str |
UNB |
institution |
UNB |
reponame_str |
Biblioteca Digital de Monografias da UnB |
collection |
Biblioteca Digital de Monografias da UnB |
bitstream.url.fl_str_mv |
http://bdm.unb.br/xmlui/bitstream/10483/7711/1/2013_FernandoLeandrodosSantos.pdf http://bdm.unb.br/xmlui/bitstream/10483/7711/2/license_url http://bdm.unb.br/xmlui/bitstream/10483/7711/3/license_text http://bdm.unb.br/xmlui/bitstream/10483/7711/4/license_rdf http://bdm.unb.br/xmlui/bitstream/10483/7711/5/license.txt |
bitstream.checksum.fl_str_mv |
a54cff4367792f809e4af62b6ec67557 321f3992dd3875151d8801b773ab32ed d41d8cd98f00b204e9800998ecf8427e 38cb62ef53e6f513db2fb7e337df6485 70ea8b5be25b691674433dc82f5cdd3d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB) |
repository.mail.fl_str_mv |
bdm@bce.unb.br||patricia@bce.unb.br |
_version_ |
1813907811285860352 |