Um processo para classificação de sentimentos no twitter utilizando termos factuais e retweets
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
dARK ID: | ark:/64986/0013000015s2w |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/16926 |
Resumo: | A internet hoje pode ser considerada uma das maiores bases de informações do mundo, acessível para qualquer pessoa. Com sua popularização e o crescimento da necessidade de produção de conteúdo, popularizam-se também os blogs e principalmente as redes sociais, onde milhões de usuários trocam informações e opinam sobre os mais diferentes assuntos. Opiniões, por sua vez, são de grande valia no processo decisório, seja de empresas ou de pessoas físicas. Entretanto, o crescimento vertiginoso dessas informações na internet torna o trabalho de obter uma opinião geral acerca de um determinado assunto uma tarefa complicada, sobretudo se for realizada de forma manual. Uma solução automatizada apresenta-se como a melhor saída. Cresce, então, uma área bastante utilizada para construção de sistemas que tratam opinião de forma automatizada, a Análise de Sentimento (AS), também nomeada de Mineração de Opinião. Seu objetivo é classificar textos, sentenças ou blocos de texto como positivos ou negativos acerca da opinião a respeito de algum objeto, seja este um produto, serviço ou até mesmo uma pessoa. Muitos trabalhos foram propostos na área de Análise de Sentimentos, provendo avaliações da opinião global ou detalhada (para cada característica) a respeito do objeto analisado. Entretanto, a grande maioria dos trabalhos obtém a opinião de uma característica do objeto através da análise do adjetivo associado a mesma. O trabalho aqui proposto busca expandir essa análise para as demais palavras, incluindo substantivos e palavras de outras classes gramaticais que possam indicar opinião acerca do objeto. O processo proposto utiliza como fonte de opiniões o debate político polarizado, onde os usuários, potenciais eleitores, se posicionam em um dos lados da disputa. Os dados foram coletados do micro blog Twitter [TWITTER, 2006] até o horário de início das votações. O processo tem como objetivo incluir termos pouco abordados na literatura como representadas das opiniões dos usuários, evitando assim a eliminação sumária de parte do corpus analisado. |
id |
UFPE_ad001e33dfba1382587f9d2c69e5f7a0 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/16926 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
OLIVEIRA, Gleibson Rodrigo Silva deBARROS, Flávia de Almeida2016-05-13T17:35:12Z2016-05-13T17:35:12Z2014-07-01https://repositorio.ufpe.br/handle/123456789/16926ark:/64986/0013000015s2wA internet hoje pode ser considerada uma das maiores bases de informações do mundo, acessível para qualquer pessoa. Com sua popularização e o crescimento da necessidade de produção de conteúdo, popularizam-se também os blogs e principalmente as redes sociais, onde milhões de usuários trocam informações e opinam sobre os mais diferentes assuntos. Opiniões, por sua vez, são de grande valia no processo decisório, seja de empresas ou de pessoas físicas. Entretanto, o crescimento vertiginoso dessas informações na internet torna o trabalho de obter uma opinião geral acerca de um determinado assunto uma tarefa complicada, sobretudo se for realizada de forma manual. Uma solução automatizada apresenta-se como a melhor saída. Cresce, então, uma área bastante utilizada para construção de sistemas que tratam opinião de forma automatizada, a Análise de Sentimento (AS), também nomeada de Mineração de Opinião. Seu objetivo é classificar textos, sentenças ou blocos de texto como positivos ou negativos acerca da opinião a respeito de algum objeto, seja este um produto, serviço ou até mesmo uma pessoa. Muitos trabalhos foram propostos na área de Análise de Sentimentos, provendo avaliações da opinião global ou detalhada (para cada característica) a respeito do objeto analisado. Entretanto, a grande maioria dos trabalhos obtém a opinião de uma característica do objeto através da análise do adjetivo associado a mesma. O trabalho aqui proposto busca expandir essa análise para as demais palavras, incluindo substantivos e palavras de outras classes gramaticais que possam indicar opinião acerca do objeto. O processo proposto utiliza como fonte de opiniões o debate político polarizado, onde os usuários, potenciais eleitores, se posicionam em um dos lados da disputa. Os dados foram coletados do micro blog Twitter [TWITTER, 2006] até o horário de início das votações. O processo tem como objetivo incluir termos pouco abordados na literatura como representadas das opiniões dos usuários, evitando assim a eliminação sumária de parte do corpus analisado.CNPQNowadays, the internet can be considered one of the largest databases of information in the world, accessible to anyone. With its popularity and growth of the need to produce content, also become popular, blogs and especially social networks, where millions of users exchange information and think of the most different subjects. Opinions, in turn, are of great value in the decision making process, whether companies or individuals. However, the rapid growth of such information on the Internet makes work to get a general opinion about a given subject a complicated task, particularly if performed manually. An automated solution is presented as a best option. Grows, then a quite area used to build systems that handle automated opinion, the Sentiment Analysis (SA), also named Mining Opinion. Your goal is to classify texts, sentences or blocks of text as positive or negative opinion about any object, be it a product, service or even a person. Many works have been proposed in the area of sentiment analysis, providing assessments of global or detailed view (for each feature) about the analyzed object. However, the vast majority of researchs get the opinion of a characteristic of the object by analyzing the adjective associated with it. The work proposed here seeks to expand this analysis to other words, including nouns and other grammatical classes of words that may indicate opinion about the object. The proposed process uses polarized political debate as a source of opinions, where users, potential voters, are positioned on one side of the race. Data were collected from the micro blog Twitter [TWITTER, 2006] until the start time of voting. The process aims to include terms used poorly in the literature as represented the views of users, thus avoiding the summary disposal of the analyzed corpus.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência artificialAnálise de dadosUm processo para classificação de sentimentos no twitter utilizando termos factuais e retweetsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDissertacao - Gleibson Oliveira.pdf.jpgDissertacao - Gleibson Oliveira.pdf.jpgGenerated Thumbnailimage/jpeg1269https://repositorio.ufpe.br/bitstream/123456789/16926/5/Dissertacao%20-%20Gleibson%20Oliveira.pdf.jpg95bfd650f1aeca7be76062e7f14a29b0MD55ORIGINALDissertacao - Gleibson Oliveira.pdfDissertacao - Gleibson Oliveira.pdfapplication/pdf1128535https://repositorio.ufpe.br/bitstream/123456789/16926/1/Dissertacao%20-%20Gleibson%20Oliveira.pdf58357adabe3c7e05194c892a9e5f46fdMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81232https://repositorio.ufpe.br/bitstream/123456789/16926/2/license_rdf66e71c371cc565284e70f40736c94386MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/16926/3/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD53TEXTDissertacao - Gleibson Oliveira.pdf.txtDissertacao - Gleibson Oliveira.pdf.txtExtracted texttext/plain128462https://repositorio.ufpe.br/bitstream/123456789/16926/4/Dissertacao%20-%20Gleibson%20Oliveira.pdf.txtda25393b5ac58a38597a10c435d78538MD54123456789/169262019-10-25 05:38:51.278oai:repositorio.ufpe.br:123456789/16926TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T08:38:51Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Um processo para classificação de sentimentos no twitter utilizando termos factuais e retweets |
title |
Um processo para classificação de sentimentos no twitter utilizando termos factuais e retweets |
spellingShingle |
Um processo para classificação de sentimentos no twitter utilizando termos factuais e retweets OLIVEIRA, Gleibson Rodrigo Silva de Inteligência artificial Análise de dados |
title_short |
Um processo para classificação de sentimentos no twitter utilizando termos factuais e retweets |
title_full |
Um processo para classificação de sentimentos no twitter utilizando termos factuais e retweets |
title_fullStr |
Um processo para classificação de sentimentos no twitter utilizando termos factuais e retweets |
title_full_unstemmed |
Um processo para classificação de sentimentos no twitter utilizando termos factuais e retweets |
title_sort |
Um processo para classificação de sentimentos no twitter utilizando termos factuais e retweets |
author |
OLIVEIRA, Gleibson Rodrigo Silva de |
author_facet |
OLIVEIRA, Gleibson Rodrigo Silva de |
author_role |
author |
dc.contributor.author.fl_str_mv |
OLIVEIRA, Gleibson Rodrigo Silva de |
dc.contributor.advisor1.fl_str_mv |
BARROS, Flávia de Almeida |
contributor_str_mv |
BARROS, Flávia de Almeida |
dc.subject.por.fl_str_mv |
Inteligência artificial Análise de dados |
topic |
Inteligência artificial Análise de dados |
description |
A internet hoje pode ser considerada uma das maiores bases de informações do mundo, acessível para qualquer pessoa. Com sua popularização e o crescimento da necessidade de produção de conteúdo, popularizam-se também os blogs e principalmente as redes sociais, onde milhões de usuários trocam informações e opinam sobre os mais diferentes assuntos. Opiniões, por sua vez, são de grande valia no processo decisório, seja de empresas ou de pessoas físicas. Entretanto, o crescimento vertiginoso dessas informações na internet torna o trabalho de obter uma opinião geral acerca de um determinado assunto uma tarefa complicada, sobretudo se for realizada de forma manual. Uma solução automatizada apresenta-se como a melhor saída. Cresce, então, uma área bastante utilizada para construção de sistemas que tratam opinião de forma automatizada, a Análise de Sentimento (AS), também nomeada de Mineração de Opinião. Seu objetivo é classificar textos, sentenças ou blocos de texto como positivos ou negativos acerca da opinião a respeito de algum objeto, seja este um produto, serviço ou até mesmo uma pessoa. Muitos trabalhos foram propostos na área de Análise de Sentimentos, provendo avaliações da opinião global ou detalhada (para cada característica) a respeito do objeto analisado. Entretanto, a grande maioria dos trabalhos obtém a opinião de uma característica do objeto através da análise do adjetivo associado a mesma. O trabalho aqui proposto busca expandir essa análise para as demais palavras, incluindo substantivos e palavras de outras classes gramaticais que possam indicar opinião acerca do objeto. O processo proposto utiliza como fonte de opiniões o debate político polarizado, onde os usuários, potenciais eleitores, se posicionam em um dos lados da disputa. Os dados foram coletados do micro blog Twitter [TWITTER, 2006] até o horário de início das votações. O processo tem como objetivo incluir termos pouco abordados na literatura como representadas das opiniões dos usuários, evitando assim a eliminação sumária de parte do corpus analisado. |
publishDate |
2014 |
dc.date.issued.fl_str_mv |
2014-07-01 |
dc.date.accessioned.fl_str_mv |
2016-05-13T17:35:12Z |
dc.date.available.fl_str_mv |
2016-05-13T17:35:12Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/16926 |
dc.identifier.dark.fl_str_mv |
ark:/64986/0013000015s2w |
url |
https://repositorio.ufpe.br/handle/123456789/16926 |
identifier_str_mv |
ark:/64986/0013000015s2w |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/16926/5/Dissertacao%20-%20Gleibson%20Oliveira.pdf.jpg https://repositorio.ufpe.br/bitstream/123456789/16926/1/Dissertacao%20-%20Gleibson%20Oliveira.pdf https://repositorio.ufpe.br/bitstream/123456789/16926/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/16926/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/16926/4/Dissertacao%20-%20Gleibson%20Oliveira.pdf.txt |
bitstream.checksum.fl_str_mv |
95bfd650f1aeca7be76062e7f14a29b0 58357adabe3c7e05194c892a9e5f46fd 66e71c371cc565284e70f40736c94386 4b8a02c7f2818eaf00dcf2260dd5eb08 da25393b5ac58a38597a10c435d78538 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1815173012661469184 |