Text Mining, um estudo a partir da rede social Twitter
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/102012 |
Resumo: | A cada dia, mais dados são armazenados por computadores cada vez mais poderosos e capazes de processar muita informação. Com isso, cresce a necessidade de utilizar toda essa informação no processo de tomada de decisão. Estima-se que 80% da informação que uma organização dispõe esteja no formato de texto. Além disso, o advento das redes sociais na web possibilitou um ambiente virtual em que milhões de usuários publicam dados pessoais, opiniões e preferências, tornando-se uma fonte preciosa de informação. Diante desse cenário, a descoberta de conhecimento em texto torna-se uma ferramenta importante para extrair informação a partir de bases textuais sem a necessidade de leitura. Nesse sentido, o objetivo deste trabalho é apresentar a abordagem de Text Mining com as fases que compõem o processo, desde a extração até a análise dos dados, e mostrar uma aplicação da técnica com dados do Twitter. Utilizando o software R, foram extraídas as publicações do Twitter da Zero Hora – jornal local – num período de quase 3 meses, e foi construída uma nuvem de palavras com os termos mais frequentes. E, através da técnica de Clustering, os tweets foram agrupados conforme seus assuntos. |
id |
UFRGS-2_d071298e492fa53da489a90e860f0325 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/102012 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Silva, Gabriel Luiz Andriotti daSelau, Lisiane Priscila Roldão2014-08-28T02:11:08Z2013http://hdl.handle.net/10183/102012000933229A cada dia, mais dados são armazenados por computadores cada vez mais poderosos e capazes de processar muita informação. Com isso, cresce a necessidade de utilizar toda essa informação no processo de tomada de decisão. Estima-se que 80% da informação que uma organização dispõe esteja no formato de texto. Além disso, o advento das redes sociais na web possibilitou um ambiente virtual em que milhões de usuários publicam dados pessoais, opiniões e preferências, tornando-se uma fonte preciosa de informação. Diante desse cenário, a descoberta de conhecimento em texto torna-se uma ferramenta importante para extrair informação a partir de bases textuais sem a necessidade de leitura. Nesse sentido, o objetivo deste trabalho é apresentar a abordagem de Text Mining com as fases que compõem o processo, desde a extração até a análise dos dados, e mostrar uma aplicação da técnica com dados do Twitter. Utilizando o software R, foram extraídas as publicações do Twitter da Zero Hora – jornal local – num período de quase 3 meses, e foi construída uma nuvem de palavras com os termos mais frequentes. E, através da técnica de Clustering, os tweets foram agrupados conforme seus assuntos.application/pdfporRedes sociaisSoftware estatísticoAnálise de dadosText Mining, um estudo a partir da rede social Twitterinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de Matemática. Departamento de EstatísticaPorto Alegre, BR-RS2013Estatística: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000933229.pdf000933229.pdfTexto completoapplication/pdf1356475http://www.lume.ufrgs.br/bitstream/10183/102012/1/000933229.pdfd6de10b61e6a757c988cdd2085197699MD51TEXT000933229.pdf.txt000933229.pdf.txtExtracted Texttext/plain55583http://www.lume.ufrgs.br/bitstream/10183/102012/2/000933229.pdf.txt6324a344b3cd5aa0f347c8f76dfd3ebbMD52THUMBNAIL000933229.pdf.jpg000933229.pdf.jpgGenerated Thumbnailimage/jpeg1172http://www.lume.ufrgs.br/bitstream/10183/102012/3/000933229.pdf.jpg766605f493be53ce8401c7a3f01b2762MD5310183/1020122019-01-17 04:23:27.012432oai:www.lume.ufrgs.br:10183/102012Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2019-01-17T06:23:27Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Text Mining, um estudo a partir da rede social Twitter |
title |
Text Mining, um estudo a partir da rede social Twitter |
spellingShingle |
Text Mining, um estudo a partir da rede social Twitter Silva, Gabriel Luiz Andriotti da Redes sociais Software estatístico Análise de dados |
title_short |
Text Mining, um estudo a partir da rede social Twitter |
title_full |
Text Mining, um estudo a partir da rede social Twitter |
title_fullStr |
Text Mining, um estudo a partir da rede social Twitter |
title_full_unstemmed |
Text Mining, um estudo a partir da rede social Twitter |
title_sort |
Text Mining, um estudo a partir da rede social Twitter |
author |
Silva, Gabriel Luiz Andriotti da |
author_facet |
Silva, Gabriel Luiz Andriotti da |
author_role |
author |
dc.contributor.author.fl_str_mv |
Silva, Gabriel Luiz Andriotti da |
dc.contributor.advisor1.fl_str_mv |
Selau, Lisiane Priscila Roldão |
contributor_str_mv |
Selau, Lisiane Priscila Roldão |
dc.subject.por.fl_str_mv |
Redes sociais Software estatístico Análise de dados |
topic |
Redes sociais Software estatístico Análise de dados |
description |
A cada dia, mais dados são armazenados por computadores cada vez mais poderosos e capazes de processar muita informação. Com isso, cresce a necessidade de utilizar toda essa informação no processo de tomada de decisão. Estima-se que 80% da informação que uma organização dispõe esteja no formato de texto. Além disso, o advento das redes sociais na web possibilitou um ambiente virtual em que milhões de usuários publicam dados pessoais, opiniões e preferências, tornando-se uma fonte preciosa de informação. Diante desse cenário, a descoberta de conhecimento em texto torna-se uma ferramenta importante para extrair informação a partir de bases textuais sem a necessidade de leitura. Nesse sentido, o objetivo deste trabalho é apresentar a abordagem de Text Mining com as fases que compõem o processo, desde a extração até a análise dos dados, e mostrar uma aplicação da técnica com dados do Twitter. Utilizando o software R, foram extraídas as publicações do Twitter da Zero Hora – jornal local – num período de quase 3 meses, e foi construída uma nuvem de palavras com os termos mais frequentes. E, através da técnica de Clustering, os tweets foram agrupados conforme seus assuntos. |
publishDate |
2013 |
dc.date.issued.fl_str_mv |
2013 |
dc.date.accessioned.fl_str_mv |
2014-08-28T02:11:08Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/102012 |
dc.identifier.nrb.pt_BR.fl_str_mv |
000933229 |
url |
http://hdl.handle.net/10183/102012 |
identifier_str_mv |
000933229 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/102012/1/000933229.pdf http://www.lume.ufrgs.br/bitstream/10183/102012/2/000933229.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/102012/3/000933229.pdf.jpg |
bitstream.checksum.fl_str_mv |
d6de10b61e6a757c988cdd2085197699 6324a344b3cd5aa0f347c8f76dfd3ebb 766605f493be53ce8401c7a3f01b2762 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1801224470508077056 |