Text Mining, um estudo a partir da rede social Twitter

Detalhes bibliográficos
Autor(a) principal: Silva, Gabriel Luiz Andriotti da
Data de Publicação: 2013
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/102012
Resumo: A cada dia, mais dados são armazenados por computadores cada vez mais poderosos e capazes de processar muita informação. Com isso, cresce a necessidade de utilizar toda essa informação no processo de tomada de decisão. Estima-se que 80% da informação que uma organização dispõe esteja no formato de texto. Além disso, o advento das redes sociais na web possibilitou um ambiente virtual em que milhões de usuários publicam dados pessoais, opiniões e preferências, tornando-se uma fonte preciosa de informação. Diante desse cenário, a descoberta de conhecimento em texto torna-se uma ferramenta importante para extrair informação a partir de bases textuais sem a necessidade de leitura. Nesse sentido, o objetivo deste trabalho é apresentar a abordagem de Text Mining com as fases que compõem o processo, desde a extração até a análise dos dados, e mostrar uma aplicação da técnica com dados do Twitter. Utilizando o software R, foram extraídas as publicações do Twitter da Zero Hora – jornal local – num período de quase 3 meses, e foi construída uma nuvem de palavras com os termos mais frequentes. E, através da técnica de Clustering, os tweets foram agrupados conforme seus assuntos.
id UFRGS-2_d071298e492fa53da489a90e860f0325
oai_identifier_str oai:www.lume.ufrgs.br:10183/102012
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Silva, Gabriel Luiz Andriotti daSelau, Lisiane Priscila Roldão2014-08-28T02:11:08Z2013http://hdl.handle.net/10183/102012000933229A cada dia, mais dados são armazenados por computadores cada vez mais poderosos e capazes de processar muita informação. Com isso, cresce a necessidade de utilizar toda essa informação no processo de tomada de decisão. Estima-se que 80% da informação que uma organização dispõe esteja no formato de texto. Além disso, o advento das redes sociais na web possibilitou um ambiente virtual em que milhões de usuários publicam dados pessoais, opiniões e preferências, tornando-se uma fonte preciosa de informação. Diante desse cenário, a descoberta de conhecimento em texto torna-se uma ferramenta importante para extrair informação a partir de bases textuais sem a necessidade de leitura. Nesse sentido, o objetivo deste trabalho é apresentar a abordagem de Text Mining com as fases que compõem o processo, desde a extração até a análise dos dados, e mostrar uma aplicação da técnica com dados do Twitter. Utilizando o software R, foram extraídas as publicações do Twitter da Zero Hora – jornal local – num período de quase 3 meses, e foi construída uma nuvem de palavras com os termos mais frequentes. E, através da técnica de Clustering, os tweets foram agrupados conforme seus assuntos.application/pdfporRedes sociaisSoftware estatísticoAnálise de dadosText Mining, um estudo a partir da rede social Twitterinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de Matemática. Departamento de EstatísticaPorto Alegre, BR-RS2013Estatística: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000933229.pdf000933229.pdfTexto completoapplication/pdf1356475http://www.lume.ufrgs.br/bitstream/10183/102012/1/000933229.pdfd6de10b61e6a757c988cdd2085197699MD51TEXT000933229.pdf.txt000933229.pdf.txtExtracted Texttext/plain55583http://www.lume.ufrgs.br/bitstream/10183/102012/2/000933229.pdf.txt6324a344b3cd5aa0f347c8f76dfd3ebbMD52THUMBNAIL000933229.pdf.jpg000933229.pdf.jpgGenerated Thumbnailimage/jpeg1172http://www.lume.ufrgs.br/bitstream/10183/102012/3/000933229.pdf.jpg766605f493be53ce8401c7a3f01b2762MD5310183/1020122019-01-17 04:23:27.012432oai:www.lume.ufrgs.br:10183/102012Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2019-01-17T06:23:27Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Text Mining, um estudo a partir da rede social Twitter
title Text Mining, um estudo a partir da rede social Twitter
spellingShingle Text Mining, um estudo a partir da rede social Twitter
Silva, Gabriel Luiz Andriotti da
Redes sociais
Software estatístico
Análise de dados
title_short Text Mining, um estudo a partir da rede social Twitter
title_full Text Mining, um estudo a partir da rede social Twitter
title_fullStr Text Mining, um estudo a partir da rede social Twitter
title_full_unstemmed Text Mining, um estudo a partir da rede social Twitter
title_sort Text Mining, um estudo a partir da rede social Twitter
author Silva, Gabriel Luiz Andriotti da
author_facet Silva, Gabriel Luiz Andriotti da
author_role author
dc.contributor.author.fl_str_mv Silva, Gabriel Luiz Andriotti da
dc.contributor.advisor1.fl_str_mv Selau, Lisiane Priscila Roldão
contributor_str_mv Selau, Lisiane Priscila Roldão
dc.subject.por.fl_str_mv Redes sociais
Software estatístico
Análise de dados
topic Redes sociais
Software estatístico
Análise de dados
description A cada dia, mais dados são armazenados por computadores cada vez mais poderosos e capazes de processar muita informação. Com isso, cresce a necessidade de utilizar toda essa informação no processo de tomada de decisão. Estima-se que 80% da informação que uma organização dispõe esteja no formato de texto. Além disso, o advento das redes sociais na web possibilitou um ambiente virtual em que milhões de usuários publicam dados pessoais, opiniões e preferências, tornando-se uma fonte preciosa de informação. Diante desse cenário, a descoberta de conhecimento em texto torna-se uma ferramenta importante para extrair informação a partir de bases textuais sem a necessidade de leitura. Nesse sentido, o objetivo deste trabalho é apresentar a abordagem de Text Mining com as fases que compõem o processo, desde a extração até a análise dos dados, e mostrar uma aplicação da técnica com dados do Twitter. Utilizando o software R, foram extraídas as publicações do Twitter da Zero Hora – jornal local – num período de quase 3 meses, e foi construída uma nuvem de palavras com os termos mais frequentes. E, através da técnica de Clustering, os tweets foram agrupados conforme seus assuntos.
publishDate 2013
dc.date.issued.fl_str_mv 2013
dc.date.accessioned.fl_str_mv 2014-08-28T02:11:08Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/102012
dc.identifier.nrb.pt_BR.fl_str_mv 000933229
url http://hdl.handle.net/10183/102012
identifier_str_mv 000933229
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/102012/1/000933229.pdf
http://www.lume.ufrgs.br/bitstream/10183/102012/2/000933229.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/102012/3/000933229.pdf.jpg
bitstream.checksum.fl_str_mv d6de10b61e6a757c988cdd2085197699
6324a344b3cd5aa0f347c8f76dfd3ebb
766605f493be53ce8401c7a3f01b2762
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224470508077056