Identificação de autoridades em tópicos na blogosfera brasileira usando comentários como relacionamento

Detalhes bibliográficos
Autor(a) principal: Santos, Henrique Dias Pereira dos
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/66194
Resumo: Com o aumento dos usuários acessando a internet no Brasil, cresce a quantidade de conteúdo produzido por brasileiros. Assim se torna importante classificar os melhores autores para que se tenha mais confiança nos textos lidos. Nesse sentido, esta dissertação faz um estudo sobre a descoberta de autoridades em tópicos na blogosfera brasileira. O escopo de estudo e análise é a plataforma de publicação de blogs, Blogspot, sobre os blogueiros que se identificam como brasileiros. Para tanto, foram coletados nove milhões de postagens do ano de 2012 e considerados os comentários como fonte de relacionamento entre os blogueiros para gerar uma rede social. Essa rede foi usada para experimentos do algoritmo de identificação de autoridades em tópicos. O algoritmo utilizado como base é o Topic PageRank, separando os diversos tópicos da blogosfera pelas tags que os usuários definem em suas postagens e posteriormente construindo a lista das autoridades em tais tópicos. Experimentos realizados demonstram que o método proposto resulta em melhor ranqueamento que o algoritmo original do PageRank. Cabe salientar que foi feita uma caracterização dos dados coletados por um questionário aplicado a quatro mil autores.
id URGS_fb4dfae335a767d550a2ee89889e5243
oai_identifier_str oai:www.lume.ufrgs.br:10183/66194
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Santos, Henrique Dias Pereira dosWives, Leandro Krug2013-02-06T01:40:57Z2013http://hdl.handle.net/10183/66194000871082Com o aumento dos usuários acessando a internet no Brasil, cresce a quantidade de conteúdo produzido por brasileiros. Assim se torna importante classificar os melhores autores para que se tenha mais confiança nos textos lidos. Nesse sentido, esta dissertação faz um estudo sobre a descoberta de autoridades em tópicos na blogosfera brasileira. O escopo de estudo e análise é a plataforma de publicação de blogs, Blogspot, sobre os blogueiros que se identificam como brasileiros. Para tanto, foram coletados nove milhões de postagens do ano de 2012 e considerados os comentários como fonte de relacionamento entre os blogueiros para gerar uma rede social. Essa rede foi usada para experimentos do algoritmo de identificação de autoridades em tópicos. O algoritmo utilizado como base é o Topic PageRank, separando os diversos tópicos da blogosfera pelas tags que os usuários definem em suas postagens e posteriormente construindo a lista das autoridades em tais tópicos. Experimentos realizados demonstram que o método proposto resulta em melhor ranqueamento que o algoritmo original do PageRank. Cabe salientar que foi feita uma caracterização dos dados coletados por um questionário aplicado a quatro mil autores.With the intesification of users accessing the Internet in Brazil, the amount of content produced by Brazilians increases. Thus, it becomes important to classify the best authors to have more confidence in the texts read. In this sense, this work presents a study on subject of topic authorities discovery in the Brazilian blogosphere. The scope of the study is the Blogspot platform, focusing on bloggers who identify themselves as Brazilians. To this end, we collected nine millions posts in the year of 2012 and considered the comments as a source of relationship between bloggers to generate a social network. This network was used for performing experiments considering the proposed approach to identify topic authorities. The algorithm used is based on the Topic PageRank, which can separate the different blogosphere’s topics by tags that users use on their posts, and then building the list of authorities on such topics. The experiments conducted show that the proposed approach results in better ranking than the original PageRank algorithm. We also characterize the collected database with a survey of over four thousand authors.application/pdfporSistemas : InformaçãoRecuperacao : InformacaoArmazenamento : DadosAuthorityBrazilian blogosphereSocial network analysisRankingIdentificação de autoridades em tópicos na blogosfera brasileira usando comentários como relacionamentoTopical authority identification in the brazilian blogosphere using comments as relationships info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2013mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000871082.pdf000871082.pdfTexto completoapplication/pdf3027887http://www.lume.ufrgs.br/bitstream/10183/66194/1/000871082.pdf8816e733d9ff3eeabf5db4a676fc1d87MD51TEXT000871082.pdf.txt000871082.pdf.txtExtracted Texttext/plain119162http://www.lume.ufrgs.br/bitstream/10183/66194/2/000871082.pdf.txt0c1c1a7eb53ff1bda57321b0f3353a2bMD52THUMBNAIL000871082.pdf.jpg000871082.pdf.jpgGenerated Thumbnailimage/jpeg1059http://www.lume.ufrgs.br/bitstream/10183/66194/3/000871082.pdf.jpgc04a89c5b4e1f9480f2264781cabbcf0MD5310183/661942020-10-17 04:12:34.872018oai:www.lume.ufrgs.br:10183/66194Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532020-10-17T07:12:34Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Identificação de autoridades em tópicos na blogosfera brasileira usando comentários como relacionamento
dc.title.alternative.en.fl_str_mv Topical authority identification in the brazilian blogosphere using comments as relationships
title Identificação de autoridades em tópicos na blogosfera brasileira usando comentários como relacionamento
spellingShingle Identificação de autoridades em tópicos na blogosfera brasileira usando comentários como relacionamento
Santos, Henrique Dias Pereira dos
Sistemas : Informação
Recuperacao : Informacao
Armazenamento : Dados
Authority
Brazilian blogosphere
Social network analysis
Ranking
title_short Identificação de autoridades em tópicos na blogosfera brasileira usando comentários como relacionamento
title_full Identificação de autoridades em tópicos na blogosfera brasileira usando comentários como relacionamento
title_fullStr Identificação de autoridades em tópicos na blogosfera brasileira usando comentários como relacionamento
title_full_unstemmed Identificação de autoridades em tópicos na blogosfera brasileira usando comentários como relacionamento
title_sort Identificação de autoridades em tópicos na blogosfera brasileira usando comentários como relacionamento
author Santos, Henrique Dias Pereira dos
author_facet Santos, Henrique Dias Pereira dos
author_role author
dc.contributor.author.fl_str_mv Santos, Henrique Dias Pereira dos
dc.contributor.advisor1.fl_str_mv Wives, Leandro Krug
contributor_str_mv Wives, Leandro Krug
dc.subject.por.fl_str_mv Sistemas : Informação
Recuperacao : Informacao
Armazenamento : Dados
topic Sistemas : Informação
Recuperacao : Informacao
Armazenamento : Dados
Authority
Brazilian blogosphere
Social network analysis
Ranking
dc.subject.eng.fl_str_mv Authority
Brazilian blogosphere
Social network analysis
Ranking
description Com o aumento dos usuários acessando a internet no Brasil, cresce a quantidade de conteúdo produzido por brasileiros. Assim se torna importante classificar os melhores autores para que se tenha mais confiança nos textos lidos. Nesse sentido, esta dissertação faz um estudo sobre a descoberta de autoridades em tópicos na blogosfera brasileira. O escopo de estudo e análise é a plataforma de publicação de blogs, Blogspot, sobre os blogueiros que se identificam como brasileiros. Para tanto, foram coletados nove milhões de postagens do ano de 2012 e considerados os comentários como fonte de relacionamento entre os blogueiros para gerar uma rede social. Essa rede foi usada para experimentos do algoritmo de identificação de autoridades em tópicos. O algoritmo utilizado como base é o Topic PageRank, separando os diversos tópicos da blogosfera pelas tags que os usuários definem em suas postagens e posteriormente construindo a lista das autoridades em tais tópicos. Experimentos realizados demonstram que o método proposto resulta em melhor ranqueamento que o algoritmo original do PageRank. Cabe salientar que foi feita uma caracterização dos dados coletados por um questionário aplicado a quatro mil autores.
publishDate 2013
dc.date.accessioned.fl_str_mv 2013-02-06T01:40:57Z
dc.date.issued.fl_str_mv 2013
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/66194
dc.identifier.nrb.pt_BR.fl_str_mv 000871082
url http://hdl.handle.net/10183/66194
identifier_str_mv 000871082
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/66194/1/000871082.pdf
http://www.lume.ufrgs.br/bitstream/10183/66194/2/000871082.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/66194/3/000871082.pdf.jpg
bitstream.checksum.fl_str_mv 8816e733d9ff3eeabf5db4a676fc1d87
0c1c1a7eb53ff1bda57321b0f3353a2b
c04a89c5b4e1f9480f2264781cabbcf0
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085249164509184