Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica

Detalhes bibliográficos
Autor(a) principal: SANTOS, David Wilson de Farias
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
Texto Completo: https://repositorio.ufpe.br/handle/123456789/35365
Resumo: Diariamente, milhares de conteúdos textuais e visuais são compartilhadas entre as pessoas nas redes sociais, entretanto, enquanto alguns conteúdos conseguem engajar vários usuários, outros são totalmente ignorados não alcançando a popularidade que é tão almejada nessas plataformas. Devido a isso, houve um crescimento do interesse dos cientistas de dados na tentativa de entender o que torna alguns conteúdos mais relevantes do que outros. Pois, a compreensão do que torna um conteúdo popular é uma oportunidade sem precedentes para grandes aplicações comerciais, tais como sistemas de recomendação e marketing digital que quer aproveitar ao máximo a atenção do público. Por essas razões o problema de predição de popularidade em mídias sociais tem sido estudado extensivamente ao longo dos últimos anos. Pesquisas anteriores seguem abordagens que atuam sobre dados textuais, visuais e características sociais do perfil. Apesar de alcançarem resultados promissores, os modelos obtidos apresentam pouca capacidade de generalização, devido ao uso de dados direcionados a usuários específicos, dificultando assim a predição de popularidade de novos conteúdos. Portanto, será proposta uma Rede de Atenção Hierárquica Estendida (RAHE) que atende hierarquicamente dados textuais e visuais, levando em conta a influência de um contexto compartilhado entre os usuários de características sociais em comum, representações textuais a nível de caracteres e um método que minimiza os erros obtidos pela predição de popularidade. O objetivo dessa abordagem é tratar os problemas de diversidade e capacidade de generalização encontradas por grande parte dos modelos presentes no estado da arte no problema de predição de popularidade de novos conteúdos. Os experimentos realizados sobre a base de dados Temporal Popularity Image Collection (TPIC) do Flickr demostraram que o modelo RAHE, além de tratar bem a diversidade, apresenta uma alta capacidade de generalização, pois, consegue reduzir significativamente o erro médio quadrático obtido pelo baseline na predição de popularidade de imagens publicadas por novos usuários em 48,14%.
id UFPE_18fdccba90003e0a6efd56c54fc2f2e8
oai_identifier_str oai:repositorio.ufpe.br:123456789/35365
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling SANTOS, David Wilson de Fariashttp://lattes.cnpq.br/6965540005317586http://lattes.cnpq.br/3084134533707587REN, Tsang Ing2019-11-29T16:37:15Z2019-11-29T16:37:15Z2019-08-23SANTOS, David Wilson de Farias. Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019.https://repositorio.ufpe.br/handle/123456789/35365Diariamente, milhares de conteúdos textuais e visuais são compartilhadas entre as pessoas nas redes sociais, entretanto, enquanto alguns conteúdos conseguem engajar vários usuários, outros são totalmente ignorados não alcançando a popularidade que é tão almejada nessas plataformas. Devido a isso, houve um crescimento do interesse dos cientistas de dados na tentativa de entender o que torna alguns conteúdos mais relevantes do que outros. Pois, a compreensão do que torna um conteúdo popular é uma oportunidade sem precedentes para grandes aplicações comerciais, tais como sistemas de recomendação e marketing digital que quer aproveitar ao máximo a atenção do público. Por essas razões o problema de predição de popularidade em mídias sociais tem sido estudado extensivamente ao longo dos últimos anos. Pesquisas anteriores seguem abordagens que atuam sobre dados textuais, visuais e características sociais do perfil. Apesar de alcançarem resultados promissores, os modelos obtidos apresentam pouca capacidade de generalização, devido ao uso de dados direcionados a usuários específicos, dificultando assim a predição de popularidade de novos conteúdos. Portanto, será proposta uma Rede de Atenção Hierárquica Estendida (RAHE) que atende hierarquicamente dados textuais e visuais, levando em conta a influência de um contexto compartilhado entre os usuários de características sociais em comum, representações textuais a nível de caracteres e um método que minimiza os erros obtidos pela predição de popularidade. O objetivo dessa abordagem é tratar os problemas de diversidade e capacidade de generalização encontradas por grande parte dos modelos presentes no estado da arte no problema de predição de popularidade de novos conteúdos. Os experimentos realizados sobre a base de dados Temporal Popularity Image Collection (TPIC) do Flickr demostraram que o modelo RAHE, além de tratar bem a diversidade, apresenta uma alta capacidade de generalização, pois, consegue reduzir significativamente o erro médio quadrático obtido pelo baseline na predição de popularidade de imagens publicadas por novos usuários em 48,14%.Every day thousands of textual and visual information are shared among people every minute, however some content attracts the attention of many users; while others are totally ignored, not reaching the popularity that is so desired on these platforms. Because of this, there has been a growing interest from scientists in an attempt to understand what makes some content more relevant than others. Because understanding what makes content popular is an unprecedented opportunity for large commercial applications like recommendation systems and digital marketing that want to get the most out of the public’s attention. For these reasons, the problem of predicting popularity on social media has been studied extensively in recent years. Previous research follows approaches that act on textual, visual and social characteristics of the profile.Although achieving promising results, the models achieved have little generalization capacity due to the use of specific users data, thus making it difficult to predict new content. Therefore, it will be proposed an Extended Hierarchical Attention Network (RAHE) which hierarchically attends textual and visual data, taking into account the influence of a shared context among users of common social characteristics, textual representations at character-level and a method which minimizes error obtained by popularity predicting. This approach aims to address the diversity and generalizability problems encountered by most state-of-the-art models in the popularity predicting problem of new content. The experiments performed on Flickr’s Temporal Popularity Image Collection (TPIC) database showed that the RAHE model, besides handling diversity as well, has a high generalization capacity, since it can significantly reduce the mean square error obtained by the popularity prediction of images posted by new users at 48.14%.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência ComputacionalMídia SocialRedes de AtençãoDados VisuaisPredição de popularidade em mídia social utilizando uma rede de atenção hierárquicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALDISSERTAÇÃO David Wilson de Farias Santos.pdfDISSERTAÇÃO David Wilson de Farias Santos.pdfapplication/pdf3327084https://repositorio.ufpe.br/bitstream/123456789/35365/1/DISSERTA%c3%87%c3%83O%20David%20Wilson%20de%20Farias%20Santos.pdfef3111e0b575b050166bd2096f002c56MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/35365/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufpe.br/bitstream/123456789/35365/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXTDISSERTAÇÃO David Wilson de Farias Santos.pdf.txtDISSERTAÇÃO David Wilson de Farias Santos.pdf.txtExtracted texttext/plain221208https://repositorio.ufpe.br/bitstream/123456789/35365/4/DISSERTA%c3%87%c3%83O%20David%20Wilson%20de%20Farias%20Santos.pdf.txtd530c19d29cc88a7302bba03a1fe2a35MD54THUMBNAILDISSERTAÇÃO David Wilson de Farias Santos.pdf.jpgDISSERTAÇÃO David Wilson de Farias Santos.pdf.jpgGenerated Thumbnailimage/jpeg1240https://repositorio.ufpe.br/bitstream/123456789/35365/5/DISSERTA%c3%87%c3%83O%20David%20Wilson%20de%20Farias%20Santos.pdf.jpg5eb98c3c5c890d86a806a20667e4d50dMD55123456789/353652019-11-30 02:10:31.829oai:repositorio.ufpe.br:123456789/35365Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-11-30T05:10:31Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica
title Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica
spellingShingle Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica
SANTOS, David Wilson de Farias
Inteligência Computacional
Mídia Social
Redes de Atenção
Dados Visuais
title_short Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica
title_full Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica
title_fullStr Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica
title_full_unstemmed Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica
title_sort Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica
author SANTOS, David Wilson de Farias
author_facet SANTOS, David Wilson de Farias
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/6965540005317586
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3084134533707587
dc.contributor.author.fl_str_mv SANTOS, David Wilson de Farias
dc.contributor.advisor1.fl_str_mv REN, Tsang Ing
contributor_str_mv REN, Tsang Ing
dc.subject.por.fl_str_mv Inteligência Computacional
Mídia Social
Redes de Atenção
Dados Visuais
topic Inteligência Computacional
Mídia Social
Redes de Atenção
Dados Visuais
description Diariamente, milhares de conteúdos textuais e visuais são compartilhadas entre as pessoas nas redes sociais, entretanto, enquanto alguns conteúdos conseguem engajar vários usuários, outros são totalmente ignorados não alcançando a popularidade que é tão almejada nessas plataformas. Devido a isso, houve um crescimento do interesse dos cientistas de dados na tentativa de entender o que torna alguns conteúdos mais relevantes do que outros. Pois, a compreensão do que torna um conteúdo popular é uma oportunidade sem precedentes para grandes aplicações comerciais, tais como sistemas de recomendação e marketing digital que quer aproveitar ao máximo a atenção do público. Por essas razões o problema de predição de popularidade em mídias sociais tem sido estudado extensivamente ao longo dos últimos anos. Pesquisas anteriores seguem abordagens que atuam sobre dados textuais, visuais e características sociais do perfil. Apesar de alcançarem resultados promissores, os modelos obtidos apresentam pouca capacidade de generalização, devido ao uso de dados direcionados a usuários específicos, dificultando assim a predição de popularidade de novos conteúdos. Portanto, será proposta uma Rede de Atenção Hierárquica Estendida (RAHE) que atende hierarquicamente dados textuais e visuais, levando em conta a influência de um contexto compartilhado entre os usuários de características sociais em comum, representações textuais a nível de caracteres e um método que minimiza os erros obtidos pela predição de popularidade. O objetivo dessa abordagem é tratar os problemas de diversidade e capacidade de generalização encontradas por grande parte dos modelos presentes no estado da arte no problema de predição de popularidade de novos conteúdos. Os experimentos realizados sobre a base de dados Temporal Popularity Image Collection (TPIC) do Flickr demostraram que o modelo RAHE, além de tratar bem a diversidade, apresenta uma alta capacidade de generalização, pois, consegue reduzir significativamente o erro médio quadrático obtido pelo baseline na predição de popularidade de imagens publicadas por novos usuários em 48,14%.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-11-29T16:37:15Z
dc.date.available.fl_str_mv 2019-11-29T16:37:15Z
dc.date.issued.fl_str_mv 2019-08-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SANTOS, David Wilson de Farias. Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/35365
identifier_str_mv SANTOS, David Wilson de Farias. Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019.
url https://repositorio.ufpe.br/handle/123456789/35365
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/35365/1/DISSERTA%c3%87%c3%83O%20David%20Wilson%20de%20Farias%20Santos.pdf
https://repositorio.ufpe.br/bitstream/123456789/35365/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/35365/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/35365/4/DISSERTA%c3%87%c3%83O%20David%20Wilson%20de%20Farias%20Santos.pdf.txt
https://repositorio.ufpe.br/bitstream/123456789/35365/5/DISSERTA%c3%87%c3%83O%20David%20Wilson%20de%20Farias%20Santos.pdf.jpg
bitstream.checksum.fl_str_mv ef3111e0b575b050166bd2096f002c56
e39d27027a6cc9cb039ad269a5db8e34
8a4605be74aa9ea9d79846c1fba20a33
d530c19d29cc88a7302bba03a1fe2a35
5eb98c3c5c890d86a806a20667e4d50d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1802310736565764096