Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/35365 |
Resumo: | Diariamente, milhares de conteúdos textuais e visuais são compartilhadas entre as pessoas nas redes sociais, entretanto, enquanto alguns conteúdos conseguem engajar vários usuários, outros são totalmente ignorados não alcançando a popularidade que é tão almejada nessas plataformas. Devido a isso, houve um crescimento do interesse dos cientistas de dados na tentativa de entender o que torna alguns conteúdos mais relevantes do que outros. Pois, a compreensão do que torna um conteúdo popular é uma oportunidade sem precedentes para grandes aplicações comerciais, tais como sistemas de recomendação e marketing digital que quer aproveitar ao máximo a atenção do público. Por essas razões o problema de predição de popularidade em mídias sociais tem sido estudado extensivamente ao longo dos últimos anos. Pesquisas anteriores seguem abordagens que atuam sobre dados textuais, visuais e características sociais do perfil. Apesar de alcançarem resultados promissores, os modelos obtidos apresentam pouca capacidade de generalização, devido ao uso de dados direcionados a usuários específicos, dificultando assim a predição de popularidade de novos conteúdos. Portanto, será proposta uma Rede de Atenção Hierárquica Estendida (RAHE) que atende hierarquicamente dados textuais e visuais, levando em conta a influência de um contexto compartilhado entre os usuários de características sociais em comum, representações textuais a nível de caracteres e um método que minimiza os erros obtidos pela predição de popularidade. O objetivo dessa abordagem é tratar os problemas de diversidade e capacidade de generalização encontradas por grande parte dos modelos presentes no estado da arte no problema de predição de popularidade de novos conteúdos. Os experimentos realizados sobre a base de dados Temporal Popularity Image Collection (TPIC) do Flickr demostraram que o modelo RAHE, além de tratar bem a diversidade, apresenta uma alta capacidade de generalização, pois, consegue reduzir significativamente o erro médio quadrático obtido pelo baseline na predição de popularidade de imagens publicadas por novos usuários em 48,14%. |
id |
UFPE_18fdccba90003e0a6efd56c54fc2f2e8 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/35365 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
SANTOS, David Wilson de Fariashttp://lattes.cnpq.br/6965540005317586http://lattes.cnpq.br/3084134533707587REN, Tsang Ing2019-11-29T16:37:15Z2019-11-29T16:37:15Z2019-08-23SANTOS, David Wilson de Farias. Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019.https://repositorio.ufpe.br/handle/123456789/35365Diariamente, milhares de conteúdos textuais e visuais são compartilhadas entre as pessoas nas redes sociais, entretanto, enquanto alguns conteúdos conseguem engajar vários usuários, outros são totalmente ignorados não alcançando a popularidade que é tão almejada nessas plataformas. Devido a isso, houve um crescimento do interesse dos cientistas de dados na tentativa de entender o que torna alguns conteúdos mais relevantes do que outros. Pois, a compreensão do que torna um conteúdo popular é uma oportunidade sem precedentes para grandes aplicações comerciais, tais como sistemas de recomendação e marketing digital que quer aproveitar ao máximo a atenção do público. Por essas razões o problema de predição de popularidade em mídias sociais tem sido estudado extensivamente ao longo dos últimos anos. Pesquisas anteriores seguem abordagens que atuam sobre dados textuais, visuais e características sociais do perfil. Apesar de alcançarem resultados promissores, os modelos obtidos apresentam pouca capacidade de generalização, devido ao uso de dados direcionados a usuários específicos, dificultando assim a predição de popularidade de novos conteúdos. Portanto, será proposta uma Rede de Atenção Hierárquica Estendida (RAHE) que atende hierarquicamente dados textuais e visuais, levando em conta a influência de um contexto compartilhado entre os usuários de características sociais em comum, representações textuais a nível de caracteres e um método que minimiza os erros obtidos pela predição de popularidade. O objetivo dessa abordagem é tratar os problemas de diversidade e capacidade de generalização encontradas por grande parte dos modelos presentes no estado da arte no problema de predição de popularidade de novos conteúdos. Os experimentos realizados sobre a base de dados Temporal Popularity Image Collection (TPIC) do Flickr demostraram que o modelo RAHE, além de tratar bem a diversidade, apresenta uma alta capacidade de generalização, pois, consegue reduzir significativamente o erro médio quadrático obtido pelo baseline na predição de popularidade de imagens publicadas por novos usuários em 48,14%.Every day thousands of textual and visual information are shared among people every minute, however some content attracts the attention of many users; while others are totally ignored, not reaching the popularity that is so desired on these platforms. Because of this, there has been a growing interest from scientists in an attempt to understand what makes some content more relevant than others. Because understanding what makes content popular is an unprecedented opportunity for large commercial applications like recommendation systems and digital marketing that want to get the most out of the public’s attention. For these reasons, the problem of predicting popularity on social media has been studied extensively in recent years. Previous research follows approaches that act on textual, visual and social characteristics of the profile.Although achieving promising results, the models achieved have little generalization capacity due to the use of specific users data, thus making it difficult to predict new content. Therefore, it will be proposed an Extended Hierarchical Attention Network (RAHE) which hierarchically attends textual and visual data, taking into account the influence of a shared context among users of common social characteristics, textual representations at character-level and a method which minimizes error obtained by popularity predicting. This approach aims to address the diversity and generalizability problems encountered by most state-of-the-art models in the popularity predicting problem of new content. The experiments performed on Flickr’s Temporal Popularity Image Collection (TPIC) database showed that the RAHE model, besides handling diversity as well, has a high generalization capacity, since it can significantly reduce the mean square error obtained by the popularity prediction of images posted by new users at 48.14%.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência ComputacionalMídia SocialRedes de AtençãoDados VisuaisPredição de popularidade em mídia social utilizando uma rede de atenção hierárquicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALDISSERTAÇÃO David Wilson de Farias Santos.pdfDISSERTAÇÃO David Wilson de Farias Santos.pdfapplication/pdf3327084https://repositorio.ufpe.br/bitstream/123456789/35365/1/DISSERTA%c3%87%c3%83O%20David%20Wilson%20de%20Farias%20Santos.pdfef3111e0b575b050166bd2096f002c56MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/35365/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufpe.br/bitstream/123456789/35365/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXTDISSERTAÇÃO David Wilson de Farias Santos.pdf.txtDISSERTAÇÃO David Wilson de Farias Santos.pdf.txtExtracted texttext/plain221208https://repositorio.ufpe.br/bitstream/123456789/35365/4/DISSERTA%c3%87%c3%83O%20David%20Wilson%20de%20Farias%20Santos.pdf.txtd530c19d29cc88a7302bba03a1fe2a35MD54THUMBNAILDISSERTAÇÃO David Wilson de Farias Santos.pdf.jpgDISSERTAÇÃO David Wilson de Farias Santos.pdf.jpgGenerated Thumbnailimage/jpeg1240https://repositorio.ufpe.br/bitstream/123456789/35365/5/DISSERTA%c3%87%c3%83O%20David%20Wilson%20de%20Farias%20Santos.pdf.jpg5eb98c3c5c890d86a806a20667e4d50dMD55123456789/353652019-11-30 02:10:31.829oai:repositorio.ufpe.br:123456789/35365Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-11-30T05:10:31Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica |
title |
Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica |
spellingShingle |
Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica SANTOS, David Wilson de Farias Inteligência Computacional Mídia Social Redes de Atenção Dados Visuais |
title_short |
Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica |
title_full |
Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica |
title_fullStr |
Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica |
title_full_unstemmed |
Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica |
title_sort |
Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica |
author |
SANTOS, David Wilson de Farias |
author_facet |
SANTOS, David Wilson de Farias |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/6965540005317586 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3084134533707587 |
dc.contributor.author.fl_str_mv |
SANTOS, David Wilson de Farias |
dc.contributor.advisor1.fl_str_mv |
REN, Tsang Ing |
contributor_str_mv |
REN, Tsang Ing |
dc.subject.por.fl_str_mv |
Inteligência Computacional Mídia Social Redes de Atenção Dados Visuais |
topic |
Inteligência Computacional Mídia Social Redes de Atenção Dados Visuais |
description |
Diariamente, milhares de conteúdos textuais e visuais são compartilhadas entre as pessoas nas redes sociais, entretanto, enquanto alguns conteúdos conseguem engajar vários usuários, outros são totalmente ignorados não alcançando a popularidade que é tão almejada nessas plataformas. Devido a isso, houve um crescimento do interesse dos cientistas de dados na tentativa de entender o que torna alguns conteúdos mais relevantes do que outros. Pois, a compreensão do que torna um conteúdo popular é uma oportunidade sem precedentes para grandes aplicações comerciais, tais como sistemas de recomendação e marketing digital que quer aproveitar ao máximo a atenção do público. Por essas razões o problema de predição de popularidade em mídias sociais tem sido estudado extensivamente ao longo dos últimos anos. Pesquisas anteriores seguem abordagens que atuam sobre dados textuais, visuais e características sociais do perfil. Apesar de alcançarem resultados promissores, os modelos obtidos apresentam pouca capacidade de generalização, devido ao uso de dados direcionados a usuários específicos, dificultando assim a predição de popularidade de novos conteúdos. Portanto, será proposta uma Rede de Atenção Hierárquica Estendida (RAHE) que atende hierarquicamente dados textuais e visuais, levando em conta a influência de um contexto compartilhado entre os usuários de características sociais em comum, representações textuais a nível de caracteres e um método que minimiza os erros obtidos pela predição de popularidade. O objetivo dessa abordagem é tratar os problemas de diversidade e capacidade de generalização encontradas por grande parte dos modelos presentes no estado da arte no problema de predição de popularidade de novos conteúdos. Os experimentos realizados sobre a base de dados Temporal Popularity Image Collection (TPIC) do Flickr demostraram que o modelo RAHE, além de tratar bem a diversidade, apresenta uma alta capacidade de generalização, pois, consegue reduzir significativamente o erro médio quadrático obtido pelo baseline na predição de popularidade de imagens publicadas por novos usuários em 48,14%. |
publishDate |
2019 |
dc.date.accessioned.fl_str_mv |
2019-11-29T16:37:15Z |
dc.date.available.fl_str_mv |
2019-11-29T16:37:15Z |
dc.date.issued.fl_str_mv |
2019-08-23 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SANTOS, David Wilson de Farias. Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/35365 |
identifier_str_mv |
SANTOS, David Wilson de Farias. Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019. |
url |
https://repositorio.ufpe.br/handle/123456789/35365 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/35365/1/DISSERTA%c3%87%c3%83O%20David%20Wilson%20de%20Farias%20Santos.pdf https://repositorio.ufpe.br/bitstream/123456789/35365/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/35365/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/35365/4/DISSERTA%c3%87%c3%83O%20David%20Wilson%20de%20Farias%20Santos.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/35365/5/DISSERTA%c3%87%c3%83O%20David%20Wilson%20de%20Farias%20Santos.pdf.jpg |
bitstream.checksum.fl_str_mv |
ef3111e0b575b050166bd2096f002c56 e39d27027a6cc9cb039ad269a5db8e34 8a4605be74aa9ea9d79846c1fba20a33 d530c19d29cc88a7302bba03a1fe2a35 5eb98c3c5c890d86a806a20667e4d50d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1802310736565764096 |