Inference of demographic data from digital advertising platforms based on social media

Detalhes bibliográficos
Autor(a) principal: Filipe Nunes Ribeiro
Data de Publicação: 2019
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/SLSC-BBKHJN
Resumo: A inferência de características demográficas de usuários da Internet através da exploração de dados pessoais (comportamento de navegação, últimas compras, etc) pode ser útil para diversos fins tais como recomendação de produtos, entrega de conteúdo personalizado, estudo de migração entre países e muitos outros. A expansão das Redes Socias levou a disponibilidade de informações privadas de usuários a um novo patamar e estes dados tem sido explorados para prover ferramentas poderosas a anunciantes que agora podem mirar usuários com características muito específicas. Apenas o Facebook, a Rede Social mais popularm atraiu mais de 500 milhões de novos usuários nos últimos dois anos, alcançando a marca de 2.23 bilhões de usuários ativos mensalmente. Esta expressiva quantidade de usuários pode ser alvo de anunciantes que utilizam milhares de diferentes atrbutos como raça, sexo, interesses e comportamentos para selecionar a audiência de interesse. Neste trabalho, foi desenvolvido um framework para inferir aspectos demográficos baseado nos atributos disponíveis na plataforma de propaganda do Facebook. Foram também conduzidos quatro estudos de caso com a aplicação do framework. No primeiro estudo de caso a metodologia foi aplicada no ecossistema de notícias dos Estados Unidos e concluiu-se que o viés político de meios de comunicação pode ser estimados de acordo com a sua audiência. Verificou-se também que outros atributos demográficos da audiência dos meios de comunicação podem ser utilizados para inferir o viés em maior nível de detalhes tal como social, econômico e conservadorismo nacionalista. Por fim, um sistema chamado ``Media Bias Monitor'' foi desenvolvido tornando acessível para qualquer usuário da Internet o viés de audiência no Facebook de mais de $20,000$ meios de comunicação. No segundo estudo de caso foi examinado um caso particular de propagadas maliciosas no qual se avaliaou a extenção pela qual as propagandas políticas publicadas anteriormente às eleições americanas de 2016 pela Agência Russa de Inteligência (IRA) exploraram a paltaforma de propagandas do Facebook para publicar anúncios divisivos para populações vulneráveis. O terceiro estudo de caso comparou dados coletados à partir das plataformas de propaganda com dados oficiais do Censo enquanto o último estudo de caso verificou se a variação da demografia da audiência dos candidatos nas redes sociais é similar à variação demográfica capturada pelas pesquisas de intenções de voto na corrida eleitoral para presidente da república no Brasil.
id UFMG_4a1627784a8946971669c96b2d4ce293
oai_identifier_str oai:repositorio.ufmg.br:1843/SLSC-BBKHJN
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Fabricio Benevenuto de SouzaAntonio Alfredo Ferreira LoureiroClodoveu Augusto Davis JuniorBernardo Lanza QueirozJuliana Freire de Lima e SilvaThiago Henrique SilvaFilipe Nunes Ribeiro2019-08-10T20:49:01Z2019-08-10T20:49:01Z2019-03-29http://hdl.handle.net/1843/SLSC-BBKHJNA inferência de características demográficas de usuários da Internet através da exploração de dados pessoais (comportamento de navegação, últimas compras, etc) pode ser útil para diversos fins tais como recomendação de produtos, entrega de conteúdo personalizado, estudo de migração entre países e muitos outros. A expansão das Redes Socias levou a disponibilidade de informações privadas de usuários a um novo patamar e estes dados tem sido explorados para prover ferramentas poderosas a anunciantes que agora podem mirar usuários com características muito específicas. Apenas o Facebook, a Rede Social mais popularm atraiu mais de 500 milhões de novos usuários nos últimos dois anos, alcançando a marca de 2.23 bilhões de usuários ativos mensalmente. Esta expressiva quantidade de usuários pode ser alvo de anunciantes que utilizam milhares de diferentes atrbutos como raça, sexo, interesses e comportamentos para selecionar a audiência de interesse. Neste trabalho, foi desenvolvido um framework para inferir aspectos demográficos baseado nos atributos disponíveis na plataforma de propaganda do Facebook. Foram também conduzidos quatro estudos de caso com a aplicação do framework. No primeiro estudo de caso a metodologia foi aplicada no ecossistema de notícias dos Estados Unidos e concluiu-se que o viés político de meios de comunicação pode ser estimados de acordo com a sua audiência. Verificou-se também que outros atributos demográficos da audiência dos meios de comunicação podem ser utilizados para inferir o viés em maior nível de detalhes tal como social, econômico e conservadorismo nacionalista. Por fim, um sistema chamado ``Media Bias Monitor'' foi desenvolvido tornando acessível para qualquer usuário da Internet o viés de audiência no Facebook de mais de $20,000$ meios de comunicação. No segundo estudo de caso foi examinado um caso particular de propagadas maliciosas no qual se avaliaou a extenção pela qual as propagandas políticas publicadas anteriormente às eleições americanas de 2016 pela Agência Russa de Inteligência (IRA) exploraram a paltaforma de propagandas do Facebook para publicar anúncios divisivos para populações vulneráveis. O terceiro estudo de caso comparou dados coletados à partir das plataformas de propaganda com dados oficiais do Censo enquanto o último estudo de caso verificou se a variação da demografia da audiência dos candidatos nas redes sociais é similar à variação demográfica capturada pelas pesquisas de intenções de voto na corrida eleitoral para presidente da república no Brasil.The growth of Online Social Networks (OSN) in the last years is impressive. Only Facebook, the most popular OSN, attracted more than 500 million new users in the last two years, reaching the massive amount of 2.32 billion monthly active users. The revenue of OSN is concentrated on their marketing platforms which evolved substantially in comparison with the traditional advertising model. By using OSN ad platforms, an advertiser is able to explore micro-targeting advertising, which means that the advertiser may select users with very particular characteristics, including thousands of different attributes such as race, gender, interests, and behaviors. In this work, we propose and develop a framework to infer demographics based on the attributes available on OSN Advertising Platforms. The inference of demographics about Internet users by exploring personal data (browsing behavior, last purchasing, etc) is limited and challenging. However, it may be very useful for many purposes, including products recommendation, delivery of personalized content and even study of migration across countries. Social networks provide the ideal environment to infer demographics about users by exploring public profiles as well as posts and users behaviors such as likes and shopping. In our framework, we leverage the aggregate information about users provided by Facebook advertising platform to build new applications. We conducted four case studies to apply our framework. In the first case study, we applied our methodology to the US news ecosystem and we show that the ideological (liberal or conservative) leaning of a news source can be accurately estimated by the extent to which liberals or conservatives are over-/under-represented among its audience. We also show how bias in a news source's audience demographics, along the lines of race, gender, age, national identity, and income, can be used to infer more fine-grained biases of the source, such as social vs. economic vs. nationalistic conservatism. Then, we build and deploy a system, called ``Media Bias Monitor'', which exposes the biases in audience demographics for over $20,000$ news outlets on Facebook to any Internet user. In the second study case we examine a specific case of malicious advertising, exploring the extent to which political ads from the Russian Intelligence Research Agency (IRA), run prior to 2016 U.S. elections, exploited Facebook's targeted advertising infrastructure to efficiently target ads on divisive or polarizing topics (e.g., immigration, race-based policing) at vulnerable sub-populations.Universidade Federal de Minas GeraisUFMGComputaçãoMídia digital Dados DemográficosRedes Sociais on-lineMarketing DigitalViés da mídiaPlataformas de propaganda de mídias sociaisDemografiaRedes SociaisSistemasInference of demographic data from digital advertising platforms based on social mediainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALfilipenunesribeiro.pdfapplication/pdf4233184https://repositorio.ufmg.br/bitstream/1843/SLSC-BBKHJN/1/filipenunesribeiro.pdff23b49566c0fe699e0351edcbee9bfc1MD51TEXTfilipenunesribeiro.pdf.txtfilipenunesribeiro.pdf.txtExtracted texttext/plain281856https://repositorio.ufmg.br/bitstream/1843/SLSC-BBKHJN/2/filipenunesribeiro.pdf.txt2094674b0fe1f78cf5c12d10df783ebdMD521843/SLSC-BBKHJN2019-11-14 07:15:55.201oai:repositorio.ufmg.br:1843/SLSC-BBKHJNRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T10:15:55Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Inference of demographic data from digital advertising platforms based on social media
title Inference of demographic data from digital advertising platforms based on social media
spellingShingle Inference of demographic data from digital advertising platforms based on social media
Filipe Nunes Ribeiro
Viés da mídia
Plataformas de propaganda de mídias sociais
Demografia
Redes Sociais
Sistemas
Computação
Mídia digital Dados Demográficos
Redes Sociais on-line
Marketing Digital
title_short Inference of demographic data from digital advertising platforms based on social media
title_full Inference of demographic data from digital advertising platforms based on social media
title_fullStr Inference of demographic data from digital advertising platforms based on social media
title_full_unstemmed Inference of demographic data from digital advertising platforms based on social media
title_sort Inference of demographic data from digital advertising platforms based on social media
author Filipe Nunes Ribeiro
author_facet Filipe Nunes Ribeiro
author_role author
dc.contributor.advisor1.fl_str_mv Fabricio Benevenuto de Souza
dc.contributor.referee1.fl_str_mv Antonio Alfredo Ferreira Loureiro
dc.contributor.referee2.fl_str_mv Clodoveu Augusto Davis Junior
dc.contributor.referee3.fl_str_mv Bernardo Lanza Queiroz
dc.contributor.referee4.fl_str_mv Juliana Freire de Lima e Silva
dc.contributor.referee5.fl_str_mv Thiago Henrique Silva
dc.contributor.author.fl_str_mv Filipe Nunes Ribeiro
contributor_str_mv Fabricio Benevenuto de Souza
Antonio Alfredo Ferreira Loureiro
Clodoveu Augusto Davis Junior
Bernardo Lanza Queiroz
Juliana Freire de Lima e Silva
Thiago Henrique Silva
dc.subject.por.fl_str_mv Viés da mídia
Plataformas de propaganda de mídias sociais
Demografia
Redes Sociais
Sistemas
topic Viés da mídia
Plataformas de propaganda de mídias sociais
Demografia
Redes Sociais
Sistemas
Computação
Mídia digital Dados Demográficos
Redes Sociais on-line
Marketing Digital
dc.subject.other.pt_BR.fl_str_mv Computação
Mídia digital Dados Demográficos
Redes Sociais on-line
Marketing Digital
description A inferência de características demográficas de usuários da Internet através da exploração de dados pessoais (comportamento de navegação, últimas compras, etc) pode ser útil para diversos fins tais como recomendação de produtos, entrega de conteúdo personalizado, estudo de migração entre países e muitos outros. A expansão das Redes Socias levou a disponibilidade de informações privadas de usuários a um novo patamar e estes dados tem sido explorados para prover ferramentas poderosas a anunciantes que agora podem mirar usuários com características muito específicas. Apenas o Facebook, a Rede Social mais popularm atraiu mais de 500 milhões de novos usuários nos últimos dois anos, alcançando a marca de 2.23 bilhões de usuários ativos mensalmente. Esta expressiva quantidade de usuários pode ser alvo de anunciantes que utilizam milhares de diferentes atrbutos como raça, sexo, interesses e comportamentos para selecionar a audiência de interesse. Neste trabalho, foi desenvolvido um framework para inferir aspectos demográficos baseado nos atributos disponíveis na plataforma de propaganda do Facebook. Foram também conduzidos quatro estudos de caso com a aplicação do framework. No primeiro estudo de caso a metodologia foi aplicada no ecossistema de notícias dos Estados Unidos e concluiu-se que o viés político de meios de comunicação pode ser estimados de acordo com a sua audiência. Verificou-se também que outros atributos demográficos da audiência dos meios de comunicação podem ser utilizados para inferir o viés em maior nível de detalhes tal como social, econômico e conservadorismo nacionalista. Por fim, um sistema chamado ``Media Bias Monitor'' foi desenvolvido tornando acessível para qualquer usuário da Internet o viés de audiência no Facebook de mais de $20,000$ meios de comunicação. No segundo estudo de caso foi examinado um caso particular de propagadas maliciosas no qual se avaliaou a extenção pela qual as propagandas políticas publicadas anteriormente às eleições americanas de 2016 pela Agência Russa de Inteligência (IRA) exploraram a paltaforma de propagandas do Facebook para publicar anúncios divisivos para populações vulneráveis. O terceiro estudo de caso comparou dados coletados à partir das plataformas de propaganda com dados oficiais do Censo enquanto o último estudo de caso verificou se a variação da demografia da audiência dos candidatos nas redes sociais é similar à variação demográfica capturada pelas pesquisas de intenções de voto na corrida eleitoral para presidente da república no Brasil.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-08-10T20:49:01Z
dc.date.available.fl_str_mv 2019-08-10T20:49:01Z
dc.date.issued.fl_str_mv 2019-03-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/SLSC-BBKHJN
url http://hdl.handle.net/1843/SLSC-BBKHJN
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/SLSC-BBKHJN/1/filipenunesribeiro.pdf
https://repositorio.ufmg.br/bitstream/1843/SLSC-BBKHJN/2/filipenunesribeiro.pdf.txt
bitstream.checksum.fl_str_mv f23b49566c0fe699e0351edcbee9bfc1
2094674b0fe1f78cf5c12d10df783ebd
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589392185425920