Inference of demographic data from digital advertising platforms based on social media
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/SLSC-BBKHJN |
Resumo: | A inferência de características demográficas de usuários da Internet através da exploração de dados pessoais (comportamento de navegação, últimas compras, etc) pode ser útil para diversos fins tais como recomendação de produtos, entrega de conteúdo personalizado, estudo de migração entre países e muitos outros. A expansão das Redes Socias levou a disponibilidade de informações privadas de usuários a um novo patamar e estes dados tem sido explorados para prover ferramentas poderosas a anunciantes que agora podem mirar usuários com características muito específicas. Apenas o Facebook, a Rede Social mais popularm atraiu mais de 500 milhões de novos usuários nos últimos dois anos, alcançando a marca de 2.23 bilhões de usuários ativos mensalmente. Esta expressiva quantidade de usuários pode ser alvo de anunciantes que utilizam milhares de diferentes atrbutos como raça, sexo, interesses e comportamentos para selecionar a audiência de interesse. Neste trabalho, foi desenvolvido um framework para inferir aspectos demográficos baseado nos atributos disponíveis na plataforma de propaganda do Facebook. Foram também conduzidos quatro estudos de caso com a aplicação do framework. No primeiro estudo de caso a metodologia foi aplicada no ecossistema de notícias dos Estados Unidos e concluiu-se que o viés político de meios de comunicação pode ser estimados de acordo com a sua audiência. Verificou-se também que outros atributos demográficos da audiência dos meios de comunicação podem ser utilizados para inferir o viés em maior nível de detalhes tal como social, econômico e conservadorismo nacionalista. Por fim, um sistema chamado ``Media Bias Monitor'' foi desenvolvido tornando acessível para qualquer usuário da Internet o viés de audiência no Facebook de mais de $20,000$ meios de comunicação. No segundo estudo de caso foi examinado um caso particular de propagadas maliciosas no qual se avaliaou a extenção pela qual as propagandas políticas publicadas anteriormente às eleições americanas de 2016 pela Agência Russa de Inteligência (IRA) exploraram a paltaforma de propagandas do Facebook para publicar anúncios divisivos para populações vulneráveis. O terceiro estudo de caso comparou dados coletados à partir das plataformas de propaganda com dados oficiais do Censo enquanto o último estudo de caso verificou se a variação da demografia da audiência dos candidatos nas redes sociais é similar à variação demográfica capturada pelas pesquisas de intenções de voto na corrida eleitoral para presidente da república no Brasil. |
id |
UFMG_4a1627784a8946971669c96b2d4ce293 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/SLSC-BBKHJN |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Fabricio Benevenuto de SouzaAntonio Alfredo Ferreira LoureiroClodoveu Augusto Davis JuniorBernardo Lanza QueirozJuliana Freire de Lima e SilvaThiago Henrique SilvaFilipe Nunes Ribeiro2019-08-10T20:49:01Z2019-08-10T20:49:01Z2019-03-29http://hdl.handle.net/1843/SLSC-BBKHJNA inferência de características demográficas de usuários da Internet através da exploração de dados pessoais (comportamento de navegação, últimas compras, etc) pode ser útil para diversos fins tais como recomendação de produtos, entrega de conteúdo personalizado, estudo de migração entre países e muitos outros. A expansão das Redes Socias levou a disponibilidade de informações privadas de usuários a um novo patamar e estes dados tem sido explorados para prover ferramentas poderosas a anunciantes que agora podem mirar usuários com características muito específicas. Apenas o Facebook, a Rede Social mais popularm atraiu mais de 500 milhões de novos usuários nos últimos dois anos, alcançando a marca de 2.23 bilhões de usuários ativos mensalmente. Esta expressiva quantidade de usuários pode ser alvo de anunciantes que utilizam milhares de diferentes atrbutos como raça, sexo, interesses e comportamentos para selecionar a audiência de interesse. Neste trabalho, foi desenvolvido um framework para inferir aspectos demográficos baseado nos atributos disponíveis na plataforma de propaganda do Facebook. Foram também conduzidos quatro estudos de caso com a aplicação do framework. No primeiro estudo de caso a metodologia foi aplicada no ecossistema de notícias dos Estados Unidos e concluiu-se que o viés político de meios de comunicação pode ser estimados de acordo com a sua audiência. Verificou-se também que outros atributos demográficos da audiência dos meios de comunicação podem ser utilizados para inferir o viés em maior nível de detalhes tal como social, econômico e conservadorismo nacionalista. Por fim, um sistema chamado ``Media Bias Monitor'' foi desenvolvido tornando acessível para qualquer usuário da Internet o viés de audiência no Facebook de mais de $20,000$ meios de comunicação. No segundo estudo de caso foi examinado um caso particular de propagadas maliciosas no qual se avaliaou a extenção pela qual as propagandas políticas publicadas anteriormente às eleições americanas de 2016 pela Agência Russa de Inteligência (IRA) exploraram a paltaforma de propagandas do Facebook para publicar anúncios divisivos para populações vulneráveis. O terceiro estudo de caso comparou dados coletados à partir das plataformas de propaganda com dados oficiais do Censo enquanto o último estudo de caso verificou se a variação da demografia da audiência dos candidatos nas redes sociais é similar à variação demográfica capturada pelas pesquisas de intenções de voto na corrida eleitoral para presidente da república no Brasil.The growth of Online Social Networks (OSN) in the last years is impressive. Only Facebook, the most popular OSN, attracted more than 500 million new users in the last two years, reaching the massive amount of 2.32 billion monthly active users. The revenue of OSN is concentrated on their marketing platforms which evolved substantially in comparison with the traditional advertising model. By using OSN ad platforms, an advertiser is able to explore micro-targeting advertising, which means that the advertiser may select users with very particular characteristics, including thousands of different attributes such as race, gender, interests, and behaviors. In this work, we propose and develop a framework to infer demographics based on the attributes available on OSN Advertising Platforms. The inference of demographics about Internet users by exploring personal data (browsing behavior, last purchasing, etc) is limited and challenging. However, it may be very useful for many purposes, including products recommendation, delivery of personalized content and even study of migration across countries. Social networks provide the ideal environment to infer demographics about users by exploring public profiles as well as posts and users behaviors such as likes and shopping. In our framework, we leverage the aggregate information about users provided by Facebook advertising platform to build new applications. We conducted four case studies to apply our framework. In the first case study, we applied our methodology to the US news ecosystem and we show that the ideological (liberal or conservative) leaning of a news source can be accurately estimated by the extent to which liberals or conservatives are over-/under-represented among its audience. We also show how bias in a news source's audience demographics, along the lines of race, gender, age, national identity, and income, can be used to infer more fine-grained biases of the source, such as social vs. economic vs. nationalistic conservatism. Then, we build and deploy a system, called ``Media Bias Monitor'', which exposes the biases in audience demographics for over $20,000$ news outlets on Facebook to any Internet user. In the second study case we examine a specific case of malicious advertising, exploring the extent to which political ads from the Russian Intelligence Research Agency (IRA), run prior to 2016 U.S. elections, exploited Facebook's targeted advertising infrastructure to efficiently target ads on divisive or polarizing topics (e.g., immigration, race-based policing) at vulnerable sub-populations.Universidade Federal de Minas GeraisUFMGComputaçãoMídia digital Dados DemográficosRedes Sociais on-lineMarketing DigitalViés da mídiaPlataformas de propaganda de mídias sociaisDemografiaRedes SociaisSistemasInference of demographic data from digital advertising platforms based on social mediainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALfilipenunesribeiro.pdfapplication/pdf4233184https://repositorio.ufmg.br/bitstream/1843/SLSC-BBKHJN/1/filipenunesribeiro.pdff23b49566c0fe699e0351edcbee9bfc1MD51TEXTfilipenunesribeiro.pdf.txtfilipenunesribeiro.pdf.txtExtracted texttext/plain281856https://repositorio.ufmg.br/bitstream/1843/SLSC-BBKHJN/2/filipenunesribeiro.pdf.txt2094674b0fe1f78cf5c12d10df783ebdMD521843/SLSC-BBKHJN2019-11-14 07:15:55.201oai:repositorio.ufmg.br:1843/SLSC-BBKHJNRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T10:15:55Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Inference of demographic data from digital advertising platforms based on social media |
title |
Inference of demographic data from digital advertising platforms based on social media |
spellingShingle |
Inference of demographic data from digital advertising platforms based on social media Filipe Nunes Ribeiro Viés da mídia Plataformas de propaganda de mídias sociais Demografia Redes Sociais Sistemas Computação Mídia digital Dados Demográficos Redes Sociais on-line Marketing Digital |
title_short |
Inference of demographic data from digital advertising platforms based on social media |
title_full |
Inference of demographic data from digital advertising platforms based on social media |
title_fullStr |
Inference of demographic data from digital advertising platforms based on social media |
title_full_unstemmed |
Inference of demographic data from digital advertising platforms based on social media |
title_sort |
Inference of demographic data from digital advertising platforms based on social media |
author |
Filipe Nunes Ribeiro |
author_facet |
Filipe Nunes Ribeiro |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Fabricio Benevenuto de Souza |
dc.contributor.referee1.fl_str_mv |
Antonio Alfredo Ferreira Loureiro |
dc.contributor.referee2.fl_str_mv |
Clodoveu Augusto Davis Junior |
dc.contributor.referee3.fl_str_mv |
Bernardo Lanza Queiroz |
dc.contributor.referee4.fl_str_mv |
Juliana Freire de Lima e Silva |
dc.contributor.referee5.fl_str_mv |
Thiago Henrique Silva |
dc.contributor.author.fl_str_mv |
Filipe Nunes Ribeiro |
contributor_str_mv |
Fabricio Benevenuto de Souza Antonio Alfredo Ferreira Loureiro Clodoveu Augusto Davis Junior Bernardo Lanza Queiroz Juliana Freire de Lima e Silva Thiago Henrique Silva |
dc.subject.por.fl_str_mv |
Viés da mídia Plataformas de propaganda de mídias sociais Demografia Redes Sociais Sistemas |
topic |
Viés da mídia Plataformas de propaganda de mídias sociais Demografia Redes Sociais Sistemas Computação Mídia digital Dados Demográficos Redes Sociais on-line Marketing Digital |
dc.subject.other.pt_BR.fl_str_mv |
Computação Mídia digital Dados Demográficos Redes Sociais on-line Marketing Digital |
description |
A inferência de características demográficas de usuários da Internet através da exploração de dados pessoais (comportamento de navegação, últimas compras, etc) pode ser útil para diversos fins tais como recomendação de produtos, entrega de conteúdo personalizado, estudo de migração entre países e muitos outros. A expansão das Redes Socias levou a disponibilidade de informações privadas de usuários a um novo patamar e estes dados tem sido explorados para prover ferramentas poderosas a anunciantes que agora podem mirar usuários com características muito específicas. Apenas o Facebook, a Rede Social mais popularm atraiu mais de 500 milhões de novos usuários nos últimos dois anos, alcançando a marca de 2.23 bilhões de usuários ativos mensalmente. Esta expressiva quantidade de usuários pode ser alvo de anunciantes que utilizam milhares de diferentes atrbutos como raça, sexo, interesses e comportamentos para selecionar a audiência de interesse. Neste trabalho, foi desenvolvido um framework para inferir aspectos demográficos baseado nos atributos disponíveis na plataforma de propaganda do Facebook. Foram também conduzidos quatro estudos de caso com a aplicação do framework. No primeiro estudo de caso a metodologia foi aplicada no ecossistema de notícias dos Estados Unidos e concluiu-se que o viés político de meios de comunicação pode ser estimados de acordo com a sua audiência. Verificou-se também que outros atributos demográficos da audiência dos meios de comunicação podem ser utilizados para inferir o viés em maior nível de detalhes tal como social, econômico e conservadorismo nacionalista. Por fim, um sistema chamado ``Media Bias Monitor'' foi desenvolvido tornando acessível para qualquer usuário da Internet o viés de audiência no Facebook de mais de $20,000$ meios de comunicação. No segundo estudo de caso foi examinado um caso particular de propagadas maliciosas no qual se avaliaou a extenção pela qual as propagandas políticas publicadas anteriormente às eleições americanas de 2016 pela Agência Russa de Inteligência (IRA) exploraram a paltaforma de propagandas do Facebook para publicar anúncios divisivos para populações vulneráveis. O terceiro estudo de caso comparou dados coletados à partir das plataformas de propaganda com dados oficiais do Censo enquanto o último estudo de caso verificou se a variação da demografia da audiência dos candidatos nas redes sociais é similar à variação demográfica capturada pelas pesquisas de intenções de voto na corrida eleitoral para presidente da república no Brasil. |
publishDate |
2019 |
dc.date.accessioned.fl_str_mv |
2019-08-10T20:49:01Z |
dc.date.available.fl_str_mv |
2019-08-10T20:49:01Z |
dc.date.issued.fl_str_mv |
2019-03-29 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/SLSC-BBKHJN |
url |
http://hdl.handle.net/1843/SLSC-BBKHJN |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/SLSC-BBKHJN/1/filipenunesribeiro.pdf https://repositorio.ufmg.br/bitstream/1843/SLSC-BBKHJN/2/filipenunesribeiro.pdf.txt |
bitstream.checksum.fl_str_mv |
f23b49566c0fe699e0351edcbee9bfc1 2094674b0fe1f78cf5c12d10df783ebd |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589392185425920 |