Sobre publicidade direcionada baseada em conteúdo

Detalhes bibliográficos
Autor(a) principal: Marco Antonio Pinheiro de Cristo
Data de Publicação: 2006
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/RVMR-6TCNUJ
Resumo: O grande sucesso da publicidade na Internet, observado atualmente, está diretamente relacionado ao investimento crescente em publicidade de busca que, por sua vez, tem sido essencial para o financiamento de conteúdos e serviços na Internet. De acordo com aForrester Research, os ganhos em publicidade de busca devem subir de 3,6 bilhões de dólares em 2004 para 11,6 bilhões em 2010. De fato, estes números podem ser maiores ainda. Para se ter uma idéia, o Yahoo anunciou um ganho de 875 milhões de dólares referente apenas ao segundo trimestre de 2005, enquanto o Google reportou um ganho de 1,384 bilhões para o mesmo período. Alémdisso, previsões sugerem que a influência da publicidade de busca irá aumentar nos próximos anos através da diversificação e introdução de novos serviços. A exploração de tais possibilidades implica em avanços tanto nas áreas comercial quanto tecnológica. Neste trabalho, nós discutimos o uso de técnicas de Recuperação de Informação para melhorar o desempenho de sistemas de atribuição de propagandas em publicidade de busca, com ênfase em publicidade baseada em conteúdo. Nós investigamos como as diferentes evidências já disponíveis para empresas (que operam sistemas de publicidade baseada em palavras-chave) afetam o casamento de propagandas com o conteúdo de páginas da Web. Como resultado deste estudo, nós propomos novas estratégias para atribuir propagandas a páginas da Web. Experimentos com uma coleção de propagandas real mostram que o uso adequado das evidências disponíveis possibilita um desempenho de alta qualidade no processo de atribuição de propagandas. Nós também investigamos a combinação de evidências conceituais e sintáticas. Para isto, nós primeiro estudamos métodos para melhorar a classificação de páginas da Web e observamos que estratégias de classificação baseadas em apontadores são melhores que as tradicionais, baseadas unicamente na análise de texto. Ao utilizarmos os melhores classificadores obtidos como fonte de informação conceitual, concluimos que a combinação de métodos baseados em casamento sintático com os baseados em casamento conceitual apresenta melhor desempenho que aqueles baseados unicamente em casamento sintático.
id UFMG_29441f289400e2fac9de7ef43bb4e2f9
oai_identifier_str oai:repositorio.ufmg.br:1843/RVMR-6TCNUJ
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Berthier Ribeiro de Araujo NetoEdleno Silva de MouraRicardo Baeza-yatesMarcos Andre GoncalvesNivio ZivianiMarco Antonio Pinheiro de Cristo2019-08-13T09:47:50Z2019-08-13T09:47:50Z2006-07-20http://hdl.handle.net/1843/RVMR-6TCNUJO grande sucesso da publicidade na Internet, observado atualmente, está diretamente relacionado ao investimento crescente em publicidade de busca que, por sua vez, tem sido essencial para o financiamento de conteúdos e serviços na Internet. De acordo com aForrester Research, os ganhos em publicidade de busca devem subir de 3,6 bilhões de dólares em 2004 para 11,6 bilhões em 2010. De fato, estes números podem ser maiores ainda. Para se ter uma idéia, o Yahoo anunciou um ganho de 875 milhões de dólares referente apenas ao segundo trimestre de 2005, enquanto o Google reportou um ganho de 1,384 bilhões para o mesmo período. Alémdisso, previsões sugerem que a influência da publicidade de busca irá aumentar nos próximos anos através da diversificação e introdução de novos serviços. A exploração de tais possibilidades implica em avanços tanto nas áreas comercial quanto tecnológica. Neste trabalho, nós discutimos o uso de técnicas de Recuperação de Informação para melhorar o desempenho de sistemas de atribuição de propagandas em publicidade de busca, com ênfase em publicidade baseada em conteúdo. Nós investigamos como as diferentes evidências já disponíveis para empresas (que operam sistemas de publicidade baseada em palavras-chave) afetam o casamento de propagandas com o conteúdo de páginas da Web. Como resultado deste estudo, nós propomos novas estratégias para atribuir propagandas a páginas da Web. Experimentos com uma coleção de propagandas real mostram que o uso adequado das evidências disponíveis possibilita um desempenho de alta qualidade no processo de atribuição de propagandas. Nós também investigamos a combinação de evidências conceituais e sintáticas. Para isto, nós primeiro estudamos métodos para melhorar a classificação de páginas da Web e observamos que estratégias de classificação baseadas em apontadores são melhores que as tradicionais, baseadas unicamente na análise de texto. Ao utilizarmos os melhores classificadores obtidos como fonte de informação conceitual, concluimos que a combinação de métodos baseados em casamento sintático com os baseados em casamento conceitual apresenta melhor desempenho que aqueles baseados unicamente em casamento sintático.The current boom of online advertising is associated with the revenuesoriginated from search advertising, which has become the driving force sustaining monetization of Web services. According to Forrester Research, search advertising revenues were projected to grow from US $3.6 billion in 2004 to US $11.6 billion by 2010. Actually, numbers might be quite larger. To illustrate, Yahoo reported search advertising revenues in the total amount of US $875 million for the second quarter of 2005 only, while Google reported revenues in the total amount of US $1.384 billion for the same period. Further, forecasts suggest that the influence of search advertising will increase in the upcoming years through diversification and the production of new types of search-related advertising. This rapidly consolidating market involves complex business networks and increasingly sophisticated technology. Thus, the exploitation of new forms of search advertising requires advancesin the commercial and in the technology front. In this work, we discuss the use of Information Retrieval (IR) techniques to improve the performance of ad placement methods in search advertising, with emphasis on content-targeted advertising. We investigate how the different sources of evidence already available to information gatekeepers (that operate keyword-targeted advertising systems) affect the matching of ads tothe content of aWeb page. As a result of this analysis, we propose new strategies for associating advertisements with Web pages. Experiments with a real ad collection show that the proper use of the available sources of evidence can lead to high quality matching algorithms.We also exploit the combination of conceptual and syntactical evidence.To accomplish this, we first study how to improve Web document classification. We observe that methods based on link evidence can be successfully used to improve the classification based only on content. We then use the best classifiers obtained as source of conceptual information and conclude that matching algorithms in content-targeted advertising can be enhanced by combining the context-based ranking obtained through manual and automatic classification with the ranking provided by the syntactical matching methods.Universidade Federal de Minas GeraisUFMGWorld Wide Web (Sistema de recuperação da informação)World Wide Web PublicaçõesComputaçãoEditoração eletronicaEditoração da WebPublicidade na internetRecuperação de informaçãoSobre publicidade direcionada baseada em conteúdoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALmarco_cristo.pdfapplication/pdf1621493https://repositorio.ufmg.br/bitstream/1843/RVMR-6TCNUJ/1/marco_cristo.pdfacd83024020609754c472a7969f86eb3MD51TEXTmarco_cristo.pdf.txtmarco_cristo.pdf.txtExtracted texttext/plain309833https://repositorio.ufmg.br/bitstream/1843/RVMR-6TCNUJ/2/marco_cristo.pdf.txtb4a872cedc6bbdd39b67e2459d268516MD521843/RVMR-6TCNUJ2019-11-14 22:26:16.369oai:repositorio.ufmg.br:1843/RVMR-6TCNUJRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-15T01:26:16Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Sobre publicidade direcionada baseada em conteúdo
title Sobre publicidade direcionada baseada em conteúdo
spellingShingle Sobre publicidade direcionada baseada em conteúdo
Marco Antonio Pinheiro de Cristo
Publicidade na internet
Recuperação de informação
World Wide Web (Sistema de recuperação da informação)
World Wide Web Publicações
Computação
Editoração eletronica
Editoração da Web
title_short Sobre publicidade direcionada baseada em conteúdo
title_full Sobre publicidade direcionada baseada em conteúdo
title_fullStr Sobre publicidade direcionada baseada em conteúdo
title_full_unstemmed Sobre publicidade direcionada baseada em conteúdo
title_sort Sobre publicidade direcionada baseada em conteúdo
author Marco Antonio Pinheiro de Cristo
author_facet Marco Antonio Pinheiro de Cristo
author_role author
dc.contributor.advisor1.fl_str_mv Berthier Ribeiro de Araujo Neto
dc.contributor.referee1.fl_str_mv Edleno Silva de Moura
dc.contributor.referee2.fl_str_mv Ricardo Baeza-yates
dc.contributor.referee3.fl_str_mv Marcos Andre Goncalves
dc.contributor.referee4.fl_str_mv Nivio Ziviani
dc.contributor.author.fl_str_mv Marco Antonio Pinheiro de Cristo
contributor_str_mv Berthier Ribeiro de Araujo Neto
Edleno Silva de Moura
Ricardo Baeza-yates
Marcos Andre Goncalves
Nivio Ziviani
dc.subject.por.fl_str_mv Publicidade na internet
Recuperação de informação
topic Publicidade na internet
Recuperação de informação
World Wide Web (Sistema de recuperação da informação)
World Wide Web Publicações
Computação
Editoração eletronica
Editoração da Web
dc.subject.other.pt_BR.fl_str_mv World Wide Web (Sistema de recuperação da informação)
World Wide Web Publicações
Computação
Editoração eletronica
Editoração da Web
description O grande sucesso da publicidade na Internet, observado atualmente, está diretamente relacionado ao investimento crescente em publicidade de busca que, por sua vez, tem sido essencial para o financiamento de conteúdos e serviços na Internet. De acordo com aForrester Research, os ganhos em publicidade de busca devem subir de 3,6 bilhões de dólares em 2004 para 11,6 bilhões em 2010. De fato, estes números podem ser maiores ainda. Para se ter uma idéia, o Yahoo anunciou um ganho de 875 milhões de dólares referente apenas ao segundo trimestre de 2005, enquanto o Google reportou um ganho de 1,384 bilhões para o mesmo período. Alémdisso, previsões sugerem que a influência da publicidade de busca irá aumentar nos próximos anos através da diversificação e introdução de novos serviços. A exploração de tais possibilidades implica em avanços tanto nas áreas comercial quanto tecnológica. Neste trabalho, nós discutimos o uso de técnicas de Recuperação de Informação para melhorar o desempenho de sistemas de atribuição de propagandas em publicidade de busca, com ênfase em publicidade baseada em conteúdo. Nós investigamos como as diferentes evidências já disponíveis para empresas (que operam sistemas de publicidade baseada em palavras-chave) afetam o casamento de propagandas com o conteúdo de páginas da Web. Como resultado deste estudo, nós propomos novas estratégias para atribuir propagandas a páginas da Web. Experimentos com uma coleção de propagandas real mostram que o uso adequado das evidências disponíveis possibilita um desempenho de alta qualidade no processo de atribuição de propagandas. Nós também investigamos a combinação de evidências conceituais e sintáticas. Para isto, nós primeiro estudamos métodos para melhorar a classificação de páginas da Web e observamos que estratégias de classificação baseadas em apontadores são melhores que as tradicionais, baseadas unicamente na análise de texto. Ao utilizarmos os melhores classificadores obtidos como fonte de informação conceitual, concluimos que a combinação de métodos baseados em casamento sintático com os baseados em casamento conceitual apresenta melhor desempenho que aqueles baseados unicamente em casamento sintático.
publishDate 2006
dc.date.issued.fl_str_mv 2006-07-20
dc.date.accessioned.fl_str_mv 2019-08-13T09:47:50Z
dc.date.available.fl_str_mv 2019-08-13T09:47:50Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/RVMR-6TCNUJ
url http://hdl.handle.net/1843/RVMR-6TCNUJ
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/RVMR-6TCNUJ/1/marco_cristo.pdf
https://repositorio.ufmg.br/bitstream/1843/RVMR-6TCNUJ/2/marco_cristo.pdf.txt
bitstream.checksum.fl_str_mv acd83024020609754c472a7969f86eb3
b4a872cedc6bbdd39b67e2459d268516
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1797971218794545152