Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio

Detalhes bibliográficos
Autor(a) principal: MOREIRA JUNIOR, Luiz Delando Santos
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
Texto Completo: https://repositorio.ufpe.br/handle/123456789/41534
Resumo: Podcasts são uma forma relativamente nova de conteúdo, que vem ganhando cada vez mais popularidade no cenário nacional e mundial. Por exemplo, a Spotify introduziu os podcasts em seu aplicativo e investiu 340 milhões de dólares na compra de produtoras como a Gimlet e a Anchor. Além disso, em 2019, o grupo Globo lançou diversos dos seus programas e telejornais nesse novo formato, feito para o público ouvir quando e onde quiser. Mas, criar podcasts não é uma particularidade desses grandes grupos. Devido à facilidade no processo de produção e publicação, produtores independentes também ocupam uma fatia desse mercado, fazendo com que exista um grande volume de conteúdo sendo produzido diariamente. Segundo a Whitner, em 2020 foi alcançada a marca de 1 milhão de canais ativos e mais de 30 milhões de episódios publicados. Identificar quais são os podcasts com mais chances de sucesso é uma atividade não trivial é extremamente importante, pois essa informação pode ser usada para modificar a forma com que os episódios são exibidos nos aplicativos ou definir investimentos a serem realizados, por exemplo. O objetivo principal deste trabalho é identificar quais caracerísticas apresentam melhor desempenho na predição da popularidade dos episódios. Para isso, construímos uma base com mais de 800 episódios, totalizando mais de 600 horas de podcasts transcritos. Então, comparamos a predição de popularidade dos podcasts utilizando diversas estratégias de aprendizagem de máquina, bem como características de áudio, do conteúdo falado e dos metadados disponíveis no RSS Feed de cada canal. Estes últimos são utilizados pelos próprios produtores para inserir informações relevantes sobre o podcast.
id UFPE_ddfa0a782d53fbbcc61075ae20f54bd5
oai_identifier_str oai:repositorio.ufpe.br:123456789/41534
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling MOREIRA JUNIOR, Luiz Delando Santoshttp://lattes.cnpq.br/4773415258604950http://lattes.cnpq.br/6045470959652684http://lattes.cnpq.br/4074629083782660CABRAL, Giordano Ribeiro EulalioSCHOLZ, Ricardo Enrique Pereira2021-11-05T17:51:06Z2021-11-05T17:51:06Z2021-03-09MOREIRA JUNIOR, Luiz Delando Santos. Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2021.https://repositorio.ufpe.br/handle/123456789/41534Podcasts são uma forma relativamente nova de conteúdo, que vem ganhando cada vez mais popularidade no cenário nacional e mundial. Por exemplo, a Spotify introduziu os podcasts em seu aplicativo e investiu 340 milhões de dólares na compra de produtoras como a Gimlet e a Anchor. Além disso, em 2019, o grupo Globo lançou diversos dos seus programas e telejornais nesse novo formato, feito para o público ouvir quando e onde quiser. Mas, criar podcasts não é uma particularidade desses grandes grupos. Devido à facilidade no processo de produção e publicação, produtores independentes também ocupam uma fatia desse mercado, fazendo com que exista um grande volume de conteúdo sendo produzido diariamente. Segundo a Whitner, em 2020 foi alcançada a marca de 1 milhão de canais ativos e mais de 30 milhões de episódios publicados. Identificar quais são os podcasts com mais chances de sucesso é uma atividade não trivial é extremamente importante, pois essa informação pode ser usada para modificar a forma com que os episódios são exibidos nos aplicativos ou definir investimentos a serem realizados, por exemplo. O objetivo principal deste trabalho é identificar quais caracerísticas apresentam melhor desempenho na predição da popularidade dos episódios. Para isso, construímos uma base com mais de 800 episódios, totalizando mais de 600 horas de podcasts transcritos. Então, comparamos a predição de popularidade dos podcasts utilizando diversas estratégias de aprendizagem de máquina, bem como características de áudio, do conteúdo falado e dos metadados disponíveis no RSS Feed de cada canal. Estes últimos são utilizados pelos próprios produtores para inserir informações relevantes sobre o podcast.CNPqPodcasts are a relatively new form of content, which has been gaining more and more popularity in the national and worldwide scene. For example, Spotify introduced podcasts to its app and invested $340 million to buy producers like Gimlet and Anchor. In addition, in 2019, Grupo Globo made several of its programs and news in this new format, made for the public to listen when and where they want. But, creating podcasts is not a big group feature. Limited to the ease in the production and publication process, independent producers also occupy a slice of this market, making it possible to have a large volume of food content daily. According to Whitner, in 2020 it reached the mark of 1 million active channels and more than 30 million episodes published. Identifying which podcasts are most likely to succeed is a non-trivial activity is extremely important, as this information can be used to modify the way episodes are refined in applications or define investments to be made, for example. The main objective of this work is to identify which characteristics have the best performance in predicting the popularity of episodes. For that, we built a base with more than 800 episodes, totaling more than 600 hours of transcribed podcasts. Then, it compares the popularity prediction of podcasts using different machine learning methodologies, as well as audio, spoken content and metadata characteristics available in each channel’s RSS Feed. The latter are used by the producers themselves to insert relevant information about the podcast.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessProcessamento de Sinais e Reconhecimento de PadrõesPodcastAprendizado de MáquinaComparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudioinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALDISSERTAÇÃO Luiz Delando Santos Moreira Júnior.pdfDISSERTAÇÃO Luiz Delando Santos Moreira Júnior.pdfapplication/pdf1213245https://repositorio.ufpe.br/bitstream/123456789/41534/1/DISSERTA%c3%87%c3%83O%20Luiz%20Delando%20Santos%20Moreira%20J%c3%banior.pdfcbfe5a64922d7befffccf0d335a8556aMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/41534/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81908https://repositorio.ufpe.br/bitstream/123456789/41534/3/license.txtc59d330e2c454f71974f5866a0e8a96aMD53TEXTDISSERTAÇÃO Luiz Delando Santos Moreira Júnior.pdf.txtDISSERTAÇÃO Luiz Delando Santos Moreira Júnior.pdf.txtExtracted texttext/plain150864https://repositorio.ufpe.br/bitstream/123456789/41534/4/DISSERTA%c3%87%c3%83O%20Luiz%20Delando%20Santos%20Moreira%20J%c3%banior.pdf.txt5a39a46bc8dd0e3696ed2ba08e723d9dMD54THUMBNAILDISSERTAÇÃO Luiz Delando Santos Moreira Júnior.pdf.jpgDISSERTAÇÃO Luiz Delando Santos Moreira Júnior.pdf.jpgGenerated Thumbnailimage/jpeg1230https://repositorio.ufpe.br/bitstream/123456789/41534/5/DISSERTA%c3%87%c3%83O%20Luiz%20Delando%20Santos%20Moreira%20J%c3%banior.pdf.jpg454accd21f57281832e4f3181e160a7cMD55123456789/415342021-11-06 02:12:10.755oai:repositorio.ufpe.br:123456789/41534VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBkZSBUcmFiYWxob3MgQWNhZMOqbWljb3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRQoKRGVjbGFybyBwYXJhIG9zIGRldmlkb3MgZmlucyBkZXN0ZSBUZXJtbyBkZSBEZXDDs3NpdG8gTGVnYWwgZSBBdXRvcml6YcOnw6NvIHBhcmEgUHVibGljYcOnw6NvIGRlIFRyYWJhbGhvcyBBY2Fkw6ptaWNvcyBubyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIHF1ZSBlc3RvdSBjaWVudGUgcXVlOgpJIC0gbyBjb250ZcO6ZG8gZGlzcG9uaWJpbGl6YWRvIMOpIGRlIG1pbmhhIGludGVpcmEgcmVzcG9uc2FiaWxpZGFkZTsKSUkgLSBvIGNvbnRlw7pkbyDDqSBvcmlnaW5hbCwgZSBzZSBvIHRyYWJhbGhvIGUvb3UgcGFsYXZyYXMgZGUgb3V0cmFzIHBlc3NvYXMgZm9yYW0gdXRpbGl6YWRvcywgZXN0YXMgZm9yYW0gZGV2aWRhbWVudGUgcmVjb25oZWNpZGFzOwpJSUkgLSBhIGFsdGVyYcOnw6NvIGRhIG1vZGFsaWRhZGUgZGUgYWNlc3NvIGFvIHRyYWJhbGhvIGFww7NzIG8gZGVww7NzaXRvIGUgYW50ZXMgZGUgZmluZGFyIG8gcGVyw61vZG8gZGUgZW1iYXJnbywgcXVhbmRvIGZvciBlc2NvbGhpZG8gYWNlc3NvIHJlc3RyaXRvLCBzZXLDoSBwZXJtaXRpZGEgbWVkaWFudGUgc29saWNpdGHDp8OjbyBkbyAoYSkgYXV0b3IgKGEpIGFvIFNpc3RlbWEgSW50ZWdyYWRvIGRlIEJpYmxpb3RlY2FzIGRhIFVGUEUgKFNJQi9VRlBFKS4KIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gYWJlcnRvOgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIFRyYWJhbGhvIEFjYWTDqm1pY28sIGZ1bmRhbWVudGFkbyBuYSBMZWkgZGUgRGlyZWl0byBBdXRvcmFsIG5vIDkuMTYwIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBhcnQuIDI5LCBpbmNpc28gSUlJLCBhdXRvcml6byBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFBlcm5hbWJ1Y28gYSBkaXNwb25pYmlsaXphciBncmF0dWl0YW1lbnRlLCBzZW0gcmVzc2FyY2ltZW50byBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHBhcmEgZmlucyBkZSBsZWl0dXJhLCBpbXByZXNzw6NvIGUvb3UgZG93bmxvYWQgKGFxdWlzacOnw6NvKSBhdHJhdsOpcyBkbyBzaXRlIGRvIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgbm8gZW5kZXJlw6dvIGh0dHA6Ly93d3cucmVwb3NpdG9yaW8udWZwZS5iciwgYSBwYXJ0aXIgZGEgZGF0YSBkZSBkZXDDs3NpdG8uCgpQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gcmVzdHJpdG86Ck5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBhdXRvciBxdWUgcmVjYWVtIHNvYnJlIGVzdGUgVHJhYmFsaG8gZGUgQ29uY2x1c8OjbyBkZSBDdXJzbywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS4xNjAgZGUgMTkgZGUgZmV2ZXJlaXJvIGRlIDE5OTgsIGFydC4gMjksIGluY2lzbyBJSUksIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgUGVybmFtYnVjbyBhIGRpc3BvbmliaWxpemFyIGdyYXR1aXRhbWVudGUsIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCAoYXF1aXNpw6fDo28pIGF0cmF2w6lzIGRvIHNpdGUgZG8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBubyBlbmRlcmXDp28gaHR0cDovL3d3dy5yZXBvc2l0b3Jpby51ZnBlLmJyLCBxdWFuZG8gZmluZGFyIG8gcGVyw61vZG8gZGUgYXTDqSAwMSBhbm8gZGUgZW1iYXJnbywgY29uZm9ybWUgaW5mb3JtYWRvIG5vIGNhbXBvIERhdGEgZGUgRW1iYXJnby4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212021-11-06T05:12:10Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio
title Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio
spellingShingle Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio
MOREIRA JUNIOR, Luiz Delando Santos
Processamento de Sinais e Reconhecimento de Padrões
Podcast
Aprendizado de Máquina
title_short Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio
title_full Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio
title_fullStr Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio
title_full_unstemmed Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio
title_sort Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio
author MOREIRA JUNIOR, Luiz Delando Santos
author_facet MOREIRA JUNIOR, Luiz Delando Santos
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/4773415258604950
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/6045470959652684
dc.contributor.advisor-coLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/4074629083782660
dc.contributor.author.fl_str_mv MOREIRA JUNIOR, Luiz Delando Santos
dc.contributor.advisor1.fl_str_mv CABRAL, Giordano Ribeiro Eulalio
dc.contributor.advisor-co1.fl_str_mv SCHOLZ, Ricardo Enrique Pereira
contributor_str_mv CABRAL, Giordano Ribeiro Eulalio
SCHOLZ, Ricardo Enrique Pereira
dc.subject.por.fl_str_mv Processamento de Sinais e Reconhecimento de Padrões
Podcast
Aprendizado de Máquina
topic Processamento de Sinais e Reconhecimento de Padrões
Podcast
Aprendizado de Máquina
description Podcasts são uma forma relativamente nova de conteúdo, que vem ganhando cada vez mais popularidade no cenário nacional e mundial. Por exemplo, a Spotify introduziu os podcasts em seu aplicativo e investiu 340 milhões de dólares na compra de produtoras como a Gimlet e a Anchor. Além disso, em 2019, o grupo Globo lançou diversos dos seus programas e telejornais nesse novo formato, feito para o público ouvir quando e onde quiser. Mas, criar podcasts não é uma particularidade desses grandes grupos. Devido à facilidade no processo de produção e publicação, produtores independentes também ocupam uma fatia desse mercado, fazendo com que exista um grande volume de conteúdo sendo produzido diariamente. Segundo a Whitner, em 2020 foi alcançada a marca de 1 milhão de canais ativos e mais de 30 milhões de episódios publicados. Identificar quais são os podcasts com mais chances de sucesso é uma atividade não trivial é extremamente importante, pois essa informação pode ser usada para modificar a forma com que os episódios são exibidos nos aplicativos ou definir investimentos a serem realizados, por exemplo. O objetivo principal deste trabalho é identificar quais caracerísticas apresentam melhor desempenho na predição da popularidade dos episódios. Para isso, construímos uma base com mais de 800 episódios, totalizando mais de 600 horas de podcasts transcritos. Então, comparamos a predição de popularidade dos podcasts utilizando diversas estratégias de aprendizagem de máquina, bem como características de áudio, do conteúdo falado e dos metadados disponíveis no RSS Feed de cada canal. Estes últimos são utilizados pelos próprios produtores para inserir informações relevantes sobre o podcast.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-11-05T17:51:06Z
dc.date.available.fl_str_mv 2021-11-05T17:51:06Z
dc.date.issued.fl_str_mv 2021-03-09
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MOREIRA JUNIOR, Luiz Delando Santos. Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2021.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/41534
identifier_str_mv MOREIRA JUNIOR, Luiz Delando Santos. Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2021.
url https://repositorio.ufpe.br/handle/123456789/41534
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/41534/1/DISSERTA%c3%87%c3%83O%20Luiz%20Delando%20Santos%20Moreira%20J%c3%banior.pdf
https://repositorio.ufpe.br/bitstream/123456789/41534/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/41534/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/41534/4/DISSERTA%c3%87%c3%83O%20Luiz%20Delando%20Santos%20Moreira%20J%c3%banior.pdf.txt
https://repositorio.ufpe.br/bitstream/123456789/41534/5/DISSERTA%c3%87%c3%83O%20Luiz%20Delando%20Santos%20Moreira%20J%c3%banior.pdf.jpg
bitstream.checksum.fl_str_mv cbfe5a64922d7befffccf0d335a8556a
e39d27027a6cc9cb039ad269a5db8e34
c59d330e2c454f71974f5866a0e8a96a
5a39a46bc8dd0e3696ed2ba08e723d9d
454accd21f57281832e4f3181e160a7c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1802310749410820096