Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/41534 |
Resumo: | Podcasts são uma forma relativamente nova de conteúdo, que vem ganhando cada vez mais popularidade no cenário nacional e mundial. Por exemplo, a Spotify introduziu os podcasts em seu aplicativo e investiu 340 milhões de dólares na compra de produtoras como a Gimlet e a Anchor. Além disso, em 2019, o grupo Globo lançou diversos dos seus programas e telejornais nesse novo formato, feito para o público ouvir quando e onde quiser. Mas, criar podcasts não é uma particularidade desses grandes grupos. Devido à facilidade no processo de produção e publicação, produtores independentes também ocupam uma fatia desse mercado, fazendo com que exista um grande volume de conteúdo sendo produzido diariamente. Segundo a Whitner, em 2020 foi alcançada a marca de 1 milhão de canais ativos e mais de 30 milhões de episódios publicados. Identificar quais são os podcasts com mais chances de sucesso é uma atividade não trivial é extremamente importante, pois essa informação pode ser usada para modificar a forma com que os episódios são exibidos nos aplicativos ou definir investimentos a serem realizados, por exemplo. O objetivo principal deste trabalho é identificar quais caracerísticas apresentam melhor desempenho na predição da popularidade dos episódios. Para isso, construímos uma base com mais de 800 episódios, totalizando mais de 600 horas de podcasts transcritos. Então, comparamos a predição de popularidade dos podcasts utilizando diversas estratégias de aprendizagem de máquina, bem como características de áudio, do conteúdo falado e dos metadados disponíveis no RSS Feed de cada canal. Estes últimos são utilizados pelos próprios produtores para inserir informações relevantes sobre o podcast. |
id |
UFPE_ddfa0a782d53fbbcc61075ae20f54bd5 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/41534 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
MOREIRA JUNIOR, Luiz Delando Santoshttp://lattes.cnpq.br/4773415258604950http://lattes.cnpq.br/6045470959652684http://lattes.cnpq.br/4074629083782660CABRAL, Giordano Ribeiro EulalioSCHOLZ, Ricardo Enrique Pereira2021-11-05T17:51:06Z2021-11-05T17:51:06Z2021-03-09MOREIRA JUNIOR, Luiz Delando Santos. Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2021.https://repositorio.ufpe.br/handle/123456789/41534Podcasts são uma forma relativamente nova de conteúdo, que vem ganhando cada vez mais popularidade no cenário nacional e mundial. Por exemplo, a Spotify introduziu os podcasts em seu aplicativo e investiu 340 milhões de dólares na compra de produtoras como a Gimlet e a Anchor. Além disso, em 2019, o grupo Globo lançou diversos dos seus programas e telejornais nesse novo formato, feito para o público ouvir quando e onde quiser. Mas, criar podcasts não é uma particularidade desses grandes grupos. Devido à facilidade no processo de produção e publicação, produtores independentes também ocupam uma fatia desse mercado, fazendo com que exista um grande volume de conteúdo sendo produzido diariamente. Segundo a Whitner, em 2020 foi alcançada a marca de 1 milhão de canais ativos e mais de 30 milhões de episódios publicados. Identificar quais são os podcasts com mais chances de sucesso é uma atividade não trivial é extremamente importante, pois essa informação pode ser usada para modificar a forma com que os episódios são exibidos nos aplicativos ou definir investimentos a serem realizados, por exemplo. O objetivo principal deste trabalho é identificar quais caracerísticas apresentam melhor desempenho na predição da popularidade dos episódios. Para isso, construímos uma base com mais de 800 episódios, totalizando mais de 600 horas de podcasts transcritos. Então, comparamos a predição de popularidade dos podcasts utilizando diversas estratégias de aprendizagem de máquina, bem como características de áudio, do conteúdo falado e dos metadados disponíveis no RSS Feed de cada canal. Estes últimos são utilizados pelos próprios produtores para inserir informações relevantes sobre o podcast.CNPqPodcasts are a relatively new form of content, which has been gaining more and more popularity in the national and worldwide scene. For example, Spotify introduced podcasts to its app and invested $340 million to buy producers like Gimlet and Anchor. In addition, in 2019, Grupo Globo made several of its programs and news in this new format, made for the public to listen when and where they want. But, creating podcasts is not a big group feature. Limited to the ease in the production and publication process, independent producers also occupy a slice of this market, making it possible to have a large volume of food content daily. According to Whitner, in 2020 it reached the mark of 1 million active channels and more than 30 million episodes published. Identifying which podcasts are most likely to succeed is a non-trivial activity is extremely important, as this information can be used to modify the way episodes are refined in applications or define investments to be made, for example. The main objective of this work is to identify which characteristics have the best performance in predicting the popularity of episodes. For that, we built a base with more than 800 episodes, totaling more than 600 hours of transcribed podcasts. Then, it compares the popularity prediction of podcasts using different machine learning methodologies, as well as audio, spoken content and metadata characteristics available in each channel’s RSS Feed. The latter are used by the producers themselves to insert relevant information about the podcast.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessProcessamento de Sinais e Reconhecimento de PadrõesPodcastAprendizado de MáquinaComparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudioinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALDISSERTAÇÃO Luiz Delando Santos Moreira Júnior.pdfDISSERTAÇÃO Luiz Delando Santos Moreira Júnior.pdfapplication/pdf1213245https://repositorio.ufpe.br/bitstream/123456789/41534/1/DISSERTA%c3%87%c3%83O%20Luiz%20Delando%20Santos%20Moreira%20J%c3%banior.pdfcbfe5a64922d7befffccf0d335a8556aMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/41534/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81908https://repositorio.ufpe.br/bitstream/123456789/41534/3/license.txtc59d330e2c454f71974f5866a0e8a96aMD53TEXTDISSERTAÇÃO Luiz Delando Santos Moreira Júnior.pdf.txtDISSERTAÇÃO Luiz Delando Santos Moreira Júnior.pdf.txtExtracted texttext/plain150864https://repositorio.ufpe.br/bitstream/123456789/41534/4/DISSERTA%c3%87%c3%83O%20Luiz%20Delando%20Santos%20Moreira%20J%c3%banior.pdf.txt5a39a46bc8dd0e3696ed2ba08e723d9dMD54THUMBNAILDISSERTAÇÃO Luiz Delando Santos Moreira Júnior.pdf.jpgDISSERTAÇÃO Luiz Delando Santos Moreira Júnior.pdf.jpgGenerated Thumbnailimage/jpeg1230https://repositorio.ufpe.br/bitstream/123456789/41534/5/DISSERTA%c3%87%c3%83O%20Luiz%20Delando%20Santos%20Moreira%20J%c3%banior.pdf.jpg454accd21f57281832e4f3181e160a7cMD55123456789/415342021-11-06 02:12:10.755oai:repositorio.ufpe.br:123456789/41534VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBkZSBUcmFiYWxob3MgQWNhZMOqbWljb3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRQoKRGVjbGFybyBwYXJhIG9zIGRldmlkb3MgZmlucyBkZXN0ZSBUZXJtbyBkZSBEZXDDs3NpdG8gTGVnYWwgZSBBdXRvcml6YcOnw6NvIHBhcmEgUHVibGljYcOnw6NvIGRlIFRyYWJhbGhvcyBBY2Fkw6ptaWNvcyBubyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIHF1ZSBlc3RvdSBjaWVudGUgcXVlOgpJIC0gbyBjb250ZcO6ZG8gZGlzcG9uaWJpbGl6YWRvIMOpIGRlIG1pbmhhIGludGVpcmEgcmVzcG9uc2FiaWxpZGFkZTsKSUkgLSBvIGNvbnRlw7pkbyDDqSBvcmlnaW5hbCwgZSBzZSBvIHRyYWJhbGhvIGUvb3UgcGFsYXZyYXMgZGUgb3V0cmFzIHBlc3NvYXMgZm9yYW0gdXRpbGl6YWRvcywgZXN0YXMgZm9yYW0gZGV2aWRhbWVudGUgcmVjb25oZWNpZGFzOwpJSUkgLSBhIGFsdGVyYcOnw6NvIGRhIG1vZGFsaWRhZGUgZGUgYWNlc3NvIGFvIHRyYWJhbGhvIGFww7NzIG8gZGVww7NzaXRvIGUgYW50ZXMgZGUgZmluZGFyIG8gcGVyw61vZG8gZGUgZW1iYXJnbywgcXVhbmRvIGZvciBlc2NvbGhpZG8gYWNlc3NvIHJlc3RyaXRvLCBzZXLDoSBwZXJtaXRpZGEgbWVkaWFudGUgc29saWNpdGHDp8OjbyBkbyAoYSkgYXV0b3IgKGEpIGFvIFNpc3RlbWEgSW50ZWdyYWRvIGRlIEJpYmxpb3RlY2FzIGRhIFVGUEUgKFNJQi9VRlBFKS4KIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gYWJlcnRvOgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIFRyYWJhbGhvIEFjYWTDqm1pY28sIGZ1bmRhbWVudGFkbyBuYSBMZWkgZGUgRGlyZWl0byBBdXRvcmFsIG5vIDkuMTYwIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBhcnQuIDI5LCBpbmNpc28gSUlJLCBhdXRvcml6byBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFBlcm5hbWJ1Y28gYSBkaXNwb25pYmlsaXphciBncmF0dWl0YW1lbnRlLCBzZW0gcmVzc2FyY2ltZW50byBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHBhcmEgZmlucyBkZSBsZWl0dXJhLCBpbXByZXNzw6NvIGUvb3UgZG93bmxvYWQgKGFxdWlzacOnw6NvKSBhdHJhdsOpcyBkbyBzaXRlIGRvIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgbm8gZW5kZXJlw6dvIGh0dHA6Ly93d3cucmVwb3NpdG9yaW8udWZwZS5iciwgYSBwYXJ0aXIgZGEgZGF0YSBkZSBkZXDDs3NpdG8uCgpQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gcmVzdHJpdG86Ck5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBhdXRvciBxdWUgcmVjYWVtIHNvYnJlIGVzdGUgVHJhYmFsaG8gZGUgQ29uY2x1c8OjbyBkZSBDdXJzbywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS4xNjAgZGUgMTkgZGUgZmV2ZXJlaXJvIGRlIDE5OTgsIGFydC4gMjksIGluY2lzbyBJSUksIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgUGVybmFtYnVjbyBhIGRpc3BvbmliaWxpemFyIGdyYXR1aXRhbWVudGUsIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCAoYXF1aXNpw6fDo28pIGF0cmF2w6lzIGRvIHNpdGUgZG8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBubyBlbmRlcmXDp28gaHR0cDovL3d3dy5yZXBvc2l0b3Jpby51ZnBlLmJyLCBxdWFuZG8gZmluZGFyIG8gcGVyw61vZG8gZGUgYXTDqSAwMSBhbm8gZGUgZW1iYXJnbywgY29uZm9ybWUgaW5mb3JtYWRvIG5vIGNhbXBvIERhdGEgZGUgRW1iYXJnby4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212021-11-06T05:12:10Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio |
title |
Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio |
spellingShingle |
Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio MOREIRA JUNIOR, Luiz Delando Santos Processamento de Sinais e Reconhecimento de Padrões Podcast Aprendizado de Máquina |
title_short |
Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio |
title_full |
Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio |
title_fullStr |
Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio |
title_full_unstemmed |
Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio |
title_sort |
Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio |
author |
MOREIRA JUNIOR, Luiz Delando Santos |
author_facet |
MOREIRA JUNIOR, Luiz Delando Santos |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/4773415258604950 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/6045470959652684 |
dc.contributor.advisor-coLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/4074629083782660 |
dc.contributor.author.fl_str_mv |
MOREIRA JUNIOR, Luiz Delando Santos |
dc.contributor.advisor1.fl_str_mv |
CABRAL, Giordano Ribeiro Eulalio |
dc.contributor.advisor-co1.fl_str_mv |
SCHOLZ, Ricardo Enrique Pereira |
contributor_str_mv |
CABRAL, Giordano Ribeiro Eulalio SCHOLZ, Ricardo Enrique Pereira |
dc.subject.por.fl_str_mv |
Processamento de Sinais e Reconhecimento de Padrões Podcast Aprendizado de Máquina |
topic |
Processamento de Sinais e Reconhecimento de Padrões Podcast Aprendizado de Máquina |
description |
Podcasts são uma forma relativamente nova de conteúdo, que vem ganhando cada vez mais popularidade no cenário nacional e mundial. Por exemplo, a Spotify introduziu os podcasts em seu aplicativo e investiu 340 milhões de dólares na compra de produtoras como a Gimlet e a Anchor. Além disso, em 2019, o grupo Globo lançou diversos dos seus programas e telejornais nesse novo formato, feito para o público ouvir quando e onde quiser. Mas, criar podcasts não é uma particularidade desses grandes grupos. Devido à facilidade no processo de produção e publicação, produtores independentes também ocupam uma fatia desse mercado, fazendo com que exista um grande volume de conteúdo sendo produzido diariamente. Segundo a Whitner, em 2020 foi alcançada a marca de 1 milhão de canais ativos e mais de 30 milhões de episódios publicados. Identificar quais são os podcasts com mais chances de sucesso é uma atividade não trivial é extremamente importante, pois essa informação pode ser usada para modificar a forma com que os episódios são exibidos nos aplicativos ou definir investimentos a serem realizados, por exemplo. O objetivo principal deste trabalho é identificar quais caracerísticas apresentam melhor desempenho na predição da popularidade dos episódios. Para isso, construímos uma base com mais de 800 episódios, totalizando mais de 600 horas de podcasts transcritos. Então, comparamos a predição de popularidade dos podcasts utilizando diversas estratégias de aprendizagem de máquina, bem como características de áudio, do conteúdo falado e dos metadados disponíveis no RSS Feed de cada canal. Estes últimos são utilizados pelos próprios produtores para inserir informações relevantes sobre o podcast. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-11-05T17:51:06Z |
dc.date.available.fl_str_mv |
2021-11-05T17:51:06Z |
dc.date.issued.fl_str_mv |
2021-03-09 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
MOREIRA JUNIOR, Luiz Delando Santos. Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2021. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/41534 |
identifier_str_mv |
MOREIRA JUNIOR, Luiz Delando Santos. Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2021. |
url |
https://repositorio.ufpe.br/handle/123456789/41534 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/41534/1/DISSERTA%c3%87%c3%83O%20Luiz%20Delando%20Santos%20Moreira%20J%c3%banior.pdf https://repositorio.ufpe.br/bitstream/123456789/41534/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/41534/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/41534/4/DISSERTA%c3%87%c3%83O%20Luiz%20Delando%20Santos%20Moreira%20J%c3%banior.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/41534/5/DISSERTA%c3%87%c3%83O%20Luiz%20Delando%20Santos%20Moreira%20J%c3%banior.pdf.jpg |
bitstream.checksum.fl_str_mv |
cbfe5a64922d7befffccf0d335a8556a e39d27027a6cc9cb039ad269a5db8e34 c59d330e2c454f71974f5866a0e8a96a 5a39a46bc8dd0e3696ed2ba08e723d9d 454accd21f57281832e4f3181e160a7c |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1802310749410820096 |