Category inference for electronic program guide enrichment

Detalhes bibliográficos
Autor(a) principal: Almeida, João Filipe Ferreira
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10316/96081
Resumo: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
id RCAP_4bd4c2fbd10d82009bf16391bc83d0e6
oai_identifier_str oai:estudogeral.uc.pt:10316/96081
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Category inference for electronic program guide enrichmentCATEGORY INFERENCE FOR ELECTRONIC PROGRAM GUIDE ENRICHMENTProcessamento de Linguagem NaturalClassificação de textoMineração de dadosGuia de Programas EletrónicosNatural Language ProcessingText classificationData miningElectronic Program GuideDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e TecnologiaAtualmente, os Sistemas de Recomendação têm apresentado um aumento na sua utilização, uma vez que permitem uma melhor entrega de um serviço aos seus utilizadores. No entanto, de forma a que estes sistemas consigam ser robustos e eficientes, é necessária a existência de uma base de conteúdo corretamente classificado. No caso de classificação de programas de televisão, a sua classificação pode, para além de melhorar o conteúdo mostrado no Guia de Programas Eletrónicos, melhorar a base de dados utilizada para os Sistemas de Recomendação e consequentemente o sistema que faz uso desses dados. De forma a automatizar o processo, o Processamento de Linguagem Natural surge como um conjunto de técnicas muito útil, uma vez que permite às máquinas entender e processar linguagem natural, assim como classificar grandes quantidades de dados automaticamente. Este documento, elaborado em contexto de Dissertação para obtenção de Mestrado e estágio na empresa Altice Labs em articulação com a Altice/MEO, apresenta o processo de desenvolvimento de um modelo capaz de classificar programas de televisão pela sua categoria, com base no texto da sua sinopse, utilizando técnicas de Processamento de Linguagem Natural. Começamos por discutir o contexto teórico de alguns conceitos importantes para o problema, seguindo-se uma revisão a trabalhos semelhantes de forma aperceber as técnicas tipicamente implementadas e resultados obtidos. Seguidamente, são apresentadas, com detalhe, as tarefas desenvolvidas e decisões tomadas no contexto desta investigação/estágio, às quais acresce uma explicação de como o produto final está a ser integrado nos sistemas da MEO para ser utilizado diretamente nas suas bases de dados. O desenvolvimento de um modelo inteligente para classificação de programas permite à Altice/MEO a automatização dos seus processos de classificação e um consequente melhoramento do conteúdo apresentado no Guia de Programas Eletrónicos (EPG) e nos Sistemas de Recomendação que fazem uso dessa classificação, assim como ajudará também a indicar oportunidades de negócio ao melhorar o detalhe no perfil dos clientes.Currently, the Recommendation Systems have shown an increase in their use, since they allow better delivery of a service to its users. However, for these systems to be robust and efficient, a correctly classified content base is required. In the case of television program classification, its classification can, besides improving the content shown in the Electronic Program Guide, improve the database used for the Recommendation Systems and consequently the system that makes use of this data. To automate the process, Natural Language Processing appears as a very useful set of techniques, since it allows machines to understand and process natural language, as well as classify large amounts of data automatically. This document, elaborated in the context of a Dissertation to obtain a Master’s degree and internship at the company Altice Labs in articulation with Altice/MEO, presents the process of developing a model capable of classifying television programs by their category, based on the text of their synopsis, using Natural Language Processing techniques. We start by discussing the theoretical context of some important concepts for the problem, followed by a review of similar works to understand the techniques typically implemented and associated results. Next, we present, in detail, the tasks developed and the decision path in the context of this research/internship, as well as how the final product is being integrated into the MEO systems to be used directly on their database. The development of an intelligent model for program classification allows Altice/MEO to automate its classification processes and results in a consequent improvement of both the content presented in the Electronic Program Guide (EPG) and the Recommendation Systems that make use of that classification, as well as helping indicate business opportunities by improving the detail on the client’s profile.2021-09-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/96081http://hdl.handle.net/10316/96081TID:202778223engAlmeida, João Filipe Ferreirainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-05-25T04:24:29Zoai:estudogeral.uc.pt:10316/96081Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:14:26.059754Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Category inference for electronic program guide enrichment
CATEGORY INFERENCE FOR ELECTRONIC PROGRAM GUIDE ENRICHMENT
title Category inference for electronic program guide enrichment
spellingShingle Category inference for electronic program guide enrichment
Almeida, João Filipe Ferreira
Processamento de Linguagem Natural
Classificação de texto
Mineração de dados
Guia de Programas Eletrónicos
Natural Language Processing
Text classification
Data mining
Electronic Program Guide
title_short Category inference for electronic program guide enrichment
title_full Category inference for electronic program guide enrichment
title_fullStr Category inference for electronic program guide enrichment
title_full_unstemmed Category inference for electronic program guide enrichment
title_sort Category inference for electronic program guide enrichment
author Almeida, João Filipe Ferreira
author_facet Almeida, João Filipe Ferreira
author_role author
dc.contributor.author.fl_str_mv Almeida, João Filipe Ferreira
dc.subject.por.fl_str_mv Processamento de Linguagem Natural
Classificação de texto
Mineração de dados
Guia de Programas Eletrónicos
Natural Language Processing
Text classification
Data mining
Electronic Program Guide
topic Processamento de Linguagem Natural
Classificação de texto
Mineração de dados
Guia de Programas Eletrónicos
Natural Language Processing
Text classification
Data mining
Electronic Program Guide
description Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
publishDate 2021
dc.date.none.fl_str_mv 2021-09-14
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10316/96081
http://hdl.handle.net/10316/96081
TID:202778223
url http://hdl.handle.net/10316/96081
identifier_str_mv TID:202778223
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134041477218304