Um estudo sobre categorização de mídias através do método de Latent Dirichlet Allocatio

Detalhes bibliográficos
Autor(a) principal: Costa, Glauber de Oliveira
Data de Publicação: 2010
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1613717
Resumo: Orientador: Siome Klein Goldenstein
id UNICAMP-30_abc3988c7148a9faa035f29c6259040a
oai_identifier_str oai::779402
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Um estudo sobre categorização de mídias através do método de Latent Dirichlet AllocatioA study on media categorization using the latent Dirichlet allocation methodCategorização de imagensVisão por computadorRecuperação da informaçãoImage categorizationComputer visionInformation retrievalOrientador: Siome Klein GoldensteinDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Com o crescimento das bases de imagem digitais, motivado principalmente pela popularização da World Wide Web, bem como a massificação de dispositivos de captura digital de imagens, o processamento e extração de informações semânticas destas imagens cresce em importância. A informação encerrada nestas imagens não tem significado semântico imediato, sendo necessário o uso de técnicas para capturá-la. A abordagem trivial, que envolve a anotação das imagens por humanos se torna falha à medida que o tamanho das bases cresce, sendo necessário voltar-se para métodos mais sofisticados. Esta dissertação estudou a aplicação do método Latent Dirichlet Allocation em bases de imagens digitais, verificando a performance do algoritmo utilizando quatro métodos distintos de criação de dicionários visuais. Este trabalho mostrou que a combinação de diferentes descritores capturando aspectos distintos das imagens, para a construção de classificadores pelo método Latent Dirichlet Allocation é capaz de obter taxas de acerto médias na faixa de 90%, ainda que cada classificador individualmente não tenha desempenho muito superior à chance. Ainda, os experimentos realizados demonstraram que a influência do tamanho do dicionário e número de tópicos não é significativa, sendo possível construir classificadores com poucos tópicos latentes a partir de poucas palavras visuais, e portanto, eficientes.Abstract: With the growth of digital image databases, mainly motivated by the spread of the World Wide Web and digital capture devices, processing and extraction of semantic information from these images gain importance. The information contained within these images have no immediate semantic meaning and techniques must be used in order to acquire it. The trivial approach, which involves the manual annotation of the images by humans, becomes flawed as the size of the database grows. Using a more sophisticated method is needed. This work studied applications of the Latent Dirichlet Allocation method for digital image databases, verifying the algorithm's performance using four different methods of codewords dictionary generation. It shows that a combination of different descriptors capturing different aspects of the images, aiming at the construction of Latent Dirichlet Allocation -based classifiers, is capable of achieving hit ratios around 90%, even if each of the individual classifiers isn't largely superior to chance. Yet, experiments performed during this work demonstrated that the influence of the codewords dictionary size and the number of topics in the model are not significant, making the construction of small-sized, and thus, efficient classifiers possible.MestradoVisão ComputacionalMestre em Ciência da Computação[s.n.]Goldenstein, Siome Klein, 1972-Campos, Mario Fernando MontenegroLeite, Neucimar JerônimoUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASCosta, Glauber de Oliveira20102010-12-07T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf81 f. : il.https://hdl.handle.net/20.500.12733/1613717COSTA, Glauber de Oliveira. Um estudo sobre categorização de mídias através do método de Latent Dirichlet Allocatio. 2010. 81 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1613717. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/779402porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T06:04:30Zoai::779402Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T06:04:30Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Um estudo sobre categorização de mídias através do método de Latent Dirichlet Allocatio
A study on media categorization using the latent Dirichlet allocation method
title Um estudo sobre categorização de mídias através do método de Latent Dirichlet Allocatio
spellingShingle Um estudo sobre categorização de mídias através do método de Latent Dirichlet Allocatio
Costa, Glauber de Oliveira
Categorização de imagens
Visão por computador
Recuperação da informação
Image categorization
Computer vision
Information retrieval
title_short Um estudo sobre categorização de mídias através do método de Latent Dirichlet Allocatio
title_full Um estudo sobre categorização de mídias através do método de Latent Dirichlet Allocatio
title_fullStr Um estudo sobre categorização de mídias através do método de Latent Dirichlet Allocatio
title_full_unstemmed Um estudo sobre categorização de mídias através do método de Latent Dirichlet Allocatio
title_sort Um estudo sobre categorização de mídias através do método de Latent Dirichlet Allocatio
author Costa, Glauber de Oliveira
author_facet Costa, Glauber de Oliveira
author_role author
dc.contributor.none.fl_str_mv Goldenstein, Siome Klein, 1972-
Campos, Mario Fernando Montenegro
Leite, Neucimar Jerônimo
Universidade Estadual de Campinas (UNICAMP). Instituto de Computação
Programa de Pós-Graduação em Ciência da Computação
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Costa, Glauber de Oliveira
dc.subject.por.fl_str_mv Categorização de imagens
Visão por computador
Recuperação da informação
Image categorization
Computer vision
Information retrieval
topic Categorização de imagens
Visão por computador
Recuperação da informação
Image categorization
Computer vision
Information retrieval
description Orientador: Siome Klein Goldenstein
publishDate 2010
dc.date.none.fl_str_mv 2010
2010-12-07T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1613717
COSTA, Glauber de Oliveira. Um estudo sobre categorização de mídias através do método de Latent Dirichlet Allocatio. 2010. 81 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1613717. Acesso em: 3 set. 2024.
url https://hdl.handle.net/20.500.12733/1613717
identifier_str_mv COSTA, Glauber de Oliveira. Um estudo sobre categorização de mídias através do método de Latent Dirichlet Allocatio. 2010. 81 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1613717. Acesso em: 3 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/779402
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
81 f. : il.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809189043712294912