Reconhecimento de ações com histogramas de características visuais e contexto adicionado por tranferência de aprendizagem

Detalhes bibliográficos
Autor(a) principal: Ana Paula Brandao Lopes
Data de Publicação: 2011
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/SLSS-8MAHST
Resumo: Esta tese aborda o reconhecimento de ações humanas em vídeos realistas com base no conteúdo visual. Uma ampla revisão da literatura mostrou que abordagens baseadas em histogramas de características visuais (BoVF) têm consistentemente apresentado bons resultados neste tipo de cenário. Portanto, uma implementação BoVF foi produzida e aplicada: a) para um estudo sobre a inclusão de informação dinâmica nos descritores BoVF; e b) para tarefas baseadas em conteúdo em dois cenários realistas distintos: detecção de nudez e classificação de fotografias históricas. Finalmente, foi produzida a hipótese de que o contexto tem papel importante em cenários realistas e que a teoria da Transferência de Aprendizagem pode auxiliar a superar a falta de bases de dados de ações anotadas para conceitos contextuais. Experimentos com bases públicas de ações e imagens mostraram que a solução proposta é de fato capaz de obter melhorias estatisticamente significativas na classificação da maioria das ações.
id UFMG_18186586cf29ffc404e5ee62d756c9ed
oai_identifier_str oai:repositorio.ufmg.br:1843/SLSS-8MAHST
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Arnaldo de Albuquerque AraujoJussara Marques de AlmeidaMarcos Andre GoncalvesRicardo da Silva TorresEduardo Alves do Valle JruniorAna Paula Brandao Lopes2019-08-11T22:28:23Z2019-08-11T22:28:23Z2011-09-30http://hdl.handle.net/1843/SLSS-8MAHSTEsta tese aborda o reconhecimento de ações humanas em vídeos realistas com base no conteúdo visual. Uma ampla revisão da literatura mostrou que abordagens baseadas em histogramas de características visuais (BoVF) têm consistentemente apresentado bons resultados neste tipo de cenário. Portanto, uma implementação BoVF foi produzida e aplicada: a) para um estudo sobre a inclusão de informação dinâmica nos descritores BoVF; e b) para tarefas baseadas em conteúdo em dois cenários realistas distintos: detecção de nudez e classificação de fotografias históricas. Finalmente, foi produzida a hipótese de que o contexto tem papel importante em cenários realistas e que a teoria da Transferência de Aprendizagem pode auxiliar a superar a falta de bases de dados de ações anotadas para conceitos contextuais. Experimentos com bases públicas de ações e imagens mostraram que a solução proposta é de fato capaz de obter melhorias estatisticamente significativas na classificação da maioria das ações.This thesis addresses the task of recognizing human actions in realistic videos based on their visual content. Such an ability has a wide variety of applications in specic settings, but this work is above all motivated by the idea that efective visual descriptors and models need to be provided in order to make current search engines better able tocope with the large amount of multimedia data being produced every day.An issue which has arisen from preliminary studies is the fact that to manually collect action samples from realistic videos is a time-consuming and error-prone task. This is a serious bottleneck to research related to video understanding, since the large intra-class variations of such videos demand training sets large enough to properlyencompass those variations. In this thesis, we propose an approach for this problem based on Transfer Learning (TL) theory, in which we relax the classical supposition that training and testing data must come from the same distribution. Our experiments with Caltech256 andHollywood2 databases indicated that by using transferred information from only four concepts taken from the auxiliary database we were able to obtain statistically signi cant improvements in classication of most actions in Hollywood2 database, thus providing strong evidence in favor of the presented solution. Such solution encompasses our main thesis, which can be summarized in two main contributions: a) it is feasibleto use TL techniques to detect concepts in realistic video action databases and, b) by using the transferred information, it is possible to enhance action recognition in thosescenarios.Universidade Federal de Minas GeraisUFMGComputaçãoCompreensão de VídeosHistogramas de Características Visuais LocaisContexto em Reconhecimento de AçõesTransferência de AprendizagemReconhecimento de Ações HumanasReconhecimento de ações com histogramas de características visuais e contexto adicionado por tranferência de aprendizageminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALanapaulabrandaolopes.pdfapplication/pdf5916151https://repositorio.ufmg.br/bitstream/1843/SLSS-8MAHST/1/anapaulabrandaolopes.pdf6c64da9f6598609c854d29f09fecbd43MD51TEXTanapaulabrandaolopes.pdf.txtanapaulabrandaolopes.pdf.txtExtracted texttext/plain258274https://repositorio.ufmg.br/bitstream/1843/SLSS-8MAHST/2/anapaulabrandaolopes.pdf.txtb281638c48a1900d7a2561f4a24923bfMD521843/SLSS-8MAHST2019-11-14 05:17:16.162oai:repositorio.ufmg.br:1843/SLSS-8MAHSTRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T08:17:16Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Reconhecimento de ações com histogramas de características visuais e contexto adicionado por tranferência de aprendizagem
title Reconhecimento de ações com histogramas de características visuais e contexto adicionado por tranferência de aprendizagem
spellingShingle Reconhecimento de ações com histogramas de características visuais e contexto adicionado por tranferência de aprendizagem
Ana Paula Brandao Lopes
Compreensão de Vídeos
Histogramas de Características Visuais Locais
Contexto em Reconhecimento de Ações
Transferência de Aprendizagem
Reconhecimento de Ações Humanas
Computação
title_short Reconhecimento de ações com histogramas de características visuais e contexto adicionado por tranferência de aprendizagem
title_full Reconhecimento de ações com histogramas de características visuais e contexto adicionado por tranferência de aprendizagem
title_fullStr Reconhecimento de ações com histogramas de características visuais e contexto adicionado por tranferência de aprendizagem
title_full_unstemmed Reconhecimento de ações com histogramas de características visuais e contexto adicionado por tranferência de aprendizagem
title_sort Reconhecimento de ações com histogramas de características visuais e contexto adicionado por tranferência de aprendizagem
author Ana Paula Brandao Lopes
author_facet Ana Paula Brandao Lopes
author_role author
dc.contributor.advisor1.fl_str_mv Arnaldo de Albuquerque Araujo
dc.contributor.advisor-co1.fl_str_mv Jussara Marques de Almeida
dc.contributor.referee1.fl_str_mv Marcos Andre Goncalves
dc.contributor.referee2.fl_str_mv Ricardo da Silva Torres
dc.contributor.referee3.fl_str_mv Eduardo Alves do Valle Jrunior
dc.contributor.author.fl_str_mv Ana Paula Brandao Lopes
contributor_str_mv Arnaldo de Albuquerque Araujo
Jussara Marques de Almeida
Marcos Andre Goncalves
Ricardo da Silva Torres
Eduardo Alves do Valle Jrunior
dc.subject.por.fl_str_mv Compreensão de Vídeos
Histogramas de Características Visuais Locais
Contexto em Reconhecimento de Ações
Transferência de Aprendizagem
Reconhecimento de Ações Humanas
topic Compreensão de Vídeos
Histogramas de Características Visuais Locais
Contexto em Reconhecimento de Ações
Transferência de Aprendizagem
Reconhecimento de Ações Humanas
Computação
dc.subject.other.pt_BR.fl_str_mv Computação
description Esta tese aborda o reconhecimento de ações humanas em vídeos realistas com base no conteúdo visual. Uma ampla revisão da literatura mostrou que abordagens baseadas em histogramas de características visuais (BoVF) têm consistentemente apresentado bons resultados neste tipo de cenário. Portanto, uma implementação BoVF foi produzida e aplicada: a) para um estudo sobre a inclusão de informação dinâmica nos descritores BoVF; e b) para tarefas baseadas em conteúdo em dois cenários realistas distintos: detecção de nudez e classificação de fotografias históricas. Finalmente, foi produzida a hipótese de que o contexto tem papel importante em cenários realistas e que a teoria da Transferência de Aprendizagem pode auxiliar a superar a falta de bases de dados de ações anotadas para conceitos contextuais. Experimentos com bases públicas de ações e imagens mostraram que a solução proposta é de fato capaz de obter melhorias estatisticamente significativas na classificação da maioria das ações.
publishDate 2011
dc.date.issued.fl_str_mv 2011-09-30
dc.date.accessioned.fl_str_mv 2019-08-11T22:28:23Z
dc.date.available.fl_str_mv 2019-08-11T22:28:23Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/SLSS-8MAHST
url http://hdl.handle.net/1843/SLSS-8MAHST
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/SLSS-8MAHST/1/anapaulabrandaolopes.pdf
https://repositorio.ufmg.br/bitstream/1843/SLSS-8MAHST/2/anapaulabrandaolopes.pdf.txt
bitstream.checksum.fl_str_mv 6c64da9f6598609c854d29f09fecbd43
b281638c48a1900d7a2561f4a24923bf
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589534478237696