Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos

Detalhes bibliográficos
Autor(a) principal: Costa, Felipe Franco
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/30169
Resumo: Métodos para classificação de vídeos têm evoluido por meio de propostas baseadas em arquiteturas end-to-end para aprendizagem profunda. Diversos trabalhos da literatura têm corroborado que tais modelos end-to-end são eficazes para o aprendizado de características intrínsecas às imagens (ou frames de um vídeo), quando comparados a descritores tradicionais (handcrafted). Assim, de maneira geral, utiliza-se redes neurais convolucionais para realizar o aprendizado profundo em vídeos. Quando aplicadas a tais contextos as mesmas podem apresentar variações baseadas em informações temporais, em células de memória (e.g. long-short term memory - LSTM) ou até mesmo métodos de entrada de fluxo óptico para auxílio de convolução. Porém, apesar de serem, de certa forma, eficazes para a classificação de vídeos, as mesmas negligenciam a análise global de vídeos, aceitando apenas alguns poucos frames por lote de processamento para treino e inferência. Além disso, não consideram o relacionamento semântico entre diferentes vídeos pertencentes a um mesmo contexto para auxiliar o processo de classificação. Dessa forma, o presentre trabalho visa preencher essas lacunas existentes. Para tanto, serão utilizados conceitos de agrupamento de informação e detecção contextual por meio de redes convolucionais baseadas em grafos (graph convolutional networks). Por meio de tal arquitetura espera-se propor um método capaz de criar e explorar o relacionamento entre diferentes vídeos de um dado contexto, visando melhor eficácia quando comparadao aos métodos do estado da arte.
id UTFPR-12_e72b16128492c3d63ea950b1c074d4ea
oai_identifier_str oai:repositorio.utfpr.edu.br:1/30169
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2022-11-24T13:49:24Z2022-11-24T13:49:24Z2020-08-14COSTA, Felipe Franco. Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos. 2020. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.http://repositorio.utfpr.edu.br/jspui/handle/1/30169Métodos para classificação de vídeos têm evoluido por meio de propostas baseadas em arquiteturas end-to-end para aprendizagem profunda. Diversos trabalhos da literatura têm corroborado que tais modelos end-to-end são eficazes para o aprendizado de características intrínsecas às imagens (ou frames de um vídeo), quando comparados a descritores tradicionais (handcrafted). Assim, de maneira geral, utiliza-se redes neurais convolucionais para realizar o aprendizado profundo em vídeos. Quando aplicadas a tais contextos as mesmas podem apresentar variações baseadas em informações temporais, em células de memória (e.g. long-short term memory - LSTM) ou até mesmo métodos de entrada de fluxo óptico para auxílio de convolução. Porém, apesar de serem, de certa forma, eficazes para a classificação de vídeos, as mesmas negligenciam a análise global de vídeos, aceitando apenas alguns poucos frames por lote de processamento para treino e inferência. Além disso, não consideram o relacionamento semântico entre diferentes vídeos pertencentes a um mesmo contexto para auxiliar o processo de classificação. Dessa forma, o presentre trabalho visa preencher essas lacunas existentes. Para tanto, serão utilizados conceitos de agrupamento de informação e detecção contextual por meio de redes convolucionais baseadas em grafos (graph convolutional networks). Por meio de tal arquitetura espera-se propor um método capaz de criar e explorar o relacionamento entre diferentes vídeos de um dado contexto, visando melhor eficácia quando comparadao aos métodos do estado da arte.Video classification methods have been evolving through proposals based on end-to-end architectures for deep learning. Many academic works have validated that such end-to-end models are effective for the learning of characteristics intrinsic to videos, especially when compared to traditional, handcrafted, descriptors. In general, convolutional neural networks are used for deep learning in videos. When applied to such contexts, the networks can display variations based on temporal information, based memory cells (e.g. long-short term memory), or even optical flow techniques used in conjunction with the convolution process. However, despite its effectiveness, those methods neglect global analysis, processing only a small quantity of frames in each batch during the learning and inference process. Moreover, they also completely ignore the semantic relationship between different videos that belong to the same context. Thus, the present work aims to fill the existing gaps by using concepts of information grouping and contextual detection through graph-based convolutional neural networks (GCN). With these architectures we hope to propose new approaches to create and explore the relationship between different videos of a given context, improving the state-of-the-art in the process.porUniversidade Tecnológica Federal do ParanáCornelio ProcopioPrograma de Pós-Graduação em InformáticaUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRACiência da ComputaçãoAprendizado do computadorTeoria dos grafosVisão por computadorMachine learningGraph theoryComputer visionClassificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafosVideo actions classification through graph-based convolutional neural networksinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCornélio ProcópioBugatti, Pedro Henriquehttps://orcid.org/0000-0001-9421-9254http://lattes.cnpq.br/2177467029991118Oliveira, Claiton dehttps://orcid.org/0000-0003-2953-6223http://lattes.cnpq.br/8851289265109891Silva, Marcelo Ponciano dahttp://lattes.cnpq.br/5460455448058206Bugatti, Pedro Henriquehttps://orcid.org/0000-0001-9421-9254http://lattes.cnpq.br/2177467029991118http://lattes.cnpq.br/7664951989762803Costa, Felipe Francoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALCP_PPGI_M_Costa,Felipe_Franco_2020.pdfapplication/pdf2717904http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30169/1/CP_PPGI_M_Costa%2cFelipe_Franco_2020.pdf2a2bab153d321d9a176fc5f631411f21MD51TEXTCP_PPGI_M_Costa,Felipe_Franco_2020.pdf.txtCP_PPGI_M_Costa,Felipe_Franco_2020.pdf.txtExtracted texttext/plain102366http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30169/2/CP_PPGI_M_Costa%2cFelipe_Franco_2020.pdf.txt10dc446d7b22a47e74e8ac41c4c763f1MD52THUMBNAILCP_PPGI_M_Costa,Felipe_Franco_2020.pdf.jpgCP_PPGI_M_Costa,Felipe_Franco_2020.pdf.jpgGenerated Thumbnailimage/jpeg1322http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30169/3/CP_PPGI_M_Costa%2cFelipe_Franco_2020.pdf.jpg9cc1a6f90859d79e7bceeffb401f083fMD531/301692022-11-25 04:05:23.779oai:repositorio.utfpr.edu.br:1/30169Repositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2022-11-25T06:05:23Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
dc.title.alternative.pt_BR.fl_str_mv Video actions classification through graph-based convolutional neural networks
title Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
spellingShingle Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
Costa, Felipe Franco
CNPQ::CIENCIAS EXATAS E DA TERRA
Aprendizado do computador
Teoria dos grafos
Visão por computador
Machine learning
Graph theory
Computer vision
Ciência da Computação
title_short Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
title_full Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
title_fullStr Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
title_full_unstemmed Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
title_sort Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
author Costa, Felipe Franco
author_facet Costa, Felipe Franco
author_role author
dc.contributor.advisor1.fl_str_mv Bugatti, Pedro Henrique
dc.contributor.advisor1ID.fl_str_mv https://orcid.org/0000-0001-9421-9254
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/2177467029991118
dc.contributor.referee1.fl_str_mv Oliveira, Claiton de
dc.contributor.referee1ID.fl_str_mv https://orcid.org/0000-0003-2953-6223
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/8851289265109891
dc.contributor.referee2.fl_str_mv Silva, Marcelo Ponciano da
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/5460455448058206
dc.contributor.referee3.fl_str_mv Bugatti, Pedro Henrique
dc.contributor.referee3ID.fl_str_mv https://orcid.org/0000-0001-9421-9254
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/2177467029991118
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/7664951989762803
dc.contributor.author.fl_str_mv Costa, Felipe Franco
contributor_str_mv Bugatti, Pedro Henrique
Oliveira, Claiton de
Silva, Marcelo Ponciano da
Bugatti, Pedro Henrique
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA
topic CNPQ::CIENCIAS EXATAS E DA TERRA
Aprendizado do computador
Teoria dos grafos
Visão por computador
Machine learning
Graph theory
Computer vision
Ciência da Computação
dc.subject.por.fl_str_mv Aprendizado do computador
Teoria dos grafos
Visão por computador
Machine learning
Graph theory
Computer vision
dc.subject.capes.pt_BR.fl_str_mv Ciência da Computação
description Métodos para classificação de vídeos têm evoluido por meio de propostas baseadas em arquiteturas end-to-end para aprendizagem profunda. Diversos trabalhos da literatura têm corroborado que tais modelos end-to-end são eficazes para o aprendizado de características intrínsecas às imagens (ou frames de um vídeo), quando comparados a descritores tradicionais (handcrafted). Assim, de maneira geral, utiliza-se redes neurais convolucionais para realizar o aprendizado profundo em vídeos. Quando aplicadas a tais contextos as mesmas podem apresentar variações baseadas em informações temporais, em células de memória (e.g. long-short term memory - LSTM) ou até mesmo métodos de entrada de fluxo óptico para auxílio de convolução. Porém, apesar de serem, de certa forma, eficazes para a classificação de vídeos, as mesmas negligenciam a análise global de vídeos, aceitando apenas alguns poucos frames por lote de processamento para treino e inferência. Além disso, não consideram o relacionamento semântico entre diferentes vídeos pertencentes a um mesmo contexto para auxiliar o processo de classificação. Dessa forma, o presentre trabalho visa preencher essas lacunas existentes. Para tanto, serão utilizados conceitos de agrupamento de informação e detecção contextual por meio de redes convolucionais baseadas em grafos (graph convolutional networks). Por meio de tal arquitetura espera-se propor um método capaz de criar e explorar o relacionamento entre diferentes vídeos de um dado contexto, visando melhor eficácia quando comparadao aos métodos do estado da arte.
publishDate 2020
dc.date.issued.fl_str_mv 2020-08-14
dc.date.accessioned.fl_str_mv 2022-11-24T13:49:24Z
dc.date.available.fl_str_mv 2022-11-24T13:49:24Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv COSTA, Felipe Franco. Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos. 2020. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/30169
identifier_str_mv COSTA, Felipe Franco. Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos. 2020. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.
url http://repositorio.utfpr.edu.br/jspui/handle/1/30169
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Informática
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30169/1/CP_PPGI_M_Costa%2cFelipe_Franco_2020.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30169/2/CP_PPGI_M_Costa%2cFelipe_Franco_2020.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30169/3/CP_PPGI_M_Costa%2cFelipe_Franco_2020.pdf.jpg
bitstream.checksum.fl_str_mv 2a2bab153d321d9a176fc5f631411f21
10dc446d7b22a47e74e8ac41c4c763f1
9cc1a6f90859d79e7bceeffb401f083f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805923154355290112