Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/30169 |
Resumo: | Métodos para classificação de vídeos têm evoluido por meio de propostas baseadas em arquiteturas end-to-end para aprendizagem profunda. Diversos trabalhos da literatura têm corroborado que tais modelos end-to-end são eficazes para o aprendizado de características intrínsecas às imagens (ou frames de um vídeo), quando comparados a descritores tradicionais (handcrafted). Assim, de maneira geral, utiliza-se redes neurais convolucionais para realizar o aprendizado profundo em vídeos. Quando aplicadas a tais contextos as mesmas podem apresentar variações baseadas em informações temporais, em células de memória (e.g. long-short term memory - LSTM) ou até mesmo métodos de entrada de fluxo óptico para auxílio de convolução. Porém, apesar de serem, de certa forma, eficazes para a classificação de vídeos, as mesmas negligenciam a análise global de vídeos, aceitando apenas alguns poucos frames por lote de processamento para treino e inferência. Além disso, não consideram o relacionamento semântico entre diferentes vídeos pertencentes a um mesmo contexto para auxiliar o processo de classificação. Dessa forma, o presentre trabalho visa preencher essas lacunas existentes. Para tanto, serão utilizados conceitos de agrupamento de informação e detecção contextual por meio de redes convolucionais baseadas em grafos (graph convolutional networks). Por meio de tal arquitetura espera-se propor um método capaz de criar e explorar o relacionamento entre diferentes vídeos de um dado contexto, visando melhor eficácia quando comparadao aos métodos do estado da arte. |
id |
UTFPR-12_e72b16128492c3d63ea950b1c074d4ea |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/30169 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2022-11-24T13:49:24Z2022-11-24T13:49:24Z2020-08-14COSTA, Felipe Franco. Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos. 2020. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.http://repositorio.utfpr.edu.br/jspui/handle/1/30169Métodos para classificação de vídeos têm evoluido por meio de propostas baseadas em arquiteturas end-to-end para aprendizagem profunda. Diversos trabalhos da literatura têm corroborado que tais modelos end-to-end são eficazes para o aprendizado de características intrínsecas às imagens (ou frames de um vídeo), quando comparados a descritores tradicionais (handcrafted). Assim, de maneira geral, utiliza-se redes neurais convolucionais para realizar o aprendizado profundo em vídeos. Quando aplicadas a tais contextos as mesmas podem apresentar variações baseadas em informações temporais, em células de memória (e.g. long-short term memory - LSTM) ou até mesmo métodos de entrada de fluxo óptico para auxílio de convolução. Porém, apesar de serem, de certa forma, eficazes para a classificação de vídeos, as mesmas negligenciam a análise global de vídeos, aceitando apenas alguns poucos frames por lote de processamento para treino e inferência. Além disso, não consideram o relacionamento semântico entre diferentes vídeos pertencentes a um mesmo contexto para auxiliar o processo de classificação. Dessa forma, o presentre trabalho visa preencher essas lacunas existentes. Para tanto, serão utilizados conceitos de agrupamento de informação e detecção contextual por meio de redes convolucionais baseadas em grafos (graph convolutional networks). Por meio de tal arquitetura espera-se propor um método capaz de criar e explorar o relacionamento entre diferentes vídeos de um dado contexto, visando melhor eficácia quando comparadao aos métodos do estado da arte.Video classification methods have been evolving through proposals based on end-to-end architectures for deep learning. Many academic works have validated that such end-to-end models are effective for the learning of characteristics intrinsic to videos, especially when compared to traditional, handcrafted, descriptors. In general, convolutional neural networks are used for deep learning in videos. When applied to such contexts, the networks can display variations based on temporal information, based memory cells (e.g. long-short term memory), or even optical flow techniques used in conjunction with the convolution process. However, despite its effectiveness, those methods neglect global analysis, processing only a small quantity of frames in each batch during the learning and inference process. Moreover, they also completely ignore the semantic relationship between different videos that belong to the same context. Thus, the present work aims to fill the existing gaps by using concepts of information grouping and contextual detection through graph-based convolutional neural networks (GCN). With these architectures we hope to propose new approaches to create and explore the relationship between different videos of a given context, improving the state-of-the-art in the process.porUniversidade Tecnológica Federal do ParanáCornelio ProcopioPrograma de Pós-Graduação em InformáticaUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRACiência da ComputaçãoAprendizado do computadorTeoria dos grafosVisão por computadorMachine learningGraph theoryComputer visionClassificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafosVideo actions classification through graph-based convolutional neural networksinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCornélio ProcópioBugatti, Pedro Henriquehttps://orcid.org/0000-0001-9421-9254http://lattes.cnpq.br/2177467029991118Oliveira, Claiton dehttps://orcid.org/0000-0003-2953-6223http://lattes.cnpq.br/8851289265109891Silva, Marcelo Ponciano dahttp://lattes.cnpq.br/5460455448058206Bugatti, Pedro Henriquehttps://orcid.org/0000-0001-9421-9254http://lattes.cnpq.br/2177467029991118http://lattes.cnpq.br/7664951989762803Costa, Felipe Francoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALCP_PPGI_M_Costa,Felipe_Franco_2020.pdfapplication/pdf2717904http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30169/1/CP_PPGI_M_Costa%2cFelipe_Franco_2020.pdf2a2bab153d321d9a176fc5f631411f21MD51TEXTCP_PPGI_M_Costa,Felipe_Franco_2020.pdf.txtCP_PPGI_M_Costa,Felipe_Franco_2020.pdf.txtExtracted texttext/plain102366http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30169/2/CP_PPGI_M_Costa%2cFelipe_Franco_2020.pdf.txt10dc446d7b22a47e74e8ac41c4c763f1MD52THUMBNAILCP_PPGI_M_Costa,Felipe_Franco_2020.pdf.jpgCP_PPGI_M_Costa,Felipe_Franco_2020.pdf.jpgGenerated Thumbnailimage/jpeg1322http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30169/3/CP_PPGI_M_Costa%2cFelipe_Franco_2020.pdf.jpg9cc1a6f90859d79e7bceeffb401f083fMD531/301692022-11-25 04:05:23.779oai:repositorio.utfpr.edu.br:1/30169Repositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2022-11-25T06:05:23Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos |
dc.title.alternative.pt_BR.fl_str_mv |
Video actions classification through graph-based convolutional neural networks |
title |
Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos |
spellingShingle |
Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos Costa, Felipe Franco CNPQ::CIENCIAS EXATAS E DA TERRA Aprendizado do computador Teoria dos grafos Visão por computador Machine learning Graph theory Computer vision Ciência da Computação |
title_short |
Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos |
title_full |
Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos |
title_fullStr |
Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos |
title_full_unstemmed |
Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos |
title_sort |
Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos |
author |
Costa, Felipe Franco |
author_facet |
Costa, Felipe Franco |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Bugatti, Pedro Henrique |
dc.contributor.advisor1ID.fl_str_mv |
https://orcid.org/0000-0001-9421-9254 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/2177467029991118 |
dc.contributor.referee1.fl_str_mv |
Oliveira, Claiton de |
dc.contributor.referee1ID.fl_str_mv |
https://orcid.org/0000-0003-2953-6223 |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/8851289265109891 |
dc.contributor.referee2.fl_str_mv |
Silva, Marcelo Ponciano da |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/5460455448058206 |
dc.contributor.referee3.fl_str_mv |
Bugatti, Pedro Henrique |
dc.contributor.referee3ID.fl_str_mv |
https://orcid.org/0000-0001-9421-9254 |
dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/2177467029991118 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/7664951989762803 |
dc.contributor.author.fl_str_mv |
Costa, Felipe Franco |
contributor_str_mv |
Bugatti, Pedro Henrique Oliveira, Claiton de Silva, Marcelo Ponciano da Bugatti, Pedro Henrique |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA Aprendizado do computador Teoria dos grafos Visão por computador Machine learning Graph theory Computer vision Ciência da Computação |
dc.subject.por.fl_str_mv |
Aprendizado do computador Teoria dos grafos Visão por computador Machine learning Graph theory Computer vision |
dc.subject.capes.pt_BR.fl_str_mv |
Ciência da Computação |
description |
Métodos para classificação de vídeos têm evoluido por meio de propostas baseadas em arquiteturas end-to-end para aprendizagem profunda. Diversos trabalhos da literatura têm corroborado que tais modelos end-to-end são eficazes para o aprendizado de características intrínsecas às imagens (ou frames de um vídeo), quando comparados a descritores tradicionais (handcrafted). Assim, de maneira geral, utiliza-se redes neurais convolucionais para realizar o aprendizado profundo em vídeos. Quando aplicadas a tais contextos as mesmas podem apresentar variações baseadas em informações temporais, em células de memória (e.g. long-short term memory - LSTM) ou até mesmo métodos de entrada de fluxo óptico para auxílio de convolução. Porém, apesar de serem, de certa forma, eficazes para a classificação de vídeos, as mesmas negligenciam a análise global de vídeos, aceitando apenas alguns poucos frames por lote de processamento para treino e inferência. Além disso, não consideram o relacionamento semântico entre diferentes vídeos pertencentes a um mesmo contexto para auxiliar o processo de classificação. Dessa forma, o presentre trabalho visa preencher essas lacunas existentes. Para tanto, serão utilizados conceitos de agrupamento de informação e detecção contextual por meio de redes convolucionais baseadas em grafos (graph convolutional networks). Por meio de tal arquitetura espera-se propor um método capaz de criar e explorar o relacionamento entre diferentes vídeos de um dado contexto, visando melhor eficácia quando comparadao aos métodos do estado da arte. |
publishDate |
2020 |
dc.date.issued.fl_str_mv |
2020-08-14 |
dc.date.accessioned.fl_str_mv |
2022-11-24T13:49:24Z |
dc.date.available.fl_str_mv |
2022-11-24T13:49:24Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
COSTA, Felipe Franco. Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos. 2020. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/30169 |
identifier_str_mv |
COSTA, Felipe Franco. Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos. 2020. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/30169 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Informática |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30169/1/CP_PPGI_M_Costa%2cFelipe_Franco_2020.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30169/2/CP_PPGI_M_Costa%2cFelipe_Franco_2020.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30169/3/CP_PPGI_M_Costa%2cFelipe_Franco_2020.pdf.jpg |
bitstream.checksum.fl_str_mv |
2a2bab153d321d9a176fc5f631411f21 10dc446d7b22a47e74e8ac41c4c763f1 9cc1a6f90859d79e7bceeffb401f083f |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805923154355290112 |