Spatio-temporal action localization with Deep Learning

Detalhes bibliográficos
Autor(a) principal: Monteiro, Carlos Filipe Batista Cardoso
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/83491
Resumo: Dissertação de mestrado em Engenharia Informática
id RCAP_5a513010eb7fd9f6f51f407ddb0183f4
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/83491
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Spatio-temporal action localization with Deep LearningAction localizationAction recognitionSpatio-temporalViolence detectionLocalização de açõesReconhecimento de açãoEspácio-temporalDeteção de violênciaEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de mestrado em Engenharia InformáticaThe system that detects and identifies human activities are named human action recognition. On the video approach, human activity is classified into four different categories, depending on the complexity of the steps and the number of body parts involved in the action, namely gestures, actions, interactions, and activities, which is challenging for video Human action recognition to capture valuable and discriminative features because of the human body’s variations. So, deep learning techniques have provided practical applications in multiple fields of signal processing, usually surpassing traditional signal processing on a large scale. Recently, several applications, namely surveillance, human-computer interaction, and video recovery based on its content, have studied violence’s detection and recognition. In recent years there has been a rapid growth in the production and consumption of a wide variety of video data due to the popularization of high quality and relatively low-price video devices. Smartphones and digital cameras contributed a lot to this factor. At the same time, there are about 300 hours of video data updates every minute on YouTube. Along with the growing production of video data, new technologies such as video captioning, answering video surveys, and video-based activity/event detection are emerging every day. From the video input data, the detection of human activity indicates which activity is contained in the video and locates the regions in the video where the activity occurs. This dissertation has conducted an experiment to identify and detect violence with spatial action localization, adapting a public dataset for effect. The idea was used an annotated dataset of general action recognition and adapted only for violence detection.O sistema que deteta e identifica as atividades humanas é denominado reconhecimento da ação humana. Na abordagem por vídeo, a atividade humana é classificada em quatro categorias diferentes, dependendo da complexidade das etapas e do número de partes do corpo envolvidas na ação, a saber, gestos, ações, interações e atividades, o que é desafiador para o reconhecimento da ação humana do vídeo para capturar características valiosas e discriminativas devido às variações do corpo humano. Portanto, as técnicas de deep learning forneceram aplicações práticas em vários campos de processamento de sinal, geralmente superando o processamento de sinal tradicional em grande escala. Recentemente, várias aplicações, nomeadamente na vigilância, interação humano computador e recuperação de vídeo com base no seu conteúdo, estudaram a deteção e o reconhecimento da violência. Nos últimos anos, tem havido um rápido crescimento na produção e consumo de uma ampla variedade de dados de vídeo devido à popularização de dispositivos de vídeo de alta qualidade e preços relativamente baixos. Smartphones e cameras digitais contribuíram muito para esse fator. Ao mesmo tempo, há cerca de 300 horas de atualizações de dados de vídeo a cada minuto no YouTube. Junto com a produção crescente de dados de vídeo, novas tecnologias, como legendagem de vídeo, respostas a pesquisas de vídeo e deteção de eventos / atividades baseadas em vídeo estão surgindo todos os dias. A partir dos dados de entrada de vídeo, a deteção de atividade humana indica qual atividade está contida no vídeo e localiza as regiões no vídeo onde a atividade ocorre. Esta dissertação conduziu uma experiência para identificar e detetar violência com localização espacial, adaptando um dataset público para efeito. A ideia foi usada um conjunto de dados anotado de reconhecimento de ações gerais e adaptá-la apenas para deteção de violência.Novais, PauloDurães, Dalila AlvesUniversidade do MinhoMonteiro, Carlos Filipe Batista Cardoso2022-06-082022-06-08T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/83491eng203239164info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:22:41Zoai:repositorium.sdum.uminho.pt:1822/83491Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:16:12.906709Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Spatio-temporal action localization with Deep Learning
title Spatio-temporal action localization with Deep Learning
spellingShingle Spatio-temporal action localization with Deep Learning
Monteiro, Carlos Filipe Batista Cardoso
Action localization
Action recognition
Spatio-temporal
Violence detection
Localização de ações
Reconhecimento de ação
Espácio-temporal
Deteção de violência
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Spatio-temporal action localization with Deep Learning
title_full Spatio-temporal action localization with Deep Learning
title_fullStr Spatio-temporal action localization with Deep Learning
title_full_unstemmed Spatio-temporal action localization with Deep Learning
title_sort Spatio-temporal action localization with Deep Learning
author Monteiro, Carlos Filipe Batista Cardoso
author_facet Monteiro, Carlos Filipe Batista Cardoso
author_role author
dc.contributor.none.fl_str_mv Novais, Paulo
Durães, Dalila Alves
Universidade do Minho
dc.contributor.author.fl_str_mv Monteiro, Carlos Filipe Batista Cardoso
dc.subject.por.fl_str_mv Action localization
Action recognition
Spatio-temporal
Violence detection
Localização de ações
Reconhecimento de ação
Espácio-temporal
Deteção de violência
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Action localization
Action recognition
Spatio-temporal
Violence detection
Localização de ações
Reconhecimento de ação
Espácio-temporal
Deteção de violência
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description Dissertação de mestrado em Engenharia Informática
publishDate 2022
dc.date.none.fl_str_mv 2022-06-08
2022-06-08T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/83491
url https://hdl.handle.net/1822/83491
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 203239164
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132611066462208