Interações gestuais para plataformas de streaming de vídeo

Detalhes bibliográficos
Autor(a) principal: Teixeira, Francisco João Mendonça
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.13/3845
Resumo: A popularidade do rato de computador como modo preferencial de interação com aplicações de computador é inigualável. Mesmo no tempo dos smartphones e tablets, que trouxeram ao público em geral inovações como o modo de controlo através do toque, não existe uma grande variedade nos modos de interação com os diversos dispositivos que usamos no quotidiano. Este trabalho propõe uma nova abordagem para controlo, à distância, de aplicações de streaming de vídeo. A aplicação desenvolvida nesta dissertação procura um meio mais natural de interação com este tipo de plataformas usando interações gestuais, captadas pela câmara de profundidade RealSense D435. Câmaras de profundidade, ao contrário de câmaras de vídeo comuns, utilizam um fluxo de luz infravermelha para determinar a distância dos objetos relativamente à câmara. A câmara utilizada neste projeto possui capacidades de captura tanto neste modo, como no modo comum RGB. Foi criada de raiz uma interface gráfica inspirada pela plataforma Netflix, para permitir o controlo dos seus botões e os vídeos reproduzidos, programaticamente. Foram desenvolvidos dois protótipos com tecnologias distintas para interagir com a interface. O primeiro, utiliza métodos de tratamento de imagem para retirar a informação pretendida, e um modelo pré-treinado de reconhecimento de gestos para identificar o gesto realizado. O segundo, integra um modelo de deteção e classificação de objetos otimizado para deteção e rastreamento de mãos entre frames. Foram feitas análises experimentais entre ambos e selecionado o segundo protótipo para prosseguir a testes com utilizadores. A aplicação foi testada por 11 participantes, num estudo que comparou os seus tempos de utilização da aplicação por meio de interações gestuais com os tempos de utilização com o rato de computador. O sistema mereceu, por parte dos participantes, uma pontuação SUS “aceitável”. Conclui-se que o sistema alcançou as expectativas iniciais, ainda que possua limitações aparentes que poderão ser mitigadas em iterações futuras.
id RCAP_8afcd70d1cfbe8149d66a59b807dcb3c
oai_identifier_str oai:digituma.uma.pt:10400.13/3845
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Interações gestuais para plataformas de streaming de vídeoInteração gestualDeteção de objetosSubtração do plano de fundoSegmentação do primeiro planoRastreamento gestualMediaPipeGestural interactionsObject detectionBackground subtractionForeground segmentationHand trackingEngenharia Informática.Faculdade de Ciências Exatas e da EngenhariaDomínio/Área Científica::Engenharia e TecnologiaA popularidade do rato de computador como modo preferencial de interação com aplicações de computador é inigualável. Mesmo no tempo dos smartphones e tablets, que trouxeram ao público em geral inovações como o modo de controlo através do toque, não existe uma grande variedade nos modos de interação com os diversos dispositivos que usamos no quotidiano. Este trabalho propõe uma nova abordagem para controlo, à distância, de aplicações de streaming de vídeo. A aplicação desenvolvida nesta dissertação procura um meio mais natural de interação com este tipo de plataformas usando interações gestuais, captadas pela câmara de profundidade RealSense D435. Câmaras de profundidade, ao contrário de câmaras de vídeo comuns, utilizam um fluxo de luz infravermelha para determinar a distância dos objetos relativamente à câmara. A câmara utilizada neste projeto possui capacidades de captura tanto neste modo, como no modo comum RGB. Foi criada de raiz uma interface gráfica inspirada pela plataforma Netflix, para permitir o controlo dos seus botões e os vídeos reproduzidos, programaticamente. Foram desenvolvidos dois protótipos com tecnologias distintas para interagir com a interface. O primeiro, utiliza métodos de tratamento de imagem para retirar a informação pretendida, e um modelo pré-treinado de reconhecimento de gestos para identificar o gesto realizado. O segundo, integra um modelo de deteção e classificação de objetos otimizado para deteção e rastreamento de mãos entre frames. Foram feitas análises experimentais entre ambos e selecionado o segundo protótipo para prosseguir a testes com utilizadores. A aplicação foi testada por 11 participantes, num estudo que comparou os seus tempos de utilização da aplicação por meio de interações gestuais com os tempos de utilização com o rato de computador. O sistema mereceu, por parte dos participantes, uma pontuação SUS “aceitável”. Conclui-se que o sistema alcançou as expectativas iniciais, ainda que possua limitações aparentes que poderão ser mitigadas em iterações futuras.The popularity of the computer mouse as the preferred interaction method with computer applications is unrivalled. Even in the age of smartphones and tablets, which have introduced touch screens to the masses, there seems to be a lack of variety regarding interaction methods with devices that we use every day. This work proposes a new approach to interacting with video streaming applications from afar. The program developed for this dissertation looks for a more natural way of controlling these services by using gestural interactions, which are captured by the depth camera RealSense D435. Depth cameras, unlike regular video cameras, use an infrared feed to determine the distance of objects in frame, relative to the camera. The camera used in this project offers both infrared and RGB capturing modes. A graphical interface, inspired by streaming platform Netflix, was created from scratch to allow control over its buttons and the video displayed programmatically. Two prototypes to interact with the GUI were developed using distinct technologies. The first one only uses image treatment methods to get the desired data and a pre-trained model for gesture recognitions to identify the gesture performed. The second one integrates an object detection and classification model optimized for hand detection and tracking between frames. Experimental analyses were run to compare both prototypes, resulting on the second being selected to proceed to the user tests stage. The application was tested by 11 participants, in a study that tracked their times using the application via gestural interactions as well as with a computer mouse. The system merited an “acceptable” usability score by the participant. We can conclude the system met the initial expectations despite its apparent limitations, which can be mitigated in future iterations.Campos, Pedro Filipe PereiraCabral, Diogo Nuno Crespo RibeiroDigitUMaTeixeira, Francisco João Mendonça2021-11-23T11:57:09Z2021-07-27T00:00:00Z2021-07-27T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.13/3845202792765porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-09-05T12:56:56Zoai:digituma.uma.pt:10400.13/3845Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T15:07:23.872859Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Interações gestuais para plataformas de streaming de vídeo
title Interações gestuais para plataformas de streaming de vídeo
spellingShingle Interações gestuais para plataformas de streaming de vídeo
Teixeira, Francisco João Mendonça
Interação gestual
Deteção de objetos
Subtração do plano de fundo
Segmentação do primeiro plano
Rastreamento gestual
MediaPipe
Gestural interactions
Object detection
Background subtraction
Foreground segmentation
Hand tracking
Engenharia Informática
.
Faculdade de Ciências Exatas e da Engenharia
Domínio/Área Científica::Engenharia e Tecnologia
title_short Interações gestuais para plataformas de streaming de vídeo
title_full Interações gestuais para plataformas de streaming de vídeo
title_fullStr Interações gestuais para plataformas de streaming de vídeo
title_full_unstemmed Interações gestuais para plataformas de streaming de vídeo
title_sort Interações gestuais para plataformas de streaming de vídeo
author Teixeira, Francisco João Mendonça
author_facet Teixeira, Francisco João Mendonça
author_role author
dc.contributor.none.fl_str_mv Campos, Pedro Filipe Pereira
Cabral, Diogo Nuno Crespo Ribeiro
DigitUMa
dc.contributor.author.fl_str_mv Teixeira, Francisco João Mendonça
dc.subject.por.fl_str_mv Interação gestual
Deteção de objetos
Subtração do plano de fundo
Segmentação do primeiro plano
Rastreamento gestual
MediaPipe
Gestural interactions
Object detection
Background subtraction
Foreground segmentation
Hand tracking
Engenharia Informática
.
Faculdade de Ciências Exatas e da Engenharia
Domínio/Área Científica::Engenharia e Tecnologia
topic Interação gestual
Deteção de objetos
Subtração do plano de fundo
Segmentação do primeiro plano
Rastreamento gestual
MediaPipe
Gestural interactions
Object detection
Background subtraction
Foreground segmentation
Hand tracking
Engenharia Informática
.
Faculdade de Ciências Exatas e da Engenharia
Domínio/Área Científica::Engenharia e Tecnologia
description A popularidade do rato de computador como modo preferencial de interação com aplicações de computador é inigualável. Mesmo no tempo dos smartphones e tablets, que trouxeram ao público em geral inovações como o modo de controlo através do toque, não existe uma grande variedade nos modos de interação com os diversos dispositivos que usamos no quotidiano. Este trabalho propõe uma nova abordagem para controlo, à distância, de aplicações de streaming de vídeo. A aplicação desenvolvida nesta dissertação procura um meio mais natural de interação com este tipo de plataformas usando interações gestuais, captadas pela câmara de profundidade RealSense D435. Câmaras de profundidade, ao contrário de câmaras de vídeo comuns, utilizam um fluxo de luz infravermelha para determinar a distância dos objetos relativamente à câmara. A câmara utilizada neste projeto possui capacidades de captura tanto neste modo, como no modo comum RGB. Foi criada de raiz uma interface gráfica inspirada pela plataforma Netflix, para permitir o controlo dos seus botões e os vídeos reproduzidos, programaticamente. Foram desenvolvidos dois protótipos com tecnologias distintas para interagir com a interface. O primeiro, utiliza métodos de tratamento de imagem para retirar a informação pretendida, e um modelo pré-treinado de reconhecimento de gestos para identificar o gesto realizado. O segundo, integra um modelo de deteção e classificação de objetos otimizado para deteção e rastreamento de mãos entre frames. Foram feitas análises experimentais entre ambos e selecionado o segundo protótipo para prosseguir a testes com utilizadores. A aplicação foi testada por 11 participantes, num estudo que comparou os seus tempos de utilização da aplicação por meio de interações gestuais com os tempos de utilização com o rato de computador. O sistema mereceu, por parte dos participantes, uma pontuação SUS “aceitável”. Conclui-se que o sistema alcançou as expectativas iniciais, ainda que possua limitações aparentes que poderão ser mitigadas em iterações futuras.
publishDate 2021
dc.date.none.fl_str_mv 2021-11-23T11:57:09Z
2021-07-27T00:00:00Z
2021-07-27T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.13/3845
202792765
url http://hdl.handle.net/10400.13/3845
identifier_str_mv 202792765
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799129942914498560