Interações gestuais para plataformas de streaming de vídeo
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.13/3845 |
Resumo: | A popularidade do rato de computador como modo preferencial de interação com aplicações de computador é inigualável. Mesmo no tempo dos smartphones e tablets, que trouxeram ao público em geral inovações como o modo de controlo através do toque, não existe uma grande variedade nos modos de interação com os diversos dispositivos que usamos no quotidiano. Este trabalho propõe uma nova abordagem para controlo, à distância, de aplicações de streaming de vídeo. A aplicação desenvolvida nesta dissertação procura um meio mais natural de interação com este tipo de plataformas usando interações gestuais, captadas pela câmara de profundidade RealSense D435. Câmaras de profundidade, ao contrário de câmaras de vídeo comuns, utilizam um fluxo de luz infravermelha para determinar a distância dos objetos relativamente à câmara. A câmara utilizada neste projeto possui capacidades de captura tanto neste modo, como no modo comum RGB. Foi criada de raiz uma interface gráfica inspirada pela plataforma Netflix, para permitir o controlo dos seus botões e os vídeos reproduzidos, programaticamente. Foram desenvolvidos dois protótipos com tecnologias distintas para interagir com a interface. O primeiro, utiliza métodos de tratamento de imagem para retirar a informação pretendida, e um modelo pré-treinado de reconhecimento de gestos para identificar o gesto realizado. O segundo, integra um modelo de deteção e classificação de objetos otimizado para deteção e rastreamento de mãos entre frames. Foram feitas análises experimentais entre ambos e selecionado o segundo protótipo para prosseguir a testes com utilizadores. A aplicação foi testada por 11 participantes, num estudo que comparou os seus tempos de utilização da aplicação por meio de interações gestuais com os tempos de utilização com o rato de computador. O sistema mereceu, por parte dos participantes, uma pontuação SUS “aceitável”. Conclui-se que o sistema alcançou as expectativas iniciais, ainda que possua limitações aparentes que poderão ser mitigadas em iterações futuras. |
id |
RCAP_8afcd70d1cfbe8149d66a59b807dcb3c |
---|---|
oai_identifier_str |
oai:digituma.uma.pt:10400.13/3845 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Interações gestuais para plataformas de streaming de vídeoInteração gestualDeteção de objetosSubtração do plano de fundoSegmentação do primeiro planoRastreamento gestualMediaPipeGestural interactionsObject detectionBackground subtractionForeground segmentationHand trackingEngenharia Informática.Faculdade de Ciências Exatas e da EngenhariaDomínio/Área Científica::Engenharia e TecnologiaA popularidade do rato de computador como modo preferencial de interação com aplicações de computador é inigualável. Mesmo no tempo dos smartphones e tablets, que trouxeram ao público em geral inovações como o modo de controlo através do toque, não existe uma grande variedade nos modos de interação com os diversos dispositivos que usamos no quotidiano. Este trabalho propõe uma nova abordagem para controlo, à distância, de aplicações de streaming de vídeo. A aplicação desenvolvida nesta dissertação procura um meio mais natural de interação com este tipo de plataformas usando interações gestuais, captadas pela câmara de profundidade RealSense D435. Câmaras de profundidade, ao contrário de câmaras de vídeo comuns, utilizam um fluxo de luz infravermelha para determinar a distância dos objetos relativamente à câmara. A câmara utilizada neste projeto possui capacidades de captura tanto neste modo, como no modo comum RGB. Foi criada de raiz uma interface gráfica inspirada pela plataforma Netflix, para permitir o controlo dos seus botões e os vídeos reproduzidos, programaticamente. Foram desenvolvidos dois protótipos com tecnologias distintas para interagir com a interface. O primeiro, utiliza métodos de tratamento de imagem para retirar a informação pretendida, e um modelo pré-treinado de reconhecimento de gestos para identificar o gesto realizado. O segundo, integra um modelo de deteção e classificação de objetos otimizado para deteção e rastreamento de mãos entre frames. Foram feitas análises experimentais entre ambos e selecionado o segundo protótipo para prosseguir a testes com utilizadores. A aplicação foi testada por 11 participantes, num estudo que comparou os seus tempos de utilização da aplicação por meio de interações gestuais com os tempos de utilização com o rato de computador. O sistema mereceu, por parte dos participantes, uma pontuação SUS “aceitável”. Conclui-se que o sistema alcançou as expectativas iniciais, ainda que possua limitações aparentes que poderão ser mitigadas em iterações futuras.The popularity of the computer mouse as the preferred interaction method with computer applications is unrivalled. Even in the age of smartphones and tablets, which have introduced touch screens to the masses, there seems to be a lack of variety regarding interaction methods with devices that we use every day. This work proposes a new approach to interacting with video streaming applications from afar. The program developed for this dissertation looks for a more natural way of controlling these services by using gestural interactions, which are captured by the depth camera RealSense D435. Depth cameras, unlike regular video cameras, use an infrared feed to determine the distance of objects in frame, relative to the camera. The camera used in this project offers both infrared and RGB capturing modes. A graphical interface, inspired by streaming platform Netflix, was created from scratch to allow control over its buttons and the video displayed programmatically. Two prototypes to interact with the GUI were developed using distinct technologies. The first one only uses image treatment methods to get the desired data and a pre-trained model for gesture recognitions to identify the gesture performed. The second one integrates an object detection and classification model optimized for hand detection and tracking between frames. Experimental analyses were run to compare both prototypes, resulting on the second being selected to proceed to the user tests stage. The application was tested by 11 participants, in a study that tracked their times using the application via gestural interactions as well as with a computer mouse. The system merited an “acceptable” usability score by the participant. We can conclude the system met the initial expectations despite its apparent limitations, which can be mitigated in future iterations.Campos, Pedro Filipe PereiraCabral, Diogo Nuno Crespo RibeiroDigitUMaTeixeira, Francisco João Mendonça2021-11-23T11:57:09Z2021-07-27T00:00:00Z2021-07-27T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.13/3845202792765porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-09-05T12:56:56Zoai:digituma.uma.pt:10400.13/3845Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T15:07:23.872859Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Interações gestuais para plataformas de streaming de vídeo |
title |
Interações gestuais para plataformas de streaming de vídeo |
spellingShingle |
Interações gestuais para plataformas de streaming de vídeo Teixeira, Francisco João Mendonça Interação gestual Deteção de objetos Subtração do plano de fundo Segmentação do primeiro plano Rastreamento gestual MediaPipe Gestural interactions Object detection Background subtraction Foreground segmentation Hand tracking Engenharia Informática . Faculdade de Ciências Exatas e da Engenharia Domínio/Área Científica::Engenharia e Tecnologia |
title_short |
Interações gestuais para plataformas de streaming de vídeo |
title_full |
Interações gestuais para plataformas de streaming de vídeo |
title_fullStr |
Interações gestuais para plataformas de streaming de vídeo |
title_full_unstemmed |
Interações gestuais para plataformas de streaming de vídeo |
title_sort |
Interações gestuais para plataformas de streaming de vídeo |
author |
Teixeira, Francisco João Mendonça |
author_facet |
Teixeira, Francisco João Mendonça |
author_role |
author |
dc.contributor.none.fl_str_mv |
Campos, Pedro Filipe Pereira Cabral, Diogo Nuno Crespo Ribeiro DigitUMa |
dc.contributor.author.fl_str_mv |
Teixeira, Francisco João Mendonça |
dc.subject.por.fl_str_mv |
Interação gestual Deteção de objetos Subtração do plano de fundo Segmentação do primeiro plano Rastreamento gestual MediaPipe Gestural interactions Object detection Background subtraction Foreground segmentation Hand tracking Engenharia Informática . Faculdade de Ciências Exatas e da Engenharia Domínio/Área Científica::Engenharia e Tecnologia |
topic |
Interação gestual Deteção de objetos Subtração do plano de fundo Segmentação do primeiro plano Rastreamento gestual MediaPipe Gestural interactions Object detection Background subtraction Foreground segmentation Hand tracking Engenharia Informática . Faculdade de Ciências Exatas e da Engenharia Domínio/Área Científica::Engenharia e Tecnologia |
description |
A popularidade do rato de computador como modo preferencial de interação com aplicações de computador é inigualável. Mesmo no tempo dos smartphones e tablets, que trouxeram ao público em geral inovações como o modo de controlo através do toque, não existe uma grande variedade nos modos de interação com os diversos dispositivos que usamos no quotidiano. Este trabalho propõe uma nova abordagem para controlo, à distância, de aplicações de streaming de vídeo. A aplicação desenvolvida nesta dissertação procura um meio mais natural de interação com este tipo de plataformas usando interações gestuais, captadas pela câmara de profundidade RealSense D435. Câmaras de profundidade, ao contrário de câmaras de vídeo comuns, utilizam um fluxo de luz infravermelha para determinar a distância dos objetos relativamente à câmara. A câmara utilizada neste projeto possui capacidades de captura tanto neste modo, como no modo comum RGB. Foi criada de raiz uma interface gráfica inspirada pela plataforma Netflix, para permitir o controlo dos seus botões e os vídeos reproduzidos, programaticamente. Foram desenvolvidos dois protótipos com tecnologias distintas para interagir com a interface. O primeiro, utiliza métodos de tratamento de imagem para retirar a informação pretendida, e um modelo pré-treinado de reconhecimento de gestos para identificar o gesto realizado. O segundo, integra um modelo de deteção e classificação de objetos otimizado para deteção e rastreamento de mãos entre frames. Foram feitas análises experimentais entre ambos e selecionado o segundo protótipo para prosseguir a testes com utilizadores. A aplicação foi testada por 11 participantes, num estudo que comparou os seus tempos de utilização da aplicação por meio de interações gestuais com os tempos de utilização com o rato de computador. O sistema mereceu, por parte dos participantes, uma pontuação SUS “aceitável”. Conclui-se que o sistema alcançou as expectativas iniciais, ainda que possua limitações aparentes que poderão ser mitigadas em iterações futuras. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-11-23T11:57:09Z 2021-07-27T00:00:00Z 2021-07-27T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.13/3845 202792765 |
url |
http://hdl.handle.net/10400.13/3845 |
identifier_str_mv |
202792765 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799129942914498560 |