Detecção e posicionamento de objetos em tempo real para auxiliar a mobilidade de usuários com deficiência visual

Detalhes bibliográficos
Autor(a) principal: Conceglieri, Heitor Delesporte
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
Texto Completo: http://repositorio.ufes.br/handle/10/12553
Resumo: The number of visually impaired individuals in today’s society has been increasing, and vision is of paramount importance for an individual’s perception, orientation, and location in their environment. Assistive devices such as traditional canes and smart canes, which use ultrasonic and infrared sensors, and guide dogs are implemented to provide support to users. However, these devices lack the means to acquire essential information to assist in situations commonly reported by users, such as the detection and positioning of elevated obstacles. This study aims to present and validate a strategy for object detection and localization through images captured by an RGB-D camera. Additionally, challenges and potentials in the synergistic implementation of this strategy with devices already employed for mobility assistance are discussed. The use of RGB-D cameras provides relevant information through their depth and RGB sensors to complement the use of traditional devices and assist with users’ mobility and navigation. As variable system parameters (e.g., azimuth and polar angles, and depth parameter) can considerably affect the system’s operation, two sets of experiments are conducted to validate the strategy and understand the impact of detection quality and system operation during navigation. For the experiments, the strategy is employed, and a new database with a newly trained class, ”Balloons,”is generated. Training the new class enabled the system to detect 100% of the trained class images with a minimum confidence threshold of 0.887, indicating a good detection capability. The strategy successfully detected static and dynamic objects, including elevated ones and those in the same camera axis. Results from the same experiments conducted while implementing the strategy show azimuth angle deviations with a maximum variation of 2% and depth parameter deviations ranging from 0.05% to 0.3%. These results demonstrate the feasibility of the proposed detection strategy for both static and dynamic scenarios, providing alternatives for new studies related to object detection for the assistance of visually impaired individuals. The generation of new datasets for system implementation in different scenarios, such as urban environments, integration into various mobile computing platforms for convenience and mobility, and the implementation of other user feedback methods are some of the contributions of this research.
id UFES_5e6c3c68a52a4d65cfcafd355dba831c
oai_identifier_str oai:repositorio.ufes.br:10/12553
network_acronym_str UFES
network_name_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
repository_id_str 2108
spelling Frizera Neto, Anselmohttps://orcid.org/0000000206873967http://lattes.cnpq.br/8928890008799265Conceglieri, Heitor Delesportehttps://orcid.org/0009-0000-0522-0385http://lattes.cnpq.br/0307372749533485Diaz, Camilo Arturo Rodriguezhttps://orcid.org/0000000196575076http://lattes.cnpq.br/2410092083336272Mello, Ricardo Carminati dehttps://orcid.org/0000000304204273http://lattes.cnpq.br/15696385715826912024-05-29T20:55:26Z2024-05-29T20:55:26Z2023-07-25The number of visually impaired individuals in today’s society has been increasing, and vision is of paramount importance for an individual’s perception, orientation, and location in their environment. Assistive devices such as traditional canes and smart canes, which use ultrasonic and infrared sensors, and guide dogs are implemented to provide support to users. However, these devices lack the means to acquire essential information to assist in situations commonly reported by users, such as the detection and positioning of elevated obstacles. This study aims to present and validate a strategy for object detection and localization through images captured by an RGB-D camera. Additionally, challenges and potentials in the synergistic implementation of this strategy with devices already employed for mobility assistance are discussed. The use of RGB-D cameras provides relevant information through their depth and RGB sensors to complement the use of traditional devices and assist with users’ mobility and navigation. As variable system parameters (e.g., azimuth and polar angles, and depth parameter) can considerably affect the system’s operation, two sets of experiments are conducted to validate the strategy and understand the impact of detection quality and system operation during navigation. For the experiments, the strategy is employed, and a new database with a newly trained class, ”Balloons,”is generated. Training the new class enabled the system to detect 100% of the trained class images with a minimum confidence threshold of 0.887, indicating a good detection capability. The strategy successfully detected static and dynamic objects, including elevated ones and those in the same camera axis. Results from the same experiments conducted while implementing the strategy show azimuth angle deviations with a maximum variation of 2% and depth parameter deviations ranging from 0.05% to 0.3%. These results demonstrate the feasibility of the proposed detection strategy for both static and dynamic scenarios, providing alternatives for new studies related to object detection for the assistance of visually impaired individuals. The generation of new datasets for system implementation in different scenarios, such as urban environments, integration into various mobile computing platforms for convenience and mobility, and the implementation of other user feedback methods are some of the contributions of this research.O número de pessoas com deficiência visual na sociedade atual tem aumentado e a visão é de suma importância para a percepção, orientação e localização do indivíduo no ambiente. Dispositivos de assistência, como as tradicionais bengalas e as bengalas inteligentes, as quais utilizam sensores ultrassônicos e infravermelho, e os cães guia, são implementados para fornecer suporte aos usuários. No entanto, estes dispositivos carecem de meios para a aquisição de informações importantes para auxiliar em situações comumente relatadas pelos usuários, como a detecção e posicionamento de obstáculos elevados. O presente estudo visa apresentar e validar uma estratégia de detecção e localização de objetos por meio de imagens captadas por uma câmera RGB-D. Além disso, também são discutidos desafios e potencialidades na implementação sinérgica de tal estratégia aos dispositivos já empregados para auxílio à locomoção. O uso de câmeras RGB-D fornece, então, informações pertinentes através de seus sensores de profundidade e RGB para complementar o uso dos dispositivos tradicionais e auxiliar a locomoção e navegação dos usuários. Como parâmetros variáveis do sistema (e.g., os ângulos azimute e polar, e o parâmetro da profundidade) podem afetar de maneira considerável o funcionamento do sistema, são realizados dois grupos de experimentos para validar a estratégia e entender os impactos da qualidade de detecção e funcionamento do sistema durante a navegação. Para o conjunto de experimentos, é empregada a estratégia e gerado um novo banco de dados com uma nova classe treinada, Balloons. O treinamento da nova classe permitiu que o sistema detectasse 100% das imagens da classe treinada com limiar de confiança mínimo de 0,887, indicando boa capacidade de detecção. A estratégia conseguiu detectar objetos estáticos e dinâmicos, além de elevados e no mesmo eixo da câmera. Resultados dos mesmos experimentos realizados, implementando a estratégia, mostram desvios do ângulo azimute apresentando variação máxima de 2% e entre 0,05% a 0,3% para o parâmetro de profundidade. Esses resultados demonstram a viabilidade da estratégia de detecção proposta tanto para cenários estáticos quanto dinâmicos, oferecendo alternativas para novos estudos em relação à detecção de objetos para auxílio à locomoção de deficientes visuais. A geração de novos conjuntos de dados para a implementação do sistema em novos cenários, como o urbano, a integração em diferentes plataformas computacionais móveis visando praticidade e mobilidade, e a implementação de outros métodos de realimentação ao usuário são algumas das contribuições desta pesquisa.Fundação de Amparo à Pesquisa do Espírito Santo (FAPES)Texthttp://repositorio.ufes.br/handle/10/12553porUniversidade Federal do Espírito SantoMestrado em Engenharia ElétricaPrograma de Pós-Graduação em Engenharia ElétricaUFESBRCentro TecnológicoEngenharia ElétricaVisão ComputacionalDetecção em tempo realDeficientes visuaisCâmera RGB-DTecnologia assistivaDetecção e posicionamento de objetos em tempo real para auxiliar a mobilidade de usuários com deficiência visualinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFESORIGINALHeitorDelesporteConceglieri-2023-Trabalho.pdfapplication/pdf16251581http://repositorio.ufes.br/bitstreams/082c279e-1831-4fe8-9c38-19850ba072bd/download6e3b3ef5df749b5996064a022febbe5dMD5110/125532024-08-20 08:14:42.276oai:repositorio.ufes.br:10/12553http://repositorio.ufes.brRepositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestopendoar:21082024-10-15T18:02:32.732331Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false
dc.title.none.fl_str_mv Detecção e posicionamento de objetos em tempo real para auxiliar a mobilidade de usuários com deficiência visual
title Detecção e posicionamento de objetos em tempo real para auxiliar a mobilidade de usuários com deficiência visual
spellingShingle Detecção e posicionamento de objetos em tempo real para auxiliar a mobilidade de usuários com deficiência visual
Conceglieri, Heitor Delesporte
Engenharia Elétrica
Visão Computacional
Detecção em tempo real
Deficientes visuais
Câmera RGB-D
Tecnologia assistiva
title_short Detecção e posicionamento de objetos em tempo real para auxiliar a mobilidade de usuários com deficiência visual
title_full Detecção e posicionamento de objetos em tempo real para auxiliar a mobilidade de usuários com deficiência visual
title_fullStr Detecção e posicionamento de objetos em tempo real para auxiliar a mobilidade de usuários com deficiência visual
title_full_unstemmed Detecção e posicionamento de objetos em tempo real para auxiliar a mobilidade de usuários com deficiência visual
title_sort Detecção e posicionamento de objetos em tempo real para auxiliar a mobilidade de usuários com deficiência visual
author Conceglieri, Heitor Delesporte
author_facet Conceglieri, Heitor Delesporte
author_role author
dc.contributor.authorID.none.fl_str_mv https://orcid.org/0009-0000-0522-0385
dc.contributor.authorLattes.none.fl_str_mv http://lattes.cnpq.br/0307372749533485
dc.contributor.advisor1.fl_str_mv Frizera Neto, Anselmo
dc.contributor.advisor1ID.fl_str_mv https://orcid.org/0000000206873967
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8928890008799265
dc.contributor.author.fl_str_mv Conceglieri, Heitor Delesporte
dc.contributor.referee1.fl_str_mv Diaz, Camilo Arturo Rodriguez
dc.contributor.referee1ID.fl_str_mv https://orcid.org/0000000196575076
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/2410092083336272
dc.contributor.referee2.fl_str_mv Mello, Ricardo Carminati de
dc.contributor.referee2ID.fl_str_mv https://orcid.org/0000000304204273
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/1569638571582691
contributor_str_mv Frizera Neto, Anselmo
Diaz, Camilo Arturo Rodriguez
Mello, Ricardo Carminati de
dc.subject.cnpq.fl_str_mv Engenharia Elétrica
topic Engenharia Elétrica
Visão Computacional
Detecção em tempo real
Deficientes visuais
Câmera RGB-D
Tecnologia assistiva
dc.subject.por.fl_str_mv Visão Computacional
Detecção em tempo real
Deficientes visuais
Câmera RGB-D
Tecnologia assistiva
description The number of visually impaired individuals in today’s society has been increasing, and vision is of paramount importance for an individual’s perception, orientation, and location in their environment. Assistive devices such as traditional canes and smart canes, which use ultrasonic and infrared sensors, and guide dogs are implemented to provide support to users. However, these devices lack the means to acquire essential information to assist in situations commonly reported by users, such as the detection and positioning of elevated obstacles. This study aims to present and validate a strategy for object detection and localization through images captured by an RGB-D camera. Additionally, challenges and potentials in the synergistic implementation of this strategy with devices already employed for mobility assistance are discussed. The use of RGB-D cameras provides relevant information through their depth and RGB sensors to complement the use of traditional devices and assist with users’ mobility and navigation. As variable system parameters (e.g., azimuth and polar angles, and depth parameter) can considerably affect the system’s operation, two sets of experiments are conducted to validate the strategy and understand the impact of detection quality and system operation during navigation. For the experiments, the strategy is employed, and a new database with a newly trained class, ”Balloons,”is generated. Training the new class enabled the system to detect 100% of the trained class images with a minimum confidence threshold of 0.887, indicating a good detection capability. The strategy successfully detected static and dynamic objects, including elevated ones and those in the same camera axis. Results from the same experiments conducted while implementing the strategy show azimuth angle deviations with a maximum variation of 2% and depth parameter deviations ranging from 0.05% to 0.3%. These results demonstrate the feasibility of the proposed detection strategy for both static and dynamic scenarios, providing alternatives for new studies related to object detection for the assistance of visually impaired individuals. The generation of new datasets for system implementation in different scenarios, such as urban environments, integration into various mobile computing platforms for convenience and mobility, and the implementation of other user feedback methods are some of the contributions of this research.
publishDate 2023
dc.date.issued.fl_str_mv 2023-07-25
dc.date.accessioned.fl_str_mv 2024-05-29T20:55:26Z
dc.date.available.fl_str_mv 2024-05-29T20:55:26Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.ufes.br/handle/10/12553
url http://repositorio.ufes.br/handle/10/12553
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv Text
dc.publisher.none.fl_str_mv Universidade Federal do Espírito Santo
Mestrado em Engenharia Elétrica
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia Elétrica
dc.publisher.initials.fl_str_mv UFES
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Centro Tecnológico
publisher.none.fl_str_mv Universidade Federal do Espírito Santo
Mestrado em Engenharia Elétrica
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
instname:Universidade Federal do Espírito Santo (UFES)
instacron:UFES
instname_str Universidade Federal do Espírito Santo (UFES)
instacron_str UFES
institution UFES
reponame_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
collection Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
bitstream.url.fl_str_mv http://repositorio.ufes.br/bitstreams/082c279e-1831-4fe8-9c38-19850ba072bd/download
bitstream.checksum.fl_str_mv 6e3b3ef5df749b5996064a022febbe5d
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)
repository.mail.fl_str_mv
_version_ 1813022578889981952