Audio-guiding imersivo
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10773/24947 |
Resumo: | Desenvolveu-se um protótipo de um sistema de audio-guiding que permite associar fontes sonoras virtuais aos pontos focais de cada rota de visita e aplicar, na reprodução estereofónica através de auscultadores, um efeito de espacialização controlado em tempo real pela pose (posição e orientação da cabeça) do utilizador relativamente a esses pontos. É assim criado um efeito de realidade aumentada, com os conteúdos áudio (virtuais) a parecerem provir de pontos (reais) especificados. Foi desenvolvido um programa de gestão de rotas para especificar previamente os pontos focais (através de coordenadas GPS), o conteúdo áudio (ficheiro monofónico) pretendido para cada e o ponto do trajeto em que deve ser iniciada a reprodução. Para detetar posição, usou-se um recetor GPS ligado à plataforma de computação transportada pelo utilizador; para monitorizar continuamente os movimentos da sua cabeça (head-tracking), recorreu-se a um sensor inercial (InertiaCube) acoplado aos auscultadores. A aplicação principal, desenvolvida em linguagem C++, recorre a buffers circulares implementados em software para realizar, com a mínima latência possível, o streaming áudio a partir dos ficheiros de entrada. O processamento baseia-se numa biblioteca (‘motor’) de auralização em tempo real que utiliza bases de dados de HRTF de acesso público. Para escolher o par de HRTF a utilizar em cada ciclo de processamento, o azimute e a elevação da fonte virtual são continuamente recalculados em função dos dados recolhidos sobre a pose do utilizador. Para avaliar o funcionamento da aplicação, identificar possíveis problemas e caracterizar as gamas mais adequadas para determinados parâmetros (e.g. tamanho de buffers, número de amostras por bloco de áudio, janela de filtragem dos dados GPS), efetuaram-se testes subjetivos preliminares, com dez sujeitos a percorrer uma rota criada para o efeito. Embora confirmando a capacidade de obter o efeito sonoro pretendido, os testes evidenciaram a necessidade de melhorar a precisão dos dados de posição, principal fator a afetar negativamente a qualidade da experiência. |
id |
RCAP_8e74a29d26b9b697e27469779451a929 |
---|---|
oai_identifier_str |
oai:ria.ua.pt:10773/24947 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Audio-guiding imersivoAudio-guideAuralizaçãoStreamingProcessamentoRecetor GPSHead-trackerBufferTempo realHRIRHRTFMonofónicoBinauralSomFonte sonora virtualImersivoRealidade aumentadaRotaDesenvolveu-se um protótipo de um sistema de audio-guiding que permite associar fontes sonoras virtuais aos pontos focais de cada rota de visita e aplicar, na reprodução estereofónica através de auscultadores, um efeito de espacialização controlado em tempo real pela pose (posição e orientação da cabeça) do utilizador relativamente a esses pontos. É assim criado um efeito de realidade aumentada, com os conteúdos áudio (virtuais) a parecerem provir de pontos (reais) especificados. Foi desenvolvido um programa de gestão de rotas para especificar previamente os pontos focais (através de coordenadas GPS), o conteúdo áudio (ficheiro monofónico) pretendido para cada e o ponto do trajeto em que deve ser iniciada a reprodução. Para detetar posição, usou-se um recetor GPS ligado à plataforma de computação transportada pelo utilizador; para monitorizar continuamente os movimentos da sua cabeça (head-tracking), recorreu-se a um sensor inercial (InertiaCube) acoplado aos auscultadores. A aplicação principal, desenvolvida em linguagem C++, recorre a buffers circulares implementados em software para realizar, com a mínima latência possível, o streaming áudio a partir dos ficheiros de entrada. O processamento baseia-se numa biblioteca (‘motor’) de auralização em tempo real que utiliza bases de dados de HRTF de acesso público. Para escolher o par de HRTF a utilizar em cada ciclo de processamento, o azimute e a elevação da fonte virtual são continuamente recalculados em função dos dados recolhidos sobre a pose do utilizador. Para avaliar o funcionamento da aplicação, identificar possíveis problemas e caracterizar as gamas mais adequadas para determinados parâmetros (e.g. tamanho de buffers, número de amostras por bloco de áudio, janela de filtragem dos dados GPS), efetuaram-se testes subjetivos preliminares, com dez sujeitos a percorrer uma rota criada para o efeito. Embora confirmando a capacidade de obter o efeito sonoro pretendido, os testes evidenciaram a necessidade de melhorar a precisão dos dados de posição, principal fator a afetar negativamente a qualidade da experiência.An audio-guiding system prototype was developed which makes it possible to associate virtual sound sources to the focal points of each tourist route and apply, in the stereophonic reproduction over headphones, a spatialisation effect controlled in real time by user pose (position and head orientation) relative to those points. An augmented reality effect is thus achieved, with the (virtual) audio content seemingly originating from specified (real) points. A route management program was developed to allow specification of the focal points (through GPS coordinates), audio content (monophonic file) intended for each and route point where its playback should be triggered. Position was detected by a GPS receptor plugged into the computing platform carried by the user; head-tracking was based on an inertial sensor (InertiaCube) attached to the headphone strap. The main application, developed in C++, implemented software buffers to stream audio through from the input files with the lowest possible latency. The processing resorts to a real-time auralisation engine using a public access HRTF database. In order to choose the appropriate HRTF pair for each processing cycle, the azimuth and elevation of the virtual source are continuously recalculated according to the acquired user pose data. In order to assess performance, identify possible problems and characterise the most appropriate application parameter ranges (e.g. buffer size, number of samples per audio block, filtering window for GPS data), preliminary subjective tests were carried out, with ten subjects following a route created for this purpose. Whilst confirming the ability to provide the desired audio spatialisation effects, the tests also evidenced the need to improve the precision of position data, as this was the main factor negatively affecting the experience.2018-12-20T14:11:56Z2018-07-31T00:00:00Z2018-07-31info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/24947TID:202242340porNuno Miguel Airesinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T11:48:48Zoai:ria.ua.pt:10773/24947Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:58:28.019548Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Audio-guiding imersivo |
title |
Audio-guiding imersivo |
spellingShingle |
Audio-guiding imersivo Nuno Miguel Aires Audio-guide Auralização Streaming Processamento Recetor GPS Head-tracker Buffer Tempo real HRIR HRTF Monofónico Binaural Som Fonte sonora virtual Imersivo Realidade aumentada Rota |
title_short |
Audio-guiding imersivo |
title_full |
Audio-guiding imersivo |
title_fullStr |
Audio-guiding imersivo |
title_full_unstemmed |
Audio-guiding imersivo |
title_sort |
Audio-guiding imersivo |
author |
Nuno Miguel Aires |
author_facet |
Nuno Miguel Aires |
author_role |
author |
dc.contributor.author.fl_str_mv |
Nuno Miguel Aires |
dc.subject.por.fl_str_mv |
Audio-guide Auralização Streaming Processamento Recetor GPS Head-tracker Buffer Tempo real HRIR HRTF Monofónico Binaural Som Fonte sonora virtual Imersivo Realidade aumentada Rota |
topic |
Audio-guide Auralização Streaming Processamento Recetor GPS Head-tracker Buffer Tempo real HRIR HRTF Monofónico Binaural Som Fonte sonora virtual Imersivo Realidade aumentada Rota |
description |
Desenvolveu-se um protótipo de um sistema de audio-guiding que permite associar fontes sonoras virtuais aos pontos focais de cada rota de visita e aplicar, na reprodução estereofónica através de auscultadores, um efeito de espacialização controlado em tempo real pela pose (posição e orientação da cabeça) do utilizador relativamente a esses pontos. É assim criado um efeito de realidade aumentada, com os conteúdos áudio (virtuais) a parecerem provir de pontos (reais) especificados. Foi desenvolvido um programa de gestão de rotas para especificar previamente os pontos focais (através de coordenadas GPS), o conteúdo áudio (ficheiro monofónico) pretendido para cada e o ponto do trajeto em que deve ser iniciada a reprodução. Para detetar posição, usou-se um recetor GPS ligado à plataforma de computação transportada pelo utilizador; para monitorizar continuamente os movimentos da sua cabeça (head-tracking), recorreu-se a um sensor inercial (InertiaCube) acoplado aos auscultadores. A aplicação principal, desenvolvida em linguagem C++, recorre a buffers circulares implementados em software para realizar, com a mínima latência possível, o streaming áudio a partir dos ficheiros de entrada. O processamento baseia-se numa biblioteca (‘motor’) de auralização em tempo real que utiliza bases de dados de HRTF de acesso público. Para escolher o par de HRTF a utilizar em cada ciclo de processamento, o azimute e a elevação da fonte virtual são continuamente recalculados em função dos dados recolhidos sobre a pose do utilizador. Para avaliar o funcionamento da aplicação, identificar possíveis problemas e caracterizar as gamas mais adequadas para determinados parâmetros (e.g. tamanho de buffers, número de amostras por bloco de áudio, janela de filtragem dos dados GPS), efetuaram-se testes subjetivos preliminares, com dez sujeitos a percorrer uma rota criada para o efeito. Embora confirmando a capacidade de obter o efeito sonoro pretendido, os testes evidenciaram a necessidade de melhorar a precisão dos dados de posição, principal fator a afetar negativamente a qualidade da experiência. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-12-20T14:11:56Z 2018-07-31T00:00:00Z 2018-07-31 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10773/24947 TID:202242340 |
url |
http://hdl.handle.net/10773/24947 |
identifier_str_mv |
TID:202242340 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799137639012499456 |