Integração de reconhecimento, síntese e gravação de voz no sistema de tratamento de atas

Detalhes bibliográficos
Autor(a) principal: Oliveira, Bruno Miguel Fernandes de
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.26/29856
Resumo: O estágio aludido no presente relatório realizou-se na AIRC (Associação de Informática da região Centro), e teve como principais objetivos, a investigação e integração de soluções para reconhecimento, síntese e gravação de voz numa das aplicações da empresa, o STA (Sistema de Tratamento de Atas). O objetivo inicial pretendido neste estágio passava por facilitar a transcrição de reuniões de órgãos deliberativos realizadas verbalmente para texto. Porém, devido a determinados fatores que inviabilizavam este contexto, mais concretamente a realidade dos sistemas sonoros das assembleias que não satisfazem os requisitos para a implementação deste tipo de sistemas e a natureza habitual de debate nestas reuniões, dificultando a deteção e transcrição das vozes de todos os intervenientes, a equipa conjuntamente com o Product Owner, decidiu alterar o âmbito inicial do estágio para objetivos mais viáveis, que igualmente acrescentariam valor ao sistema. Sendo estes, a integração de um sistema de interação com o STA através de comandos de voz, a síntese de textos apresentados pelo mesmo e a possibilidade de efetuar gravações sonoras das reuniões mencionadas inicialmente. Posto isto, durante o percurso do estagiário na empresa, o mesmo foi encarregue de conduzir uma investigação sobre os temas propostos e de escolher as ferramentas e tecnologias que melhor se adaptavam à realidade do sistema a integrar. Deste modo, foram realizadas várias provas de conceito, que permitiram estudar e testar diversas abordagens de integração destes tipos de tecnologia no sistema pretendido. Foi testado o reconhecimento de voz recorrendo à ferramenta Web Speech API, a síntese de voz recorrendo à framework Voice RSS e a gravação sonora utilizando a biblioteca JAVE numa aplicação Java que comunica com o STA via websockets. Como resultado, integrou-se no STA um sistema de interação com a aplicação através do reconhecimento de comandos por voz, um sistema de gravação sonora destinado à gravação das reuniões e deixou-se uma porta aberta à integração de um sistema de síntese de voz.
id RCAP_12408479fdd6b1b3ee5de3c5f7127acc
oai_identifier_str oai:comum.rcaap.pt:10400.26/29856
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Integração de reconhecimento, síntese e gravação de voz no sistema de tratamento de atasReconhecimento de vozSíntese de vozGravação sonoraWeb Speech APIO estágio aludido no presente relatório realizou-se na AIRC (Associação de Informática da região Centro), e teve como principais objetivos, a investigação e integração de soluções para reconhecimento, síntese e gravação de voz numa das aplicações da empresa, o STA (Sistema de Tratamento de Atas). O objetivo inicial pretendido neste estágio passava por facilitar a transcrição de reuniões de órgãos deliberativos realizadas verbalmente para texto. Porém, devido a determinados fatores que inviabilizavam este contexto, mais concretamente a realidade dos sistemas sonoros das assembleias que não satisfazem os requisitos para a implementação deste tipo de sistemas e a natureza habitual de debate nestas reuniões, dificultando a deteção e transcrição das vozes de todos os intervenientes, a equipa conjuntamente com o Product Owner, decidiu alterar o âmbito inicial do estágio para objetivos mais viáveis, que igualmente acrescentariam valor ao sistema. Sendo estes, a integração de um sistema de interação com o STA através de comandos de voz, a síntese de textos apresentados pelo mesmo e a possibilidade de efetuar gravações sonoras das reuniões mencionadas inicialmente. Posto isto, durante o percurso do estagiário na empresa, o mesmo foi encarregue de conduzir uma investigação sobre os temas propostos e de escolher as ferramentas e tecnologias que melhor se adaptavam à realidade do sistema a integrar. Deste modo, foram realizadas várias provas de conceito, que permitiram estudar e testar diversas abordagens de integração destes tipos de tecnologia no sistema pretendido. Foi testado o reconhecimento de voz recorrendo à ferramenta Web Speech API, a síntese de voz recorrendo à framework Voice RSS e a gravação sonora utilizando a biblioteca JAVE numa aplicação Java que comunica com o STA via websockets. Como resultado, integrou-se no STA um sistema de interação com a aplicação através do reconhecimento de comandos por voz, um sistema de gravação sonora destinado à gravação das reuniões e deixou-se uma porta aberta à integração de um sistema de síntese de voz.Rocha, Teresa Raquel Corga TeixeiraRepositório ComumOliveira, Bruno Miguel Fernandes de2019-09-30T15:25:05Z2018-062019-02-01T00:00:00Z2019-02-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.26/29856202971686porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-09-05T15:40:45Zoai:comum.rcaap.pt:10400.26/29856Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T15:16:34.608901Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Integração de reconhecimento, síntese e gravação de voz no sistema de tratamento de atas
title Integração de reconhecimento, síntese e gravação de voz no sistema de tratamento de atas
spellingShingle Integração de reconhecimento, síntese e gravação de voz no sistema de tratamento de atas
Oliveira, Bruno Miguel Fernandes de
Reconhecimento de voz
Síntese de voz
Gravação sonora
Web Speech API
title_short Integração de reconhecimento, síntese e gravação de voz no sistema de tratamento de atas
title_full Integração de reconhecimento, síntese e gravação de voz no sistema de tratamento de atas
title_fullStr Integração de reconhecimento, síntese e gravação de voz no sistema de tratamento de atas
title_full_unstemmed Integração de reconhecimento, síntese e gravação de voz no sistema de tratamento de atas
title_sort Integração de reconhecimento, síntese e gravação de voz no sistema de tratamento de atas
author Oliveira, Bruno Miguel Fernandes de
author_facet Oliveira, Bruno Miguel Fernandes de
author_role author
dc.contributor.none.fl_str_mv Rocha, Teresa Raquel Corga Teixeira
Repositório Comum
dc.contributor.author.fl_str_mv Oliveira, Bruno Miguel Fernandes de
dc.subject.por.fl_str_mv Reconhecimento de voz
Síntese de voz
Gravação sonora
Web Speech API
topic Reconhecimento de voz
Síntese de voz
Gravação sonora
Web Speech API
description O estágio aludido no presente relatório realizou-se na AIRC (Associação de Informática da região Centro), e teve como principais objetivos, a investigação e integração de soluções para reconhecimento, síntese e gravação de voz numa das aplicações da empresa, o STA (Sistema de Tratamento de Atas). O objetivo inicial pretendido neste estágio passava por facilitar a transcrição de reuniões de órgãos deliberativos realizadas verbalmente para texto. Porém, devido a determinados fatores que inviabilizavam este contexto, mais concretamente a realidade dos sistemas sonoros das assembleias que não satisfazem os requisitos para a implementação deste tipo de sistemas e a natureza habitual de debate nestas reuniões, dificultando a deteção e transcrição das vozes de todos os intervenientes, a equipa conjuntamente com o Product Owner, decidiu alterar o âmbito inicial do estágio para objetivos mais viáveis, que igualmente acrescentariam valor ao sistema. Sendo estes, a integração de um sistema de interação com o STA através de comandos de voz, a síntese de textos apresentados pelo mesmo e a possibilidade de efetuar gravações sonoras das reuniões mencionadas inicialmente. Posto isto, durante o percurso do estagiário na empresa, o mesmo foi encarregue de conduzir uma investigação sobre os temas propostos e de escolher as ferramentas e tecnologias que melhor se adaptavam à realidade do sistema a integrar. Deste modo, foram realizadas várias provas de conceito, que permitiram estudar e testar diversas abordagens de integração destes tipos de tecnologia no sistema pretendido. Foi testado o reconhecimento de voz recorrendo à ferramenta Web Speech API, a síntese de voz recorrendo à framework Voice RSS e a gravação sonora utilizando a biblioteca JAVE numa aplicação Java que comunica com o STA via websockets. Como resultado, integrou-se no STA um sistema de interação com a aplicação através do reconhecimento de comandos por voz, um sistema de gravação sonora destinado à gravação das reuniões e deixou-se uma porta aberta à integração de um sistema de síntese de voz.
publishDate 2018
dc.date.none.fl_str_mv 2018-06
2019-09-30T15:25:05Z
2019-02-01T00:00:00Z
2019-02-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.26/29856
202971686
url http://hdl.handle.net/10400.26/29856
identifier_str_mv 202971686
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799130029244809216