Speech technologies and Russian pronunciation variation in the context of VoiceInteraction
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Outros Autores: | , , , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://doi.org/10.26334/2183-9077/rapln10ano2023a8 |
Resumo: | This article aims to describe the work conducted at VoiceInteraction, a company specialized in speech processing solutions, with a particular focus on automatic transcription using a Hybrid Automatic Speech Recognizer (ASR). The primary objective revolved around studying the phonetic characteristics of the Russian language, encompassing four main tasks: describing the phonetic-phonological inventory, validating news transcriptions, validating a previously created lexicon, and integrating filled pauses into the ASR. This work contributed to the Artificial Intelligence and Advanced Data Analysis for Authority Agencies (AIDA) project, funded by the European Commission under the Horizon 2020 program, by transcribing the data in the Russian language. |
id |
RCAP_07bbe948247d957f056b5d296e721621 |
---|---|
oai_identifier_str |
oai:ojs3.ojs.apl.pt:article/176 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Speech technologies and Russian pronunciation variation in the context of VoiceInteractionTecnologias de fala e a variação de pronúncia do russo no contexto de VoiceInteractionreconhecimento automático de falafonéticapausas preenchidaslíngua russavariedadesautomatic speech recognitionphoneticsRussian languagefilled pausesvarietiesThis article aims to describe the work conducted at VoiceInteraction, a company specialized in speech processing solutions, with a particular focus on automatic transcription using a Hybrid Automatic Speech Recognizer (ASR). The primary objective revolved around studying the phonetic characteristics of the Russian language, encompassing four main tasks: describing the phonetic-phonological inventory, validating news transcriptions, validating a previously created lexicon, and integrating filled pauses into the ASR. This work contributed to the Artificial Intelligence and Advanced Data Analysis for Authority Agencies (AIDA) project, funded by the European Commission under the Horizon 2020 program, by transcribing the data in the Russian language.O presente artigo tem como objetivo descrever o trabalho realizado na VoiceInteraction, empresa especializada no desenvolvimento de soluções de processamento de fala, com especial destaque para a transcrição automática, que recorre a um Reconhecedor Automático de Fala (ASR) híbrido. O objetivo principal centrou-se no estudo das características fonéticas da língua russa, tendo em conta quatro tarefas principais: descrição do inventário fonético-fonológico; validação das transcrições de noticiários; validação de um léxico previamente criado; e integração de pausas preenchidas no ASR. O presente trabalho contribuiu para o projeto Artificial Intelligence and Advanced Data Analysis for Authority Agencies (AIDA), financiado pela Comissão Europeia no âmbito do programa Horizonte 2020, transcrevendo os dados em língua russa.Associação Portuguesa de Linguística2023-10-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.26334/2183-9077/rapln10ano2023a8https://doi.org/10.26334/2183-9077/rapln10ano2023a8Revista da Associação Portuguesa de Linguística; No. 10 (2023): Journal of the Portuguese Linguistics Association; 138–161Revista da Associação Portuguesa de Linguística; N.º 10 (2023): Revista da Associação Portuguesa de Linguística; 138–1612183-907710.26334/2183-9077/rapln10ano2023tdreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://ojs.apl.pt/index.php/rapl/article/view/176https://ojs.apl.pt/index.php/rapl/article/view/176/223Direitos de Autor (c) 2023 Anna Havras, Carlos Mendes, Gueorgui Hristovsky, Sérgio Paulo, Helena Monizinfo:eu-repo/semantics/openAccessHavras, AnnaMendes, CarlosHristovsky, GueorguiPaulo, SérgioMoniz, Helena2023-12-09T10:16:19Zoai:ojs3.ojs.apl.pt:article/176Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:26:03.996967Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Speech technologies and Russian pronunciation variation in the context of VoiceInteraction Tecnologias de fala e a variação de pronúncia do russo no contexto de VoiceInteraction |
title |
Speech technologies and Russian pronunciation variation in the context of VoiceInteraction |
spellingShingle |
Speech technologies and Russian pronunciation variation in the context of VoiceInteraction Havras, Anna reconhecimento automático de fala fonética pausas preenchidas língua russa variedades automatic speech recognition phonetics Russian language filled pauses varieties |
title_short |
Speech technologies and Russian pronunciation variation in the context of VoiceInteraction |
title_full |
Speech technologies and Russian pronunciation variation in the context of VoiceInteraction |
title_fullStr |
Speech technologies and Russian pronunciation variation in the context of VoiceInteraction |
title_full_unstemmed |
Speech technologies and Russian pronunciation variation in the context of VoiceInteraction |
title_sort |
Speech technologies and Russian pronunciation variation in the context of VoiceInteraction |
author |
Havras, Anna |
author_facet |
Havras, Anna Mendes, Carlos Hristovsky, Gueorgui Paulo, Sérgio Moniz, Helena |
author_role |
author |
author2 |
Mendes, Carlos Hristovsky, Gueorgui Paulo, Sérgio Moniz, Helena |
author2_role |
author author author author |
dc.contributor.author.fl_str_mv |
Havras, Anna Mendes, Carlos Hristovsky, Gueorgui Paulo, Sérgio Moniz, Helena |
dc.subject.por.fl_str_mv |
reconhecimento automático de fala fonética pausas preenchidas língua russa variedades automatic speech recognition phonetics Russian language filled pauses varieties |
topic |
reconhecimento automático de fala fonética pausas preenchidas língua russa variedades automatic speech recognition phonetics Russian language filled pauses varieties |
description |
This article aims to describe the work conducted at VoiceInteraction, a company specialized in speech processing solutions, with a particular focus on automatic transcription using a Hybrid Automatic Speech Recognizer (ASR). The primary objective revolved around studying the phonetic characteristics of the Russian language, encompassing four main tasks: describing the phonetic-phonological inventory, validating news transcriptions, validating a previously created lexicon, and integrating filled pauses into the ASR. This work contributed to the Artificial Intelligence and Advanced Data Analysis for Authority Agencies (AIDA) project, funded by the European Commission under the Horizon 2020 program, by transcribing the data in the Russian language. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-10-22 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://doi.org/10.26334/2183-9077/rapln10ano2023a8 https://doi.org/10.26334/2183-9077/rapln10ano2023a8 |
url |
https://doi.org/10.26334/2183-9077/rapln10ano2023a8 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://ojs.apl.pt/index.php/rapl/article/view/176 https://ojs.apl.pt/index.php/rapl/article/view/176/223 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Associação Portuguesa de Linguística |
publisher.none.fl_str_mv |
Associação Portuguesa de Linguística |
dc.source.none.fl_str_mv |
Revista da Associação Portuguesa de Linguística; No. 10 (2023): Journal of the Portuguese Linguistics Association; 138–161 Revista da Associação Portuguesa de Linguística; N.º 10 (2023): Revista da Associação Portuguesa de Linguística; 138–161 2183-9077 10.26334/2183-9077/rapln10ano2023td reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134142514855936 |