Speech technologies and Russian pronunciation variation in the context of VoiceInteraction

Detalhes bibliográficos
Autor(a) principal: Havras, Anna
Data de Publicação: 2023
Outros Autores: Mendes, Carlos, Hristovsky, Gueorgui, Paulo, Sérgio, Moniz, Helena
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://doi.org/10.26334/2183-9077/rapln10ano2023a8
Resumo: This article aims to describe the work conducted at VoiceInteraction, a company specialized in speech processing solutions, with a particular focus on automatic transcription using a Hybrid Automatic Speech Recognizer (ASR). The primary objective revolved around studying the phonetic characteristics of the Russian language, encompassing four main tasks: describing the phonetic-phonological inventory, validating news transcriptions, validating a previously created lexicon, and integrating filled pauses into the ASR. This work contributed to the Artificial Intelligence and Advanced Data Analysis for Authority Agencies (AIDA) project, funded by the European Commission under the Horizon 2020 program, by transcribing the data in the Russian language.
id RCAP_07bbe948247d957f056b5d296e721621
oai_identifier_str oai:ojs3.ojs.apl.pt:article/176
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Speech technologies and Russian pronunciation variation in the context of VoiceInteractionTecnologias de fala e a variação de pronúncia do russo no contexto de VoiceInteractionreconhecimento automático de falafonéticapausas preenchidaslíngua russavariedadesautomatic speech recognitionphoneticsRussian languagefilled pausesvarietiesThis article aims to describe the work conducted at VoiceInteraction, a company specialized in speech processing solutions, with a particular focus on automatic transcription using a Hybrid Automatic Speech Recognizer (ASR). The primary objective revolved around studying the phonetic characteristics of the Russian language, encompassing four main tasks: describing the phonetic-phonological inventory, validating news transcriptions, validating a previously created lexicon, and integrating filled pauses into the ASR. This work contributed to the Artificial Intelligence and Advanced Data Analysis for Authority Agencies (AIDA) project, funded by the European Commission under the Horizon 2020 program, by transcribing the data in the Russian language.O presente artigo tem como objetivo descrever o trabalho realizado na VoiceInteraction, empresa especializada no desenvolvimento de soluções de processamento de fala, com especial destaque para a transcrição automática, que recorre a um Reconhecedor Automático de Fala (ASR) híbrido. O objetivo principal centrou-se no estudo das características fonéticas da língua russa, tendo em conta quatro tarefas principais: descrição do inventário fonético-fonológico; validação das transcrições de noticiários; validação de um léxico previamente criado; e integração de pausas preenchidas no ASR. O presente trabalho contribuiu para o projeto Artificial Intelligence and Advanced Data Analysis for Authority Agencies (AIDA), financiado pela Comissão Europeia no âmbito do programa Horizonte 2020, transcrevendo os dados em língua russa.Associação Portuguesa de Linguística2023-10-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.26334/2183-9077/rapln10ano2023a8https://doi.org/10.26334/2183-9077/rapln10ano2023a8Revista da Associação Portuguesa de Linguística; No. 10 (2023): Journal of the Portuguese Linguistics Association; 138–161Revista da Associação Portuguesa de Linguística; N.º 10 (2023): Revista da Associação Portuguesa de Linguística; 138–1612183-907710.26334/2183-9077/rapln10ano2023tdreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://ojs.apl.pt/index.php/rapl/article/view/176https://ojs.apl.pt/index.php/rapl/article/view/176/223Direitos de Autor (c) 2023 Anna Havras, Carlos Mendes, Gueorgui Hristovsky, Sérgio Paulo, Helena Monizinfo:eu-repo/semantics/openAccessHavras, AnnaMendes, CarlosHristovsky, GueorguiPaulo, SérgioMoniz, Helena2023-12-09T10:16:19Zoai:ojs3.ojs.apl.pt:article/176Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:26:03.996967Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Speech technologies and Russian pronunciation variation in the context of VoiceInteraction
Tecnologias de fala e a variação de pronúncia do russo no contexto de VoiceInteraction
title Speech technologies and Russian pronunciation variation in the context of VoiceInteraction
spellingShingle Speech technologies and Russian pronunciation variation in the context of VoiceInteraction
Havras, Anna
reconhecimento automático de fala
fonética
pausas preenchidas
língua russa
variedades
automatic speech recognition
phonetics
Russian language
filled pauses
varieties
title_short Speech technologies and Russian pronunciation variation in the context of VoiceInteraction
title_full Speech technologies and Russian pronunciation variation in the context of VoiceInteraction
title_fullStr Speech technologies and Russian pronunciation variation in the context of VoiceInteraction
title_full_unstemmed Speech technologies and Russian pronunciation variation in the context of VoiceInteraction
title_sort Speech technologies and Russian pronunciation variation in the context of VoiceInteraction
author Havras, Anna
author_facet Havras, Anna
Mendes, Carlos
Hristovsky, Gueorgui
Paulo, Sérgio
Moniz, Helena
author_role author
author2 Mendes, Carlos
Hristovsky, Gueorgui
Paulo, Sérgio
Moniz, Helena
author2_role author
author
author
author
dc.contributor.author.fl_str_mv Havras, Anna
Mendes, Carlos
Hristovsky, Gueorgui
Paulo, Sérgio
Moniz, Helena
dc.subject.por.fl_str_mv reconhecimento automático de fala
fonética
pausas preenchidas
língua russa
variedades
automatic speech recognition
phonetics
Russian language
filled pauses
varieties
topic reconhecimento automático de fala
fonética
pausas preenchidas
língua russa
variedades
automatic speech recognition
phonetics
Russian language
filled pauses
varieties
description This article aims to describe the work conducted at VoiceInteraction, a company specialized in speech processing solutions, with a particular focus on automatic transcription using a Hybrid Automatic Speech Recognizer (ASR). The primary objective revolved around studying the phonetic characteristics of the Russian language, encompassing four main tasks: describing the phonetic-phonological inventory, validating news transcriptions, validating a previously created lexicon, and integrating filled pauses into the ASR. This work contributed to the Artificial Intelligence and Advanced Data Analysis for Authority Agencies (AIDA) project, funded by the European Commission under the Horizon 2020 program, by transcribing the data in the Russian language.
publishDate 2023
dc.date.none.fl_str_mv 2023-10-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.26334/2183-9077/rapln10ano2023a8
https://doi.org/10.26334/2183-9077/rapln10ano2023a8
url https://doi.org/10.26334/2183-9077/rapln10ano2023a8
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://ojs.apl.pt/index.php/rapl/article/view/176
https://ojs.apl.pt/index.php/rapl/article/view/176/223
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Associação Portuguesa de Linguística
publisher.none.fl_str_mv Associação Portuguesa de Linguística
dc.source.none.fl_str_mv Revista da Associação Portuguesa de Linguística; No. 10 (2023): Journal of the Portuguese Linguistics Association; 138–161
Revista da Associação Portuguesa de Linguística; N.º 10 (2023): Revista da Associação Portuguesa de Linguística; 138–161
2183-9077
10.26334/2183-9077/rapln10ano2023td
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134142514855936