Deteção e correção de disfluências em crianças
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/99679 |
Resumo: | Dissertação de Mestrado em Engenharia Eletrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra. |
id |
RCAP_06fa9182f8375c551d9fd571ecdcc3af |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/99679 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Deteção e correção de disfluências em criançasFalareconhecimentocriançasmodelosverosimilhançaHMMSpeechrecognitionchildrenlikelihoodHMMDissertação de Mestrado em Engenharia Eletrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.A fala é o meio de comunicação por excelência, sendo o seu processo de aprendizagem um dos mais complexos que se conhece. No entanto, as crianças são extremamente eficientes neste processo. Ao longo do seu desenvolvimento, a criança desenvolve uma série de mecanismos mentais (ao nível da percepção e ao nível do controlo motor) que lhe permitem a aprendizagem e aperfeiçoamento da fala. No início do processo de aprendizagem, existem sempre alguns sons cuja replicação é mais difícil, sendo expectável que a criança apenas adquira o domínio de alguns fones mais complexos numa fase mais avançada do seu desenvolvimento. Com a evolução das tecnologias desenvolvidas na área do reconhecimento automático de fala houve um investimento da sua aplicação a áreas como as da aprendizagem da língua ou da terapia da fala. Um trabalho realizado anteriormente, que propunha o desenvolvimento de um sistema de auxílio à terapia da fala para detecção de disfluências em crianças em idade pré-escolar, serviu de ponto de partida para o presente estudo. Foi objectivo deste estudo implementar o módulo desse sistema correspondente à identificação e correcção de disfluências para sua posterior inserção no sistema completo. Em termos de processamento do sinal de fala, o sistema que se baseia nos Modelos de Markov Não Observáveis (HMM – Hidden Markov Models) é um dos mais utilizados, tendo sido a escolha para o desenvolvimento de modelos de reconhecimento de fala para crianças a aplicar neste estudo. No âmbito deste estudo procedeu-se ao tratamento da base de dados recolhida no estudo referido, para criar os modelos de reconhecimento de fala necessários para solucionar o problema principal proposto, o da identificação de dificuldades de pronunciação. Os modelos foram criados com recurso às ferramentas facultadas pelo HTK (Hidden Markov Model Toolkit), produzindo resultados de reconhecimento satisfatórios. Procedeu-se então ao desenvolvimento de um método que permitisse a detecção de disfluências em palavras proferidas por crianças, usando para isso os valores de verosimilhança calculados no processo de reconhecimento da locução a analisar.Speech is the prime mean of communication, with its learning process being one of the most complex and yet, one where humans excel at. Throughout its growth, the child develops a series of mental mechanisms (either at a perception level or at a motor control level) which allow the learning and improvement of speech. At the beginning of the learning process, there are always some sounds whose replication is more difficult, it is expected that the child will only acquire the domain of some of the more complex phones at a later stage of its development. As the technologies in the area of automatic speech recognition evolved, there was an increase in the tendency to apply it to areas such as language learning or speech therapy. A previous work, which proposed a Computer Aided Speech Therapy system directed toward the detection of disfluencies for children in pre-school age, served as the starting point for this study. The development of this system’s module that corresponded to the identification and correction of disfluencies, for subsequent insertion into the complete system, was the main goal of this thesis. In terms of speech signal processing, the system based on Hidden Markov Models (HMM - Hidden Markov Models) is one of the most widely used and was chosen in this study for the development of models of speech recognition for children. For the purpose of this study, the processing of the database collected in the above mentioned work was carried out. This necessary for creating the speech recognition models needed to implement this study’s main goal of identifying pronunciation problems. The models were created using the tools provided by HTK (Hidden Markov Model Toolkit), having produced satisfactory recognition results. A method that allowed the detection of disfluencies on words spoken by children was also developed, using for this the likelihood values calculated in the recognition of the utterance to be tested.2012-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/99679http://hdl.handle.net/10316/99679porTeixeira, Ângela Daniela Carneiroinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-05-25T09:48:52Zoai:estudogeral.uc.pt:10316/99679Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:17:14.199562Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Deteção e correção de disfluências em crianças |
title |
Deteção e correção de disfluências em crianças |
spellingShingle |
Deteção e correção de disfluências em crianças Teixeira, Ângela Daniela Carneiro Fala reconhecimento crianças modelos verosimilhança HMM Speech recognition children likelihood HMM |
title_short |
Deteção e correção de disfluências em crianças |
title_full |
Deteção e correção de disfluências em crianças |
title_fullStr |
Deteção e correção de disfluências em crianças |
title_full_unstemmed |
Deteção e correção de disfluências em crianças |
title_sort |
Deteção e correção de disfluências em crianças |
author |
Teixeira, Ângela Daniela Carneiro |
author_facet |
Teixeira, Ângela Daniela Carneiro |
author_role |
author |
dc.contributor.author.fl_str_mv |
Teixeira, Ângela Daniela Carneiro |
dc.subject.por.fl_str_mv |
Fala reconhecimento crianças modelos verosimilhança HMM Speech recognition children likelihood HMM |
topic |
Fala reconhecimento crianças modelos verosimilhança HMM Speech recognition children likelihood HMM |
description |
Dissertação de Mestrado em Engenharia Eletrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra. |
publishDate |
2012 |
dc.date.none.fl_str_mv |
2012-09 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/99679 http://hdl.handle.net/10316/99679 |
url |
http://hdl.handle.net/10316/99679 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134067565789184 |