Deteção e correção de disfluências em crianças

Detalhes bibliográficos
Autor(a) principal: Teixeira, Ângela Daniela Carneiro
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10316/99679
Resumo: Dissertação de Mestrado em Engenharia Eletrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.
id RCAP_06fa9182f8375c551d9fd571ecdcc3af
oai_identifier_str oai:estudogeral.uc.pt:10316/99679
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Deteção e correção de disfluências em criançasFalareconhecimentocriançasmodelosverosimilhançaHMMSpeechrecognitionchildrenlikelihoodHMMDissertação de Mestrado em Engenharia Eletrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.A fala é o meio de comunicação por excelência, sendo o seu processo de aprendizagem um dos mais complexos que se conhece. No entanto, as crianças são extremamente eficientes neste processo. Ao longo do seu desenvolvimento, a criança desenvolve uma série de mecanismos mentais (ao nível da percepção e ao nível do controlo motor) que lhe permitem a aprendizagem e aperfeiçoamento da fala. No início do processo de aprendizagem, existem sempre alguns sons cuja replicação é mais difícil, sendo expectável que a criança apenas adquira o domínio de alguns fones mais complexos numa fase mais avançada do seu desenvolvimento. Com a evolução das tecnologias desenvolvidas na área do reconhecimento automático de fala houve um investimento da sua aplicação a áreas como as da aprendizagem da língua ou da terapia da fala. Um trabalho realizado anteriormente, que propunha o desenvolvimento de um sistema de auxílio à terapia da fala para detecção de disfluências em crianças em idade pré-escolar, serviu de ponto de partida para o presente estudo. Foi objectivo deste estudo implementar o módulo desse sistema correspondente à identificação e correcção de disfluências para sua posterior inserção no sistema completo. Em termos de processamento do sinal de fala, o sistema que se baseia nos Modelos de Markov Não Observáveis (HMM – Hidden Markov Models) é um dos mais utilizados, tendo sido a escolha para o desenvolvimento de modelos de reconhecimento de fala para crianças a aplicar neste estudo. No âmbito deste estudo procedeu-se ao tratamento da base de dados recolhida no estudo referido, para criar os modelos de reconhecimento de fala necessários para solucionar o problema principal proposto, o da identificação de dificuldades de pronunciação. Os modelos foram criados com recurso às ferramentas facultadas pelo HTK (Hidden Markov Model Toolkit), produzindo resultados de reconhecimento satisfatórios. Procedeu-se então ao desenvolvimento de um método que permitisse a detecção de disfluências em palavras proferidas por crianças, usando para isso os valores de verosimilhança calculados no processo de reconhecimento da locução a analisar.Speech is the prime mean of communication, with its learning process being one of the most complex and yet, one where humans excel at. Throughout its growth, the child develops a series of mental mechanisms (either at a perception level or at a motor control level) which allow the learning and improvement of speech. At the beginning of the learning process, there are always some sounds whose replication is more difficult, it is expected that the child will only acquire the domain of some of the more complex phones at a later stage of its development. As the technologies in the area of automatic speech recognition evolved, there was an increase in the tendency to apply it to areas such as language learning or speech therapy. A previous work, which proposed a Computer Aided Speech Therapy system directed toward the detection of disfluencies for children in pre-school age, served as the starting point for this study. The development of this system’s module that corresponded to the identification and correction of disfluencies, for subsequent insertion into the complete system, was the main goal of this thesis. In terms of speech signal processing, the system based on Hidden Markov Models (HMM - Hidden Markov Models) is one of the most widely used and was chosen in this study for the development of models of speech recognition for children. For the purpose of this study, the processing of the database collected in the above mentioned work was carried out. This necessary for creating the speech recognition models needed to implement this study’s main goal of identifying pronunciation problems. The models were created using the tools provided by HTK (Hidden Markov Model Toolkit), having produced satisfactory recognition results. A method that allowed the detection of disfluencies on words spoken by children was also developed, using for this the likelihood values calculated in the recognition of the utterance to be tested.2012-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/99679http://hdl.handle.net/10316/99679porTeixeira, Ângela Daniela Carneiroinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-05-25T09:48:52Zoai:estudogeral.uc.pt:10316/99679Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:17:14.199562Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Deteção e correção de disfluências em crianças
title Deteção e correção de disfluências em crianças
spellingShingle Deteção e correção de disfluências em crianças
Teixeira, Ângela Daniela Carneiro
Fala
reconhecimento
crianças
modelos
verosimilhança
HMM
Speech
recognition
children
likelihood
HMM
title_short Deteção e correção de disfluências em crianças
title_full Deteção e correção de disfluências em crianças
title_fullStr Deteção e correção de disfluências em crianças
title_full_unstemmed Deteção e correção de disfluências em crianças
title_sort Deteção e correção de disfluências em crianças
author Teixeira, Ângela Daniela Carneiro
author_facet Teixeira, Ângela Daniela Carneiro
author_role author
dc.contributor.author.fl_str_mv Teixeira, Ângela Daniela Carneiro
dc.subject.por.fl_str_mv Fala
reconhecimento
crianças
modelos
verosimilhança
HMM
Speech
recognition
children
likelihood
HMM
topic Fala
reconhecimento
crianças
modelos
verosimilhança
HMM
Speech
recognition
children
likelihood
HMM
description Dissertação de Mestrado em Engenharia Eletrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.
publishDate 2012
dc.date.none.fl_str_mv 2012-09
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10316/99679
http://hdl.handle.net/10316/99679
url http://hdl.handle.net/10316/99679
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134067565789184