Detecção automática de fronteiras prosódicas na fala espontânea

Detalhes bibliográficos
Autor(a) principal: Bárbara Helohá Falcão Teixeira
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/47273
https://orcid.org/0000-0002-4484-3590
Resumo: A fala é segmentada em unidades entonacionais delimitadas por fronteiras prosódicas. Essa segmentação tem consequências importantes para a sintaxe, estrutura informacional e cognição. Este trabalho tem como objetivo investigar os parâmetros fonético-acústicos envolvidos na percepção das fronteiras prosódicas, e desenvolver modelos destinados à detecção automática das fronteiras prosódicas em fala espontânea monológica masculina de português brasileiro. Duas amostras foram segmentadas em unidades entonacionais por dois grupos de segmentadores treinados. As fronteiras percebidas pelos segmentadores foram marcadas como terminais ou não-terminais. Um script foi usado para extrair parâmetros fonético-acústicos ao longo do sinal de fala em uma janela à direita e à esquerda ao redor de cada fronteira de palavra fonológica. Os parâmetros extraídos compreendem medidas de (1) Taxa de articulação e elocução; (2) Duração normalizada do segmento; (3) Frequência fundamental; (4) Intensidade; (5) Pausa física. O script considera como fronteira prosódica as posições em que pelo menos 50% dos segmentadores indicaram uma fronteira do mesmo tipo. Os modelos de identificação das fronteiras prosódicas foram desenvolvidos a partir de um algoritmo de Análise Discriminante Linear e foram usadas diferentes estratégias de treinamento heurístico. Os modelos apresentaram problemas semelhantes em razão da importância dos parâmetros relacionados às pausas físicas. Foi realizado um teste de percepção de pausa por um grupo de anotadores. A duração de pausa física que pode ser percebida como pausa, evitando confusão com a fase oclusiva dos segmentos, foi analisada. Neste trabalho, a duração proposta é 100 ms. Adicionalmente, submodelos para identificar fronteiras com e sem pausa percebida foram desenvolvidos. O submodelo de identificação de fronteiras com pausa percebida apresentou resultados superiores aos resultados do submodelo de identificação de fronteiras sem pausa percebida.
id UFMG_f3308a8b1b2165a57af1337c098d27a8
oai_identifier_str oai:repositorio.ufmg.br:1843/47273
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Tommaso Rasohttp://lattes.cnpq.br/1732201620407302Plínio Almeida BarbosaHeliana Ribeiro de MelloSandra MadureiraJoão Antônio de MoraesBruno Neves Rati de Melo Rochahttp://lattes.cnpq.br/0018451599638522Bárbara Helohá Falcão Teixeira2022-11-16T20:42:48Z2022-11-16T20:42:48Z2022-06-28http://hdl.handle.net/1843/47273https://orcid.org/0000-0002-4484-3590A fala é segmentada em unidades entonacionais delimitadas por fronteiras prosódicas. Essa segmentação tem consequências importantes para a sintaxe, estrutura informacional e cognição. Este trabalho tem como objetivo investigar os parâmetros fonético-acústicos envolvidos na percepção das fronteiras prosódicas, e desenvolver modelos destinados à detecção automática das fronteiras prosódicas em fala espontânea monológica masculina de português brasileiro. Duas amostras foram segmentadas em unidades entonacionais por dois grupos de segmentadores treinados. As fronteiras percebidas pelos segmentadores foram marcadas como terminais ou não-terminais. Um script foi usado para extrair parâmetros fonético-acústicos ao longo do sinal de fala em uma janela à direita e à esquerda ao redor de cada fronteira de palavra fonológica. Os parâmetros extraídos compreendem medidas de (1) Taxa de articulação e elocução; (2) Duração normalizada do segmento; (3) Frequência fundamental; (4) Intensidade; (5) Pausa física. O script considera como fronteira prosódica as posições em que pelo menos 50% dos segmentadores indicaram uma fronteira do mesmo tipo. Os modelos de identificação das fronteiras prosódicas foram desenvolvidos a partir de um algoritmo de Análise Discriminante Linear e foram usadas diferentes estratégias de treinamento heurístico. Os modelos apresentaram problemas semelhantes em razão da importância dos parâmetros relacionados às pausas físicas. Foi realizado um teste de percepção de pausa por um grupo de anotadores. A duração de pausa física que pode ser percebida como pausa, evitando confusão com a fase oclusiva dos segmentos, foi analisada. Neste trabalho, a duração proposta é 100 ms. Adicionalmente, submodelos para identificar fronteiras com e sem pausa percebida foram desenvolvidos. O submodelo de identificação de fronteiras com pausa percebida apresentou resultados superiores aos resultados do submodelo de identificação de fronteiras sem pausa percebida.Speech is segmented into intonational units delimited by prosodic boundaries. This segmentation is claimed to have important consequences for syntax, information structure and cognition. This work aims to investigate the phonetic-acoustic parameters involved in the perception of prosodic boundaries, and to develop models for automatic detection of prosodic boundaries in Brazilian Portuguese male monological spontaneous speech. Two samples were segmented into intonational units by two groups of trained annotators. The boundaries perceived by the annotators were tagged as terminal or non-terminal. A script was used to extract phonetic-acoustic parameters along the speech signal in both a rightward and a leftward window around the boundary of each phonological word. The extracted parameters comprise measures of (1) Speech rate and rhythm; (2) Normalized duration; (3) Fundamental frequency; (4) Intensity; (5) Physical pause. The script considers as prosodic boundaries positions at which at least 50% of the annotators indicated a boundary of the same type. The models were developed from a Linear Discriminant Analysis algorithm and different heuristic training strategies were used. The models presented similar problems due to the importance of parameters related to physical pauses. A pause perception test was performed by a group of annotators. The duration of physical pause that can be perceived as a pause, avoiding confusion with the occlusive phase of the segments, was analyzed. In this work, the proposed duration is 100 ms. Additionally, submodels for identifying boundaries with and without a perceived pause were developed. The submodel for identifying boundaries with a perceived pause showed better results than the submodel for identifying boundaries without a perceived pause.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de Minas GeraisPrograma de Pós-Graduação em Estudos LinguísticosUFMGBrasilFALE - FACULDADE DE LETRASFalaAnálise prosódica (Linguística)Linguística de corpusFala espontâneaFronteiras prosódicasDetecção automáticaDetecção automática de fronteiras prosódicas na fala espontâneaAutomatic detection of prosodic boundaries in spontaneous speechinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALtese_deteccao_automatica_de_fronteiras_prosodicas_final.pdftese_deteccao_automatica_de_fronteiras_prosodicas_final.pdfDetecção automática de fronteiras prosódicas na fala espontâneaapplication/pdf2338880https://repositorio.ufmg.br/bitstream/1843/47273/1/tese_deteccao_automatica_de_fronteiras_prosodicas_final.pdf83f2b6f897fc643eea849ba0c17a94f7MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82118https://repositorio.ufmg.br/bitstream/1843/47273/2/license.txtcda590c95a0b51b4d15f60c9642ca272MD521843/472732022-11-16 17:42:48.682oai:repositorio.ufmg.br:1843/47273TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2022-11-16T20:42:48Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Detecção automática de fronteiras prosódicas na fala espontânea
dc.title.alternative.pt_BR.fl_str_mv Automatic detection of prosodic boundaries in spontaneous speech
title Detecção automática de fronteiras prosódicas na fala espontânea
spellingShingle Detecção automática de fronteiras prosódicas na fala espontânea
Bárbara Helohá Falcão Teixeira
Fala espontânea
Fronteiras prosódicas
Detecção automática
Fala
Análise prosódica (Linguística)
Linguística de corpus
title_short Detecção automática de fronteiras prosódicas na fala espontânea
title_full Detecção automática de fronteiras prosódicas na fala espontânea
title_fullStr Detecção automática de fronteiras prosódicas na fala espontânea
title_full_unstemmed Detecção automática de fronteiras prosódicas na fala espontânea
title_sort Detecção automática de fronteiras prosódicas na fala espontânea
author Bárbara Helohá Falcão Teixeira
author_facet Bárbara Helohá Falcão Teixeira
author_role author
dc.contributor.advisor1.fl_str_mv Tommaso Raso
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/1732201620407302
dc.contributor.advisor-co1.fl_str_mv Plínio Almeida Barbosa
dc.contributor.referee1.fl_str_mv Heliana Ribeiro de Mello
dc.contributor.referee2.fl_str_mv Sandra Madureira
dc.contributor.referee3.fl_str_mv João Antônio de Moraes
dc.contributor.referee4.fl_str_mv Bruno Neves Rati de Melo Rocha
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/0018451599638522
dc.contributor.author.fl_str_mv Bárbara Helohá Falcão Teixeira
contributor_str_mv Tommaso Raso
Plínio Almeida Barbosa
Heliana Ribeiro de Mello
Sandra Madureira
João Antônio de Moraes
Bruno Neves Rati de Melo Rocha
dc.subject.por.fl_str_mv Fala espontânea
Fronteiras prosódicas
Detecção automática
topic Fala espontânea
Fronteiras prosódicas
Detecção automática
Fala
Análise prosódica (Linguística)
Linguística de corpus
dc.subject.other.pt_BR.fl_str_mv Fala
Análise prosódica (Linguística)
Linguística de corpus
description A fala é segmentada em unidades entonacionais delimitadas por fronteiras prosódicas. Essa segmentação tem consequências importantes para a sintaxe, estrutura informacional e cognição. Este trabalho tem como objetivo investigar os parâmetros fonético-acústicos envolvidos na percepção das fronteiras prosódicas, e desenvolver modelos destinados à detecção automática das fronteiras prosódicas em fala espontânea monológica masculina de português brasileiro. Duas amostras foram segmentadas em unidades entonacionais por dois grupos de segmentadores treinados. As fronteiras percebidas pelos segmentadores foram marcadas como terminais ou não-terminais. Um script foi usado para extrair parâmetros fonético-acústicos ao longo do sinal de fala em uma janela à direita e à esquerda ao redor de cada fronteira de palavra fonológica. Os parâmetros extraídos compreendem medidas de (1) Taxa de articulação e elocução; (2) Duração normalizada do segmento; (3) Frequência fundamental; (4) Intensidade; (5) Pausa física. O script considera como fronteira prosódica as posições em que pelo menos 50% dos segmentadores indicaram uma fronteira do mesmo tipo. Os modelos de identificação das fronteiras prosódicas foram desenvolvidos a partir de um algoritmo de Análise Discriminante Linear e foram usadas diferentes estratégias de treinamento heurístico. Os modelos apresentaram problemas semelhantes em razão da importância dos parâmetros relacionados às pausas físicas. Foi realizado um teste de percepção de pausa por um grupo de anotadores. A duração de pausa física que pode ser percebida como pausa, evitando confusão com a fase oclusiva dos segmentos, foi analisada. Neste trabalho, a duração proposta é 100 ms. Adicionalmente, submodelos para identificar fronteiras com e sem pausa percebida foram desenvolvidos. O submodelo de identificação de fronteiras com pausa percebida apresentou resultados superiores aos resultados do submodelo de identificação de fronteiras sem pausa percebida.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-11-16T20:42:48Z
dc.date.available.fl_str_mv 2022-11-16T20:42:48Z
dc.date.issued.fl_str_mv 2022-06-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/47273
dc.identifier.orcid.pt_BR.fl_str_mv https://orcid.org/0000-0002-4484-3590
url http://hdl.handle.net/1843/47273
https://orcid.org/0000-0002-4484-3590
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Estudos Linguísticos
dc.publisher.initials.fl_str_mv UFMG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv FALE - FACULDADE DE LETRAS
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/47273/1/tese_deteccao_automatica_de_fronteiras_prosodicas_final.pdf
https://repositorio.ufmg.br/bitstream/1843/47273/2/license.txt
bitstream.checksum.fl_str_mv 83f2b6f897fc643eea849ba0c17a94f7
cda590c95a0b51b4d15f60c9642ca272
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589563965243392