Detecção automática de fronteiras prosódicas na fala espontânea
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/47273 https://orcid.org/0000-0002-4484-3590 |
Resumo: | A fala é segmentada em unidades entonacionais delimitadas por fronteiras prosódicas. Essa segmentação tem consequências importantes para a sintaxe, estrutura informacional e cognição. Este trabalho tem como objetivo investigar os parâmetros fonético-acústicos envolvidos na percepção das fronteiras prosódicas, e desenvolver modelos destinados à detecção automática das fronteiras prosódicas em fala espontânea monológica masculina de português brasileiro. Duas amostras foram segmentadas em unidades entonacionais por dois grupos de segmentadores treinados. As fronteiras percebidas pelos segmentadores foram marcadas como terminais ou não-terminais. Um script foi usado para extrair parâmetros fonético-acústicos ao longo do sinal de fala em uma janela à direita e à esquerda ao redor de cada fronteira de palavra fonológica. Os parâmetros extraídos compreendem medidas de (1) Taxa de articulação e elocução; (2) Duração normalizada do segmento; (3) Frequência fundamental; (4) Intensidade; (5) Pausa física. O script considera como fronteira prosódica as posições em que pelo menos 50% dos segmentadores indicaram uma fronteira do mesmo tipo. Os modelos de identificação das fronteiras prosódicas foram desenvolvidos a partir de um algoritmo de Análise Discriminante Linear e foram usadas diferentes estratégias de treinamento heurístico. Os modelos apresentaram problemas semelhantes em razão da importância dos parâmetros relacionados às pausas físicas. Foi realizado um teste de percepção de pausa por um grupo de anotadores. A duração de pausa física que pode ser percebida como pausa, evitando confusão com a fase oclusiva dos segmentos, foi analisada. Neste trabalho, a duração proposta é 100 ms. Adicionalmente, submodelos para identificar fronteiras com e sem pausa percebida foram desenvolvidos. O submodelo de identificação de fronteiras com pausa percebida apresentou resultados superiores aos resultados do submodelo de identificação de fronteiras sem pausa percebida. |
id |
UFMG_f3308a8b1b2165a57af1337c098d27a8 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/47273 |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Tommaso Rasohttp://lattes.cnpq.br/1732201620407302Plínio Almeida BarbosaHeliana Ribeiro de MelloSandra MadureiraJoão Antônio de MoraesBruno Neves Rati de Melo Rochahttp://lattes.cnpq.br/0018451599638522Bárbara Helohá Falcão Teixeira2022-11-16T20:42:48Z2022-11-16T20:42:48Z2022-06-28http://hdl.handle.net/1843/47273https://orcid.org/0000-0002-4484-3590A fala é segmentada em unidades entonacionais delimitadas por fronteiras prosódicas. Essa segmentação tem consequências importantes para a sintaxe, estrutura informacional e cognição. Este trabalho tem como objetivo investigar os parâmetros fonético-acústicos envolvidos na percepção das fronteiras prosódicas, e desenvolver modelos destinados à detecção automática das fronteiras prosódicas em fala espontânea monológica masculina de português brasileiro. Duas amostras foram segmentadas em unidades entonacionais por dois grupos de segmentadores treinados. As fronteiras percebidas pelos segmentadores foram marcadas como terminais ou não-terminais. Um script foi usado para extrair parâmetros fonético-acústicos ao longo do sinal de fala em uma janela à direita e à esquerda ao redor de cada fronteira de palavra fonológica. Os parâmetros extraídos compreendem medidas de (1) Taxa de articulação e elocução; (2) Duração normalizada do segmento; (3) Frequência fundamental; (4) Intensidade; (5) Pausa física. O script considera como fronteira prosódica as posições em que pelo menos 50% dos segmentadores indicaram uma fronteira do mesmo tipo. Os modelos de identificação das fronteiras prosódicas foram desenvolvidos a partir de um algoritmo de Análise Discriminante Linear e foram usadas diferentes estratégias de treinamento heurístico. Os modelos apresentaram problemas semelhantes em razão da importância dos parâmetros relacionados às pausas físicas. Foi realizado um teste de percepção de pausa por um grupo de anotadores. A duração de pausa física que pode ser percebida como pausa, evitando confusão com a fase oclusiva dos segmentos, foi analisada. Neste trabalho, a duração proposta é 100 ms. Adicionalmente, submodelos para identificar fronteiras com e sem pausa percebida foram desenvolvidos. O submodelo de identificação de fronteiras com pausa percebida apresentou resultados superiores aos resultados do submodelo de identificação de fronteiras sem pausa percebida.Speech is segmented into intonational units delimited by prosodic boundaries. This segmentation is claimed to have important consequences for syntax, information structure and cognition. This work aims to investigate the phonetic-acoustic parameters involved in the perception of prosodic boundaries, and to develop models for automatic detection of prosodic boundaries in Brazilian Portuguese male monological spontaneous speech. Two samples were segmented into intonational units by two groups of trained annotators. The boundaries perceived by the annotators were tagged as terminal or non-terminal. A script was used to extract phonetic-acoustic parameters along the speech signal in both a rightward and a leftward window around the boundary of each phonological word. The extracted parameters comprise measures of (1) Speech rate and rhythm; (2) Normalized duration; (3) Fundamental frequency; (4) Intensity; (5) Physical pause. The script considers as prosodic boundaries positions at which at least 50% of the annotators indicated a boundary of the same type. The models were developed from a Linear Discriminant Analysis algorithm and different heuristic training strategies were used. The models presented similar problems due to the importance of parameters related to physical pauses. A pause perception test was performed by a group of annotators. The duration of physical pause that can be perceived as a pause, avoiding confusion with the occlusive phase of the segments, was analyzed. In this work, the proposed duration is 100 ms. Additionally, submodels for identifying boundaries with and without a perceived pause were developed. The submodel for identifying boundaries with a perceived pause showed better results than the submodel for identifying boundaries without a perceived pause.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de Minas GeraisPrograma de Pós-Graduação em Estudos LinguísticosUFMGBrasilFALE - FACULDADE DE LETRASFalaAnálise prosódica (Linguística)Linguística de corpusFala espontâneaFronteiras prosódicasDetecção automáticaDetecção automática de fronteiras prosódicas na fala espontâneaAutomatic detection of prosodic boundaries in spontaneous speechinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALtese_deteccao_automatica_de_fronteiras_prosodicas_final.pdftese_deteccao_automatica_de_fronteiras_prosodicas_final.pdfDetecção automática de fronteiras prosódicas na fala espontâneaapplication/pdf2338880https://repositorio.ufmg.br/bitstream/1843/47273/1/tese_deteccao_automatica_de_fronteiras_prosodicas_final.pdf83f2b6f897fc643eea849ba0c17a94f7MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82118https://repositorio.ufmg.br/bitstream/1843/47273/2/license.txtcda590c95a0b51b4d15f60c9642ca272MD521843/472732022-11-16 17:42:48.682oai:repositorio.ufmg.br:1843/47273TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2022-11-16T20:42:48Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Detecção automática de fronteiras prosódicas na fala espontânea |
dc.title.alternative.pt_BR.fl_str_mv |
Automatic detection of prosodic boundaries in spontaneous speech |
title |
Detecção automática de fronteiras prosódicas na fala espontânea |
spellingShingle |
Detecção automática de fronteiras prosódicas na fala espontânea Bárbara Helohá Falcão Teixeira Fala espontânea Fronteiras prosódicas Detecção automática Fala Análise prosódica (Linguística) Linguística de corpus |
title_short |
Detecção automática de fronteiras prosódicas na fala espontânea |
title_full |
Detecção automática de fronteiras prosódicas na fala espontânea |
title_fullStr |
Detecção automática de fronteiras prosódicas na fala espontânea |
title_full_unstemmed |
Detecção automática de fronteiras prosódicas na fala espontânea |
title_sort |
Detecção automática de fronteiras prosódicas na fala espontânea |
author |
Bárbara Helohá Falcão Teixeira |
author_facet |
Bárbara Helohá Falcão Teixeira |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Tommaso Raso |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/1732201620407302 |
dc.contributor.advisor-co1.fl_str_mv |
Plínio Almeida Barbosa |
dc.contributor.referee1.fl_str_mv |
Heliana Ribeiro de Mello |
dc.contributor.referee2.fl_str_mv |
Sandra Madureira |
dc.contributor.referee3.fl_str_mv |
João Antônio de Moraes |
dc.contributor.referee4.fl_str_mv |
Bruno Neves Rati de Melo Rocha |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/0018451599638522 |
dc.contributor.author.fl_str_mv |
Bárbara Helohá Falcão Teixeira |
contributor_str_mv |
Tommaso Raso Plínio Almeida Barbosa Heliana Ribeiro de Mello Sandra Madureira João Antônio de Moraes Bruno Neves Rati de Melo Rocha |
dc.subject.por.fl_str_mv |
Fala espontânea Fronteiras prosódicas Detecção automática |
topic |
Fala espontânea Fronteiras prosódicas Detecção automática Fala Análise prosódica (Linguística) Linguística de corpus |
dc.subject.other.pt_BR.fl_str_mv |
Fala Análise prosódica (Linguística) Linguística de corpus |
description |
A fala é segmentada em unidades entonacionais delimitadas por fronteiras prosódicas. Essa segmentação tem consequências importantes para a sintaxe, estrutura informacional e cognição. Este trabalho tem como objetivo investigar os parâmetros fonético-acústicos envolvidos na percepção das fronteiras prosódicas, e desenvolver modelos destinados à detecção automática das fronteiras prosódicas em fala espontânea monológica masculina de português brasileiro. Duas amostras foram segmentadas em unidades entonacionais por dois grupos de segmentadores treinados. As fronteiras percebidas pelos segmentadores foram marcadas como terminais ou não-terminais. Um script foi usado para extrair parâmetros fonético-acústicos ao longo do sinal de fala em uma janela à direita e à esquerda ao redor de cada fronteira de palavra fonológica. Os parâmetros extraídos compreendem medidas de (1) Taxa de articulação e elocução; (2) Duração normalizada do segmento; (3) Frequência fundamental; (4) Intensidade; (5) Pausa física. O script considera como fronteira prosódica as posições em que pelo menos 50% dos segmentadores indicaram uma fronteira do mesmo tipo. Os modelos de identificação das fronteiras prosódicas foram desenvolvidos a partir de um algoritmo de Análise Discriminante Linear e foram usadas diferentes estratégias de treinamento heurístico. Os modelos apresentaram problemas semelhantes em razão da importância dos parâmetros relacionados às pausas físicas. Foi realizado um teste de percepção de pausa por um grupo de anotadores. A duração de pausa física que pode ser percebida como pausa, evitando confusão com a fase oclusiva dos segmentos, foi analisada. Neste trabalho, a duração proposta é 100 ms. Adicionalmente, submodelos para identificar fronteiras com e sem pausa percebida foram desenvolvidos. O submodelo de identificação de fronteiras com pausa percebida apresentou resultados superiores aos resultados do submodelo de identificação de fronteiras sem pausa percebida. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-11-16T20:42:48Z |
dc.date.available.fl_str_mv |
2022-11-16T20:42:48Z |
dc.date.issued.fl_str_mv |
2022-06-28 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/47273 |
dc.identifier.orcid.pt_BR.fl_str_mv |
https://orcid.org/0000-0002-4484-3590 |
url |
http://hdl.handle.net/1843/47273 https://orcid.org/0000-0002-4484-3590 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Estudos Linguísticos |
dc.publisher.initials.fl_str_mv |
UFMG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
FALE - FACULDADE DE LETRAS |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/47273/1/tese_deteccao_automatica_de_fronteiras_prosodicas_final.pdf https://repositorio.ufmg.br/bitstream/1843/47273/2/license.txt |
bitstream.checksum.fl_str_mv |
83f2b6f897fc643eea849ba0c17a94f7 cda590c95a0b51b4d15f60c9642ca272 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589563965243392 |