Geração de prosódia para o português brasileiro em sistemas text-to-speech
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/34209 |
Resumo: | With the evergrowing presence of smartphones and home assistants in our daily lives, technology companies have been developing two-way conversation systems, that is, voice user interfaces. Despite its recent improvements, text-to-speech programs still sound artificial, especially for their Brazilian Portuguese voices. A big contributing factor for that is the lack of accurate prosody, that is, pitch, length and emphasis. This thesis explores existing text-to-speech systems, especially those for which there are Brazilian Portuguese voices, focusing on their prosody generation modules. We highlight challenges of prosody generation, review prosodic analysis in the intonational phonology field and propose possible solutions for improving text-to-speech quality. |
id |
UFRN_91553b5c4f1588d7ca11dfde43e1a8b8 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/34209 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Sá, Felipe Cortez deThomé, Antônio Carlos GayIliovitz, Erica ReviglioProlo, Carlos Augusto2018-07-03T11:01:35Z2021-09-20T11:47:12Z2018-07-03T11:01:35Z2021-09-20T11:47:12Z2018-06-202012912357SÁ, Felipe Cortez de. Geração de prosódia para o português brasileiro em sistemas text-to-speech. 2018. 54f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Departamento de Informática e Matemática Aplicada, Universidade Federal do Rio Grande do Norte, Natal, 2018.https://repositorio.ufrn.br/handle/123456789/34209With the evergrowing presence of smartphones and home assistants in our daily lives, technology companies have been developing two-way conversation systems, that is, voice user interfaces. Despite its recent improvements, text-to-speech programs still sound artificial, especially for their Brazilian Portuguese voices. A big contributing factor for that is the lack of accurate prosody, that is, pitch, length and emphasis. This thesis explores existing text-to-speech systems, especially those for which there are Brazilian Portuguese voices, focusing on their prosody generation modules. We highlight challenges of prosody generation, review prosodic analysis in the intonational phonology field and propose possible solutions for improving text-to-speech quality.Com a cada vez mais forte presença de smartphones e home assistants no cotidiano, grandes empresas de tecnologia vêm desenvolvendo sistemas de conversação baseados em fala, denominadas voice user interfaces. Apesar dos avanços, é perceptível que os sistemas de síntese de voz, especialmente para o português brasileiro, deixam a desejar quanto à naturalidade da fala gerada. Um dos fatores principais que contribuem para isso é a prosódia, isto é, entoação, ritmo e acento da fala. Este trabalho investiga sistemas textto- speech existentes através do estudo de seus algoritmos para síntese de voz e geração de prosódia para diversas línguas, com foco no português brasileiro. São explicitados os desafios encontrados, é feito um levantamento de modelos de análise prosódica na fonologia e propõem-se possíveis soluções para tornar a geração de voz mais próxima à humana.Universidade Federal do Rio Grande do NorteUFRNBrasilCiência da Computaçãotext-to-speechprosódiavoice user interfacesprosodyGeração de prosódia para o português brasileiro em sistemas text-to-speechProsody generation for Brazilian Portuguese in text-to-speech systemsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNTEXTGeraçaoProsodia_Sa_2018.pdf.txtExtracted texttext/plain61493https://repositorio.ufrn.br/bitstream/123456789/34209/1/Gera%c3%a7aoProsodia_Sa_2018.pdf.txt5dc3dd4acf3a9b1cf523111acb51f51bMD51ORIGINALGeraçaoProsodia_Sa_2018.pdfMonografiaapplication/pdf962495https://repositorio.ufrn.br/bitstream/123456789/34209/2/Gera%c3%a7aoProsodia_Sa_2018.pdf816d872ea093a6e0ddabe73fa7aaa5edMD52CC-LICENSElicense_urlapplication/octet-stream43https://repositorio.ufrn.br/bitstream/123456789/34209/3/license_url321f3992dd3875151d8801b773ab32edMD53license_textapplication/octet-stream0https://repositorio.ufrn.br/bitstream/123456789/34209/4/license_textd41d8cd98f00b204e9800998ecf8427eMD54license_rdfapplication/octet-stream0https://repositorio.ufrn.br/bitstream/123456789/34209/5/license_rdfd41d8cd98f00b204e9800998ecf8427eMD55LICENSElicense.txttext/plain756https://repositorio.ufrn.br/bitstream/123456789/34209/6/license.txta80a9cda2756d355b388cc443c3d8a43MD56123456789/342092021-09-20 08:47:12.852oai:https://repositorio.ufrn.br:123456789/34209PGNlbnRlcj48c3Ryb25nPlVOSVZFUlNJREFERSBGRURFUkFMIERPIFJJTyBHUkFOREUgRE8gTk9SVEU8L3N0cm9uZz48L2NlbnRlcj4KPGNlbnRlcj48c3Ryb25nPkJJQkxJT1RFQ0EgRElHSVRBTCBERSBNT05PR1JBRklBUzwvc3Ryb25nPjwvY2VudGVyPgoKPGNlbnRlcj5UZXJtbyBkZSBBdXRvcml6YcOnw6NvIHBhcmEgZGlzcG9uaWJpbGl6YcOnw6NvIGRlIE1vbm9ncmFmaWFzIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbyBuYSBCaWJsaW90ZWNhIERpZ2l0YWwgZGUgTW9ub2dyYWZpYXMgKEJETSk8L2NlbnRlcj4KCk5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBkYSBtb25vZ3JhZmlhLCBhdXRvcml6byBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvIFJpbyBHcmFuZGUgZG8gTm9ydGUgKFVGUk4pIGEgZGlzcG9uaWJpbGl6YXIgYXRyYXbDqXMgZGEgQmlibGlvdGVjYSBEaWdpdGFsIGRlIE1vbm9ncmFmaWFzIGRhIFVGUk4sIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgZGUgYWNvcmRvIGNvbSBhIExlaSBuwrAgOTYxMC85OCwgbyB0ZXh0byBpbnRlZ3JhbCBkYSBvYnJhIHN1Ym1ldGlkYSBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCBhIHTDrXR1bG8gZGUgZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EgYnJhc2lsZWlyYSwgYSBwYXJ0aXIgZGEgZGF0YSBkZXN0YSBzdWJtaXNzw6NvLiAKRepositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2021-09-20T11:47:12Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pr_BR.fl_str_mv |
Geração de prosódia para o português brasileiro em sistemas text-to-speech |
dc.title.alternative.pr_BR.fl_str_mv |
Prosody generation for Brazilian Portuguese in text-to-speech systems |
title |
Geração de prosódia para o português brasileiro em sistemas text-to-speech |
spellingShingle |
Geração de prosódia para o português brasileiro em sistemas text-to-speech Sá, Felipe Cortez de text-to-speech prosódia voice user interfaces prosody |
title_short |
Geração de prosódia para o português brasileiro em sistemas text-to-speech |
title_full |
Geração de prosódia para o português brasileiro em sistemas text-to-speech |
title_fullStr |
Geração de prosódia para o português brasileiro em sistemas text-to-speech |
title_full_unstemmed |
Geração de prosódia para o português brasileiro em sistemas text-to-speech |
title_sort |
Geração de prosódia para o português brasileiro em sistemas text-to-speech |
author |
Sá, Felipe Cortez de |
author_facet |
Sá, Felipe Cortez de |
author_role |
author |
dc.contributor.referees1.none.fl_str_mv |
Thomé, Antônio Carlos Gay |
dc.contributor.referees2.none.fl_str_mv |
Iliovitz, Erica Reviglio |
dc.contributor.author.fl_str_mv |
Sá, Felipe Cortez de |
dc.contributor.advisor1.fl_str_mv |
Prolo, Carlos Augusto |
contributor_str_mv |
Prolo, Carlos Augusto |
dc.subject.pr_BR.fl_str_mv |
text-to-speech prosódia voice user interfaces prosody |
topic |
text-to-speech prosódia voice user interfaces prosody |
description |
With the evergrowing presence of smartphones and home assistants in our daily lives, technology companies have been developing two-way conversation systems, that is, voice user interfaces. Despite its recent improvements, text-to-speech programs still sound artificial, especially for their Brazilian Portuguese voices. A big contributing factor for that is the lack of accurate prosody, that is, pitch, length and emphasis. This thesis explores existing text-to-speech systems, especially those for which there are Brazilian Portuguese voices, focusing on their prosody generation modules. We highlight challenges of prosody generation, review prosodic analysis in the intonational phonology field and propose possible solutions for improving text-to-speech quality. |
publishDate |
2018 |
dc.date.accessioned.fl_str_mv |
2018-07-03T11:01:35Z 2021-09-20T11:47:12Z |
dc.date.available.fl_str_mv |
2018-07-03T11:01:35Z 2021-09-20T11:47:12Z |
dc.date.issued.fl_str_mv |
2018-06-20 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.pr_BR.fl_str_mv |
2012912357 |
dc.identifier.citation.fl_str_mv |
SÁ, Felipe Cortez de. Geração de prosódia para o português brasileiro em sistemas text-to-speech. 2018. 54f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Departamento de Informática e Matemática Aplicada, Universidade Federal do Rio Grande do Norte, Natal, 2018. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/34209 |
identifier_str_mv |
2012912357 SÁ, Felipe Cortez de. Geração de prosódia para o português brasileiro em sistemas text-to-speech. 2018. 54f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Departamento de Informática e Matemática Aplicada, Universidade Federal do Rio Grande do Norte, Natal, 2018. |
url |
https://repositorio.ufrn.br/handle/123456789/34209 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Ciência da Computação |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/34209/1/Gera%c3%a7aoProsodia_Sa_2018.pdf.txt https://repositorio.ufrn.br/bitstream/123456789/34209/2/Gera%c3%a7aoProsodia_Sa_2018.pdf https://repositorio.ufrn.br/bitstream/123456789/34209/3/license_url https://repositorio.ufrn.br/bitstream/123456789/34209/4/license_text https://repositorio.ufrn.br/bitstream/123456789/34209/5/license_rdf https://repositorio.ufrn.br/bitstream/123456789/34209/6/license.txt |
bitstream.checksum.fl_str_mv |
5dc3dd4acf3a9b1cf523111acb51f51b 816d872ea093a6e0ddabe73fa7aaa5ed 321f3992dd3875151d8801b773ab32ed d41d8cd98f00b204e9800998ecf8427e d41d8cd98f00b204e9800998ecf8427e a80a9cda2756d355b388cc443c3d8a43 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1814832731616444416 |