Geração de prosódia para o português brasileiro em sistemas text-to-speech

Detalhes bibliográficos
Autor(a) principal: Sá, Felipe Cortez de
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/34209
Resumo: With the evergrowing presence of smartphones and home assistants in our daily lives, technology companies have been developing two-way conversation systems, that is, voice user interfaces. Despite its recent improvements, text-to-speech programs still sound artificial, especially for their Brazilian Portuguese voices. A big contributing factor for that is the lack of accurate prosody, that is, pitch, length and emphasis. This thesis explores existing text-to-speech systems, especially those for which there are Brazilian Portuguese voices, focusing on their prosody generation modules. We highlight challenges of prosody generation, review prosodic analysis in the intonational phonology field and propose possible solutions for improving text-to-speech quality.
id UFRN_91553b5c4f1588d7ca11dfde43e1a8b8
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/34209
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Sá, Felipe Cortez deThomé, Antônio Carlos GayIliovitz, Erica ReviglioProlo, Carlos Augusto2018-07-03T11:01:35Z2021-09-20T11:47:12Z2018-07-03T11:01:35Z2021-09-20T11:47:12Z2018-06-202012912357SÁ, Felipe Cortez de. Geração de prosódia para o português brasileiro em sistemas text-to-speech. 2018. 54f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Departamento de Informática e Matemática Aplicada, Universidade Federal do Rio Grande do Norte, Natal, 2018.https://repositorio.ufrn.br/handle/123456789/34209With the evergrowing presence of smartphones and home assistants in our daily lives, technology companies have been developing two-way conversation systems, that is, voice user interfaces. Despite its recent improvements, text-to-speech programs still sound artificial, especially for their Brazilian Portuguese voices. A big contributing factor for that is the lack of accurate prosody, that is, pitch, length and emphasis. This thesis explores existing text-to-speech systems, especially those for which there are Brazilian Portuguese voices, focusing on their prosody generation modules. We highlight challenges of prosody generation, review prosodic analysis in the intonational phonology field and propose possible solutions for improving text-to-speech quality.Com a cada vez mais forte presença de smartphones e home assistants no cotidiano, grandes empresas de tecnologia vêm desenvolvendo sistemas de conversação baseados em fala, denominadas voice user interfaces. Apesar dos avanços, é perceptível que os sistemas de síntese de voz, especialmente para o português brasileiro, deixam a desejar quanto à naturalidade da fala gerada. Um dos fatores principais que contribuem para isso é a prosódia, isto é, entoação, ritmo e acento da fala. Este trabalho investiga sistemas textto- speech existentes através do estudo de seus algoritmos para síntese de voz e geração de prosódia para diversas línguas, com foco no português brasileiro. São explicitados os desafios encontrados, é feito um levantamento de modelos de análise prosódica na fonologia e propõem-se possíveis soluções para tornar a geração de voz mais próxima à humana.Universidade Federal do Rio Grande do NorteUFRNBrasilCiência da Computaçãotext-to-speechprosódiavoice user interfacesprosodyGeração de prosódia para o português brasileiro em sistemas text-to-speechProsody generation for Brazilian Portuguese in text-to-speech systemsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNTEXTGeraçaoProsodia_Sa_2018.pdf.txtExtracted texttext/plain61493https://repositorio.ufrn.br/bitstream/123456789/34209/1/Gera%c3%a7aoProsodia_Sa_2018.pdf.txt5dc3dd4acf3a9b1cf523111acb51f51bMD51ORIGINALGeraçaoProsodia_Sa_2018.pdfMonografiaapplication/pdf962495https://repositorio.ufrn.br/bitstream/123456789/34209/2/Gera%c3%a7aoProsodia_Sa_2018.pdf816d872ea093a6e0ddabe73fa7aaa5edMD52CC-LICENSElicense_urlapplication/octet-stream43https://repositorio.ufrn.br/bitstream/123456789/34209/3/license_url321f3992dd3875151d8801b773ab32edMD53license_textapplication/octet-stream0https://repositorio.ufrn.br/bitstream/123456789/34209/4/license_textd41d8cd98f00b204e9800998ecf8427eMD54license_rdfapplication/octet-stream0https://repositorio.ufrn.br/bitstream/123456789/34209/5/license_rdfd41d8cd98f00b204e9800998ecf8427eMD55LICENSElicense.txttext/plain756https://repositorio.ufrn.br/bitstream/123456789/34209/6/license.txta80a9cda2756d355b388cc443c3d8a43MD56123456789/342092021-09-20 08:47:12.852oai:https://repositorio.ufrn.br:123456789/34209PGNlbnRlcj48c3Ryb25nPlVOSVZFUlNJREFERSBGRURFUkFMIERPIFJJTyBHUkFOREUgRE8gTk9SVEU8L3N0cm9uZz48L2NlbnRlcj4KPGNlbnRlcj48c3Ryb25nPkJJQkxJT1RFQ0EgRElHSVRBTCBERSBNT05PR1JBRklBUzwvc3Ryb25nPjwvY2VudGVyPgoKPGNlbnRlcj5UZXJtbyBkZSBBdXRvcml6YcOnw6NvIHBhcmEgZGlzcG9uaWJpbGl6YcOnw6NvIGRlIE1vbm9ncmFmaWFzIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbyBuYSBCaWJsaW90ZWNhIERpZ2l0YWwgZGUgTW9ub2dyYWZpYXMgKEJETSk8L2NlbnRlcj4KCk5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBkYSBtb25vZ3JhZmlhLCBhdXRvcml6byBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvIFJpbyBHcmFuZGUgZG8gTm9ydGUgKFVGUk4pIGEgZGlzcG9uaWJpbGl6YXIgYXRyYXbDqXMgZGEgQmlibGlvdGVjYSBEaWdpdGFsIGRlIE1vbm9ncmFmaWFzIGRhIFVGUk4sIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgZGUgYWNvcmRvIGNvbSBhIExlaSBuwrAgOTYxMC85OCwgbyB0ZXh0byBpbnRlZ3JhbCBkYSBvYnJhIHN1Ym1ldGlkYSBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCBhIHTDrXR1bG8gZGUgZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EgYnJhc2lsZWlyYSwgYSBwYXJ0aXIgZGEgZGF0YSBkZXN0YSBzdWJtaXNzw6NvLiAKRepositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2021-09-20T11:47:12Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pr_BR.fl_str_mv Geração de prosódia para o português brasileiro em sistemas text-to-speech
dc.title.alternative.pr_BR.fl_str_mv Prosody generation for Brazilian Portuguese in text-to-speech systems
title Geração de prosódia para o português brasileiro em sistemas text-to-speech
spellingShingle Geração de prosódia para o português brasileiro em sistemas text-to-speech
Sá, Felipe Cortez de
text-to-speech
prosódia
voice user interfaces
prosody
title_short Geração de prosódia para o português brasileiro em sistemas text-to-speech
title_full Geração de prosódia para o português brasileiro em sistemas text-to-speech
title_fullStr Geração de prosódia para o português brasileiro em sistemas text-to-speech
title_full_unstemmed Geração de prosódia para o português brasileiro em sistemas text-to-speech
title_sort Geração de prosódia para o português brasileiro em sistemas text-to-speech
author Sá, Felipe Cortez de
author_facet Sá, Felipe Cortez de
author_role author
dc.contributor.referees1.none.fl_str_mv Thomé, Antônio Carlos Gay
dc.contributor.referees2.none.fl_str_mv Iliovitz, Erica Reviglio
dc.contributor.author.fl_str_mv Sá, Felipe Cortez de
dc.contributor.advisor1.fl_str_mv Prolo, Carlos Augusto
contributor_str_mv Prolo, Carlos Augusto
dc.subject.pr_BR.fl_str_mv text-to-speech
prosódia
voice user interfaces
prosody
topic text-to-speech
prosódia
voice user interfaces
prosody
description With the evergrowing presence of smartphones and home assistants in our daily lives, technology companies have been developing two-way conversation systems, that is, voice user interfaces. Despite its recent improvements, text-to-speech programs still sound artificial, especially for their Brazilian Portuguese voices. A big contributing factor for that is the lack of accurate prosody, that is, pitch, length and emphasis. This thesis explores existing text-to-speech systems, especially those for which there are Brazilian Portuguese voices, focusing on their prosody generation modules. We highlight challenges of prosody generation, review prosodic analysis in the intonational phonology field and propose possible solutions for improving text-to-speech quality.
publishDate 2018
dc.date.accessioned.fl_str_mv 2018-07-03T11:01:35Z
2021-09-20T11:47:12Z
dc.date.available.fl_str_mv 2018-07-03T11:01:35Z
2021-09-20T11:47:12Z
dc.date.issued.fl_str_mv 2018-06-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.pr_BR.fl_str_mv 2012912357
dc.identifier.citation.fl_str_mv SÁ, Felipe Cortez de. Geração de prosódia para o português brasileiro em sistemas text-to-speech. 2018. 54f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Departamento de Informática e Matemática Aplicada, Universidade Federal do Rio Grande do Norte, Natal, 2018.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/34209
identifier_str_mv 2012912357
SÁ, Felipe Cortez de. Geração de prosódia para o português brasileiro em sistemas text-to-speech. 2018. 54f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Departamento de Informática e Matemática Aplicada, Universidade Federal do Rio Grande do Norte, Natal, 2018.
url https://repositorio.ufrn.br/handle/123456789/34209
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Ciência da Computação
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/34209/1/Gera%c3%a7aoProsodia_Sa_2018.pdf.txt
https://repositorio.ufrn.br/bitstream/123456789/34209/2/Gera%c3%a7aoProsodia_Sa_2018.pdf
https://repositorio.ufrn.br/bitstream/123456789/34209/3/license_url
https://repositorio.ufrn.br/bitstream/123456789/34209/4/license_text
https://repositorio.ufrn.br/bitstream/123456789/34209/5/license_rdf
https://repositorio.ufrn.br/bitstream/123456789/34209/6/license.txt
bitstream.checksum.fl_str_mv 5dc3dd4acf3a9b1cf523111acb51f51b
816d872ea093a6e0ddabe73fa7aaa5ed
321f3992dd3875151d8801b773ab32ed
d41d8cd98f00b204e9800998ecf8427e
d41d8cd98f00b204e9800998ecf8427e
a80a9cda2756d355b388cc443c3d8a43
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814832731616444416