Transdutor de estados finitos para conversÃo de grafema para a pronÃncia da variedade linguÃstica potiguar

Detalhes bibliográficos
Autor(a) principal: Cid Ivan da Costa Carvalho
Data de Publicação: 2016
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFC
Texto Completo: http://www.teses.ufc.br/tde_busca/arquivo.php?codArquivo=17295
Resumo: O Potigrafone e um transdutor de estados finitos que faz a transcriÃÃo automÃtica das formas grÃficas da lÃngua portuguesa para as formas fonÃticas da variedade linguÃstica potiguar. Com o desenvolvimento desse sistema, conseguimos identificar e separar os padrÃes fonÃticos da variedade linguÃstica potiguar, atravÃs do Atlas linguÃstico do Centro-Oeste potiguar e no Atlas GeolinguÃstico do Litoral Potiguar; apresentar uma ferramenta de transcriÃÃo fonÃtica utilizando o alfabeto fonÃtico Speech Assessment Methods Phonetic Alphabet (SAMPA) e, alem disso, conseguimos avaliar o desempenho do sistema em corpus de textos escritos de lÃngua portuguesa por meio de duas medidas multinÃveis: Exact Match Ratio e Labelling Fscore. Para isso, foram atendidos passos fundamentais: primeiro, foram necessÃrias a identificaÃÃo e a separaÃÃo dos padrÃes fonolÃgicos presentes nas cartas fonÃticas dos Atlas supracitados; segundo, a definiÃÃo de alguns critÃrios pertinentes as entradas (inputs) do sistema; terceiro, a implementaÃÃo das regras que relacionam a forma subjacente com a forma superficial e; por Ãltimo, a escolha das duas medidas adequadas a avaliaÃÃo de um sistema que apresentava mais de uma forma de transcriÃÃo. Os resultados mostram que o desempenho do Potigrafone foi de 81% para a medida Exact Match Ratio e 89% para a medida Labelling FScore, apresentando, assim, boa performance na exatidÃo e nos acertos totais e parciais, no que se refere a transcriÃÃo sem a marcaÃÃo da silaba tÃnica e sem os fenÃmenos fonÃticos da nasalidade, da palatalizaÃÃo, da ditongaÃÃo, da monotongaÃÃo, do apagamento, da epÃntese; outro resultado importante e que os mÃdulos de consoantes e de nÃcleo silÃbico tambÃm interferem no desempenho, uma vez que os valores com todos os mÃdulos e sem esses dois mÃdulos se assemelham. O Potigrafone apresenta bom desempenho na transcriÃÃo fonÃtica, mas existem alguns erros pontuais que torna necessÃrio a constituiÃÃo de novas regras para corrigi-los e, consequentemente, melhorar o desempenho do sistema, tanto na exatidÃo quanto na correspondÃncia total e parcial da transcriÃÃo.
id UFC_ea63d8c9300baa4b8724fc9cfa46da74
oai_identifier_str oai:www.teses.ufc.br:11192
network_acronym_str UFC
network_name_str Biblioteca Digital de Teses e Dissertações da UFC
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisTransdutor de estados finitos para conversÃo de grafema para a pronÃncia da variedade linguÃstica potiguarFinite state transducer for the grapheme conversion of the pronunciation in the potiguar linguistic variety 2016-05-06Leonel Figueiredo de Alencar Araripe30808545353Maria Elias Soares02178761372http://buscatextual.cnpq.br/buscatextual/busca.doRosemeire Selma Monteiro93020473934ElisÃngela Nogueira Teixeira61866458353http://lattes.cnpq.br/7609186549849417VlÃdia CÃlia Monteiro Pinheiro35849487387http://lattes.cnpq.br/299128156551893402656413494http://lattes.cnpq.br/6728408490384241Cid Ivan da Costa CarvalhoUniversidade Federal do CearÃPrograma de PÃs-GraduaÃÃo em LingÃÃsticaUFCBRPotigrafone Variedade LinguÃstica Potiguar Atlas linguÃstico do Centro-Oeste potiguar Atlas GeolinguÃstico do Litoral Potiguar SAMPAPotigrafone Linguistic variety Potiguar Atlas LinguÃstico do Centro-Oeste potiguar Atlas GeolinguÃstico do Litoral Potiguar SAMPALINGUISTICA APLICADAO Potigrafone e um transdutor de estados finitos que faz a transcriÃÃo automÃtica das formas grÃficas da lÃngua portuguesa para as formas fonÃticas da variedade linguÃstica potiguar. Com o desenvolvimento desse sistema, conseguimos identificar e separar os padrÃes fonÃticos da variedade linguÃstica potiguar, atravÃs do Atlas linguÃstico do Centro-Oeste potiguar e no Atlas GeolinguÃstico do Litoral Potiguar; apresentar uma ferramenta de transcriÃÃo fonÃtica utilizando o alfabeto fonÃtico Speech Assessment Methods Phonetic Alphabet (SAMPA) e, alem disso, conseguimos avaliar o desempenho do sistema em corpus de textos escritos de lÃngua portuguesa por meio de duas medidas multinÃveis: Exact Match Ratio e Labelling Fscore. Para isso, foram atendidos passos fundamentais: primeiro, foram necessÃrias a identificaÃÃo e a separaÃÃo dos padrÃes fonolÃgicos presentes nas cartas fonÃticas dos Atlas supracitados; segundo, a definiÃÃo de alguns critÃrios pertinentes as entradas (inputs) do sistema; terceiro, a implementaÃÃo das regras que relacionam a forma subjacente com a forma superficial e; por Ãltimo, a escolha das duas medidas adequadas a avaliaÃÃo de um sistema que apresentava mais de uma forma de transcriÃÃo. Os resultados mostram que o desempenho do Potigrafone foi de 81% para a medida Exact Match Ratio e 89% para a medida Labelling FScore, apresentando, assim, boa performance na exatidÃo e nos acertos totais e parciais, no que se refere a transcriÃÃo sem a marcaÃÃo da silaba tÃnica e sem os fenÃmenos fonÃticos da nasalidade, da palatalizaÃÃo, da ditongaÃÃo, da monotongaÃÃo, do apagamento, da epÃntese; outro resultado importante e que os mÃdulos de consoantes e de nÃcleo silÃbico tambÃm interferem no desempenho, uma vez que os valores com todos os mÃdulos e sem esses dois mÃdulos se assemelham. O Potigrafone apresenta bom desempenho na transcriÃÃo fonÃtica, mas existem alguns erros pontuais que torna necessÃrio a constituiÃÃo de novas regras para corrigi-los e, consequentemente, melhorar o desempenho do sistema, tanto na exatidÃo quanto na correspondÃncia total e parcial da transcriÃÃo.The Potigrafone is a finite-state transducer that automatically transcripts the graphic forms from the Portuguese language to the phonetic forms belonging to theâpotiguarâ linguistic variety. It was through the development of this system, by using of the Atlas LinguÃstico do Centro-Oeste Potiguar and to the Atlas GeolinguÃstico do Litoral Potiguar, that it has been possible to identify and separate the phonetic patterns in the linguistic variety belonging to the studied region, presenting a phonetic transcription tool while using the Speech Assessment Methods Phonetic Alphabet - SAMPA; and, in addition, a performance assessment in the corpus of written texts in Portuguese has been made through the use of two multi-level measures: Exact Match Ratio and Labelling Fscore. To do so, the identification and separation of phonological patterns present in the phonetic letters of Atlas, the definition of some relevant criteria to inputs in the system, the implementation of rules relating to underlying form with the surface form and, also, two system evaluation measures have been needed. The results have showed that the Potigrafone performance was 81% for the Exact Match Ratio measurement and 89% for the Labelling FScore, presenting thus, increased accuracy in total or partial correct attempts, when the transcript is made without stress markup and without the phonetic phenomena of nasality, the palatalization, the diphthongization, the monophthongization, the deletion, the epenthesis; another important result is that the consonant modules and the syllabic core also interfere with this performance, since the values with all modules and without these two modules are similar. The Potigrafone performs well during the phonetic transcription, but there are some occasional errors that have made necessary the creation of new rules to correct them and, consequently, help to improve the system performance, both in accuracy and in full and partial transcription match.CoordenaÃÃo de AperfeÃoamento de Pessoal de NÃvel Superior http://www.teses.ufc.br/tde_busca/arquivo.php?codArquivo=17295application/pdfinfo:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da UFCinstname:Universidade Federal do Cearáinstacron:UFC2019-01-21T11:30:39Zmail@mail.com -
dc.title.pt.fl_str_mv Transdutor de estados finitos para conversÃo de grafema para a pronÃncia da variedade linguÃstica potiguar
dc.title.alternative.en.fl_str_mv Finite state transducer for the grapheme conversion of the pronunciation in the potiguar linguistic variety
title Transdutor de estados finitos para conversÃo de grafema para a pronÃncia da variedade linguÃstica potiguar
spellingShingle Transdutor de estados finitos para conversÃo de grafema para a pronÃncia da variedade linguÃstica potiguar
Cid Ivan da Costa Carvalho
Potigrafone
Variedade LinguÃstica Potiguar
Atlas linguÃstico do Centro-Oeste potiguar
Atlas GeolinguÃstico do Litoral Potiguar
SAMPA
Potigrafone
Linguistic variety Potiguar
Atlas LinguÃstico do Centro-Oeste potiguar
Atlas GeolinguÃstico do Litoral Potiguar
SAMPA
LINGUISTICA APLICADA
title_short Transdutor de estados finitos para conversÃo de grafema para a pronÃncia da variedade linguÃstica potiguar
title_full Transdutor de estados finitos para conversÃo de grafema para a pronÃncia da variedade linguÃstica potiguar
title_fullStr Transdutor de estados finitos para conversÃo de grafema para a pronÃncia da variedade linguÃstica potiguar
title_full_unstemmed Transdutor de estados finitos para conversÃo de grafema para a pronÃncia da variedade linguÃstica potiguar
title_sort Transdutor de estados finitos para conversÃo de grafema para a pronÃncia da variedade linguÃstica potiguar
author Cid Ivan da Costa Carvalho
author_facet Cid Ivan da Costa Carvalho
author_role author
dc.contributor.advisor1.fl_str_mv Leonel Figueiredo de Alencar Araripe
dc.contributor.advisor1ID.fl_str_mv 30808545353
dc.contributor.referee1.fl_str_mv Maria Elias Soares
dc.contributor.referee1ID.fl_str_mv 02178761372
dc.contributor.referee1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/busca.do
dc.contributor.referee2.fl_str_mv Rosemeire Selma Monteiro
dc.contributor.referee2ID.fl_str_mv 93020473934
dc.contributor.referee3.fl_str_mv ElisÃngela Nogueira Teixeira
dc.contributor.referee3ID.fl_str_mv 61866458353
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/7609186549849417
dc.contributor.referee4.fl_str_mv VlÃdia CÃlia Monteiro Pinheiro
dc.contributor.referee4ID.fl_str_mv 35849487387
dc.contributor.referee4Lattes.fl_str_mv http://lattes.cnpq.br/2991281565518934
dc.contributor.authorID.fl_str_mv 02656413494
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/6728408490384241
dc.contributor.author.fl_str_mv Cid Ivan da Costa Carvalho
contributor_str_mv Leonel Figueiredo de Alencar Araripe
Maria Elias Soares
Rosemeire Selma Monteiro
ElisÃngela Nogueira Teixeira
VlÃdia CÃlia Monteiro Pinheiro
dc.subject.por.fl_str_mv Potigrafone
Variedade LinguÃstica Potiguar
Atlas linguÃstico do Centro-Oeste potiguar
Atlas GeolinguÃstico do Litoral Potiguar
SAMPA
topic Potigrafone
Variedade LinguÃstica Potiguar
Atlas linguÃstico do Centro-Oeste potiguar
Atlas GeolinguÃstico do Litoral Potiguar
SAMPA
Potigrafone
Linguistic variety Potiguar
Atlas LinguÃstico do Centro-Oeste potiguar
Atlas GeolinguÃstico do Litoral Potiguar
SAMPA
LINGUISTICA APLICADA
dc.subject.eng.fl_str_mv Potigrafone
Linguistic variety Potiguar
Atlas LinguÃstico do Centro-Oeste potiguar
Atlas GeolinguÃstico do Litoral Potiguar
SAMPA
dc.subject.cnpq.fl_str_mv LINGUISTICA APLICADA
dc.description.sponsorship.fl_txt_mv CoordenaÃÃo de AperfeÃoamento de Pessoal de NÃvel Superior
dc.description.abstract.por.fl_txt_mv O Potigrafone e um transdutor de estados finitos que faz a transcriÃÃo automÃtica das formas grÃficas da lÃngua portuguesa para as formas fonÃticas da variedade linguÃstica potiguar. Com o desenvolvimento desse sistema, conseguimos identificar e separar os padrÃes fonÃticos da variedade linguÃstica potiguar, atravÃs do Atlas linguÃstico do Centro-Oeste potiguar e no Atlas GeolinguÃstico do Litoral Potiguar; apresentar uma ferramenta de transcriÃÃo fonÃtica utilizando o alfabeto fonÃtico Speech Assessment Methods Phonetic Alphabet (SAMPA) e, alem disso, conseguimos avaliar o desempenho do sistema em corpus de textos escritos de lÃngua portuguesa por meio de duas medidas multinÃveis: Exact Match Ratio e Labelling Fscore. Para isso, foram atendidos passos fundamentais: primeiro, foram necessÃrias a identificaÃÃo e a separaÃÃo dos padrÃes fonolÃgicos presentes nas cartas fonÃticas dos Atlas supracitados; segundo, a definiÃÃo de alguns critÃrios pertinentes as entradas (inputs) do sistema; terceiro, a implementaÃÃo das regras que relacionam a forma subjacente com a forma superficial e; por Ãltimo, a escolha das duas medidas adequadas a avaliaÃÃo de um sistema que apresentava mais de uma forma de transcriÃÃo. Os resultados mostram que o desempenho do Potigrafone foi de 81% para a medida Exact Match Ratio e 89% para a medida Labelling FScore, apresentando, assim, boa performance na exatidÃo e nos acertos totais e parciais, no que se refere a transcriÃÃo sem a marcaÃÃo da silaba tÃnica e sem os fenÃmenos fonÃticos da nasalidade, da palatalizaÃÃo, da ditongaÃÃo, da monotongaÃÃo, do apagamento, da epÃntese; outro resultado importante e que os mÃdulos de consoantes e de nÃcleo silÃbico tambÃm interferem no desempenho, uma vez que os valores com todos os mÃdulos e sem esses dois mÃdulos se assemelham. O Potigrafone apresenta bom desempenho na transcriÃÃo fonÃtica, mas existem alguns erros pontuais que torna necessÃrio a constituiÃÃo de novas regras para corrigi-los e, consequentemente, melhorar o desempenho do sistema, tanto na exatidÃo quanto na correspondÃncia total e parcial da transcriÃÃo.
dc.description.abstract.eng.fl_txt_mv The Potigrafone is a finite-state transducer that automatically transcripts the graphic forms from the Portuguese language to the phonetic forms belonging to theâpotiguarâ linguistic variety. It was through the development of this system, by using of the Atlas LinguÃstico do Centro-Oeste Potiguar and to the Atlas GeolinguÃstico do Litoral Potiguar, that it has been possible to identify and separate the phonetic patterns in the linguistic variety belonging to the studied region, presenting a phonetic transcription tool while using the Speech Assessment Methods Phonetic Alphabet - SAMPA; and, in addition, a performance assessment in the corpus of written texts in Portuguese has been made through the use of two multi-level measures: Exact Match Ratio and Labelling Fscore. To do so, the identification and separation of phonological patterns present in the phonetic letters of Atlas, the definition of some relevant criteria to inputs in the system, the implementation of rules relating to underlying form with the surface form and, also, two system evaluation measures have been needed. The results have showed that the Potigrafone performance was 81% for the Exact Match Ratio measurement and 89% for the Labelling FScore, presenting thus, increased accuracy in total or partial correct attempts, when the transcript is made without stress markup and without the phonetic phenomena of nasality, the palatalization, the diphthongization, the monophthongization, the deletion, the epenthesis; another important result is that the consonant modules and the syllabic core also interfere with this performance, since the values with all modules and without these two modules are similar. The Potigrafone performs well during the phonetic transcription, but there are some occasional errors that have made necessary the creation of new rules to correct them and, consequently, help to improve the system performance, both in accuracy and in full and partial transcription match.
description O Potigrafone e um transdutor de estados finitos que faz a transcriÃÃo automÃtica das formas grÃficas da lÃngua portuguesa para as formas fonÃticas da variedade linguÃstica potiguar. Com o desenvolvimento desse sistema, conseguimos identificar e separar os padrÃes fonÃticos da variedade linguÃstica potiguar, atravÃs do Atlas linguÃstico do Centro-Oeste potiguar e no Atlas GeolinguÃstico do Litoral Potiguar; apresentar uma ferramenta de transcriÃÃo fonÃtica utilizando o alfabeto fonÃtico Speech Assessment Methods Phonetic Alphabet (SAMPA) e, alem disso, conseguimos avaliar o desempenho do sistema em corpus de textos escritos de lÃngua portuguesa por meio de duas medidas multinÃveis: Exact Match Ratio e Labelling Fscore. Para isso, foram atendidos passos fundamentais: primeiro, foram necessÃrias a identificaÃÃo e a separaÃÃo dos padrÃes fonolÃgicos presentes nas cartas fonÃticas dos Atlas supracitados; segundo, a definiÃÃo de alguns critÃrios pertinentes as entradas (inputs) do sistema; terceiro, a implementaÃÃo das regras que relacionam a forma subjacente com a forma superficial e; por Ãltimo, a escolha das duas medidas adequadas a avaliaÃÃo de um sistema que apresentava mais de uma forma de transcriÃÃo. Os resultados mostram que o desempenho do Potigrafone foi de 81% para a medida Exact Match Ratio e 89% para a medida Labelling FScore, apresentando, assim, boa performance na exatidÃo e nos acertos totais e parciais, no que se refere a transcriÃÃo sem a marcaÃÃo da silaba tÃnica e sem os fenÃmenos fonÃticos da nasalidade, da palatalizaÃÃo, da ditongaÃÃo, da monotongaÃÃo, do apagamento, da epÃntese; outro resultado importante e que os mÃdulos de consoantes e de nÃcleo silÃbico tambÃm interferem no desempenho, uma vez que os valores com todos os mÃdulos e sem esses dois mÃdulos se assemelham. O Potigrafone apresenta bom desempenho na transcriÃÃo fonÃtica, mas existem alguns erros pontuais que torna necessÃrio a constituiÃÃo de novas regras para corrigi-los e, consequentemente, melhorar o desempenho do sistema, tanto na exatidÃo quanto na correspondÃncia total e parcial da transcriÃÃo.
publishDate 2016
dc.date.issued.fl_str_mv 2016-05-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
status_str publishedVersion
format doctoralThesis
dc.identifier.uri.fl_str_mv http://www.teses.ufc.br/tde_busca/arquivo.php?codArquivo=17295
url http://www.teses.ufc.br/tde_busca/arquivo.php?codArquivo=17295
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do CearÃ
dc.publisher.program.fl_str_mv Programa de PÃs-GraduaÃÃo em LingÃÃstica
dc.publisher.initials.fl_str_mv UFC
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal do CearÃ
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFC
instname:Universidade Federal do Ceará
instacron:UFC
reponame_str Biblioteca Digital de Teses e Dissertações da UFC
collection Biblioteca Digital de Teses e Dissertações da UFC
instname_str Universidade Federal do Ceará
instacron_str UFC
institution UFC
repository.name.fl_str_mv -
repository.mail.fl_str_mv mail@mail.com
_version_ 1643295224144855040