Para a compilação do c-oral-angola: um corpus de fala espontânea informal do português angolano

Detalhes bibliográficos
Autor(a) principal: Bruno Rocha
Data de Publicação: 2019
Outros Autores: Heliana Mello, Tommaso Raso
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: https://doi.org/10.11606/issn.2176-9419.v20iEspecialp139-157
http://hdl.handle.net/1843/51388
https://orcid.org/0000-0002-3446-313X
https://orcid.org/0000-0003-0267-9005
Resumo: O trabalho apresenta a arquitetura e os critérios de compilação de um corpus de fala espontânea do português angolano. Após uma breve contextualização da realidade linguística de Angola, são apresentados em detalhe as modalidades de gravação e o tratamento das diferentes variações sociolinguísticas documentadas, destacando-se a atenção à variação diafásica. Em seguida, são detalhados os primeiros 27 textos gravados, que formarão um minicorpus de pelo menos 30.000 palavras, segmentado prosodicamente e oferecendo o texto alinhado ao sinal sonoro. A última parte do artigo é dedicada à discussão dos passos metodológicos da compilação do corpus: definição da qualidade acústica, critérios de transcrição, procedimento de segmentação prosódica, revisão, alinhamento e validação estatística.
id UFMG_9a6527731fbe36e184bded9f720e239f
oai_identifier_str oai:repositorio.ufmg.br:1843/51388
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling 2023-03-30T18:38:23Z2023-03-30T18:38:23Z201920Especial139157https://doi.org/10.11606/issn.2176-9419.v20iEspecialp139-15721769419http://hdl.handle.net/1843/51388https://orcid.org/0000-0002-3446-313Xhttps://orcid.org/0000-0003-0267-9005O trabalho apresenta a arquitetura e os critérios de compilação de um corpus de fala espontânea do português angolano. Após uma breve contextualização da realidade linguística de Angola, são apresentados em detalhe as modalidades de gravação e o tratamento das diferentes variações sociolinguísticas documentadas, destacando-se a atenção à variação diafásica. Em seguida, são detalhados os primeiros 27 textos gravados, que formarão um minicorpus de pelo menos 30.000 palavras, segmentado prosodicamente e oferecendo o texto alinhado ao sinal sonoro. A última parte do artigo é dedicada à discussão dos passos metodológicos da compilação do corpus: definição da qualidade acústica, critérios de transcrição, procedimento de segmentação prosódica, revisão, alinhamento e validação estatística.The paper introduces the architecture and compilation criteria for an Angolan Portuguese spontaneous speech corpus. After a brief introduction about the linguistic scenario in Angola, we present an in-depth description of the recording modalities and treatment related to the multiple sociolinguistic variations documented, with special attention to diaphasic variation. The first twenty-seven recorded texts are then detailed. These will make up a minicorpus, portraying at least 30,000 words. The minicorpus will be prosodically segmented and will display text-to-speech alignment. The last part of the article is dedicated to the methodological steps taken for the corpus compilation: acoustic quality definition, transcription criteria, prosodic segmentation procedures, revision, alignment and statistic validation.porUniversidade Federal de Minas GeraisUFMGBrasilFALE - FACULDADE DE LETRASFilologia e linguística portuguesaLinguística de corpusAngolaAtos de fala(linguística)Português angolanoFala espontâneaCorpusCompilaçãoPara a compilação do c-oral-angola: um corpus de fala espontânea informal do português angolanoToward the compilation of C-ORAL-ANGOLA: an informal spontaneous speech corpus of Angolan Portugueseinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articlehttps://www.revistas.usp.br/flp/article/view/150879Bruno RochaHeliana MelloTommaso Rasoapplication/pdfinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGLICENSELicense.txtLicense.txttext/plain; charset=utf-82042https://repositorio.ufmg.br/bitstream/1843/51388/1/License.txtfa505098d172de0bc8864fc1287ffe22MD51ORIGINALPara a compilação do C-ORAL-ANGOLA um corpus de fala espontânea informaldoportuguês angolano.pdfPara a compilação do C-ORAL-ANGOLA um corpus de fala espontânea informaldoportuguês angolano.pdfapplication/pdf940975https://repositorio.ufmg.br/bitstream/1843/51388/2/Para%20a%20compila%c3%a7%c3%a3o%20do%20C-ORAL-ANGOLA%20um%20corpus%20de%20fala%20espont%c3%a2nea%20informaldoportugu%c3%aas%20angolano.pdf8a22146a4891ebfdc990602e67e4242cMD521843/513882023-03-30 15:38:24.013oai:repositorio.ufmg.br:1843/51388TElDRU7vv71BIERFIERJU1RSSUJVSe+/ve+/vU8gTu+/vU8tRVhDTFVTSVZBIERPIFJFUE9TSVTvv71SSU8gSU5TVElUVUNJT05BTCBEQSBVRk1HCiAKCkNvbSBhIGFwcmVzZW50Ye+/ve+/vW8gZGVzdGEgbGljZW7vv71hLCB2b2Pvv70gKG8gYXV0b3IgKGVzKSBvdSBvIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yKSBjb25jZWRlIGFvIFJlcG9zaXTvv71yaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbu+/vW8gZXhjbHVzaXZvIGUgaXJyZXZvZ++/vXZlbCBkZSByZXByb2R1emlyIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNh77+977+9byAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0cu+/vW5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mg77+9dWRpbyBvdSB277+9ZGVvLgoKVm9j77+9IGRlY2xhcmEgcXVlIGNvbmhlY2UgYSBwb2zvv710aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2Pvv70gY29uY29yZGEgcXVlIG8gUmVwb3NpdO+/vXJpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250Ze+/vWRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNh77+977+9byBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHvv73vv71vLgoKVm9j77+9IHRhbWLvv71tIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTvv71yaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPvv71waWEgZGUgc3VhIHB1YmxpY2Hvv73vv71vIHBhcmEgZmlucyBkZSBzZWd1cmFu77+9YSwgYmFjay11cCBlIHByZXNlcnZh77+977+9by4KClZvY++/vSBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNh77+977+9byDvv70gb3JpZ2luYWwgZSBxdWUgdm9j77+9IHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vu77+9YS4gVm9j77+9IHRhbWLvv71tIGRlY2xhcmEgcXVlIG8gZGVw77+9c2l0byBkZSBzdWEgcHVibGljYe+/ve+/vW8gbu+/vW8sIHF1ZSBzZWphIGRlIHNldSBjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd177+9bS4KCkNhc28gYSBzdWEgcHVibGljYe+/ve+/vW8gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY++/vSBu77+9byBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2Pvv70gZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc++/vW8gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBSZXBvc2l077+9cmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7vv71hLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3Tvv70gY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250Ze+/vWRvIGRhIHB1YmxpY2Hvv73vv71vIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0Hvv73vv71PIE9SQSBERVBPU0lUQURBIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQ++/vU5JTyBPVSBBUE9JTyBERSBVTUEgQUfvv71OQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0Pvv70gREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklT77+9TyBDT01PIFRBTULvv71NIEFTIERFTUFJUyBPQlJJR0Hvv73vv71FUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l077+9cmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNh77+977+9bywgZSBu77+9byBmYXLvv70gcXVhbHF1ZXIgYWx0ZXJh77+977+9bywgYWzvv71tIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7vv71hLgo=Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2023-03-30T18:38:24Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Para a compilação do c-oral-angola: um corpus de fala espontânea informal do português angolano
dc.title.alternative.pt_BR.fl_str_mv Toward the compilation of C-ORAL-ANGOLA: an informal spontaneous speech corpus of Angolan Portuguese
title Para a compilação do c-oral-angola: um corpus de fala espontânea informal do português angolano
spellingShingle Para a compilação do c-oral-angola: um corpus de fala espontânea informal do português angolano
Bruno Rocha
Português angolano
Fala espontânea
Corpus
Compilação
Linguística de corpus
Angola
Atos de fala(linguística)
title_short Para a compilação do c-oral-angola: um corpus de fala espontânea informal do português angolano
title_full Para a compilação do c-oral-angola: um corpus de fala espontânea informal do português angolano
title_fullStr Para a compilação do c-oral-angola: um corpus de fala espontânea informal do português angolano
title_full_unstemmed Para a compilação do c-oral-angola: um corpus de fala espontânea informal do português angolano
title_sort Para a compilação do c-oral-angola: um corpus de fala espontânea informal do português angolano
author Bruno Rocha
author_facet Bruno Rocha
Heliana Mello
Tommaso Raso
author_role author
author2 Heliana Mello
Tommaso Raso
author2_role author
author
dc.contributor.author.fl_str_mv Bruno Rocha
Heliana Mello
Tommaso Raso
dc.subject.por.fl_str_mv Português angolano
Fala espontânea
Corpus
Compilação
topic Português angolano
Fala espontânea
Corpus
Compilação
Linguística de corpus
Angola
Atos de fala(linguística)
dc.subject.other.pt_BR.fl_str_mv Linguística de corpus
Angola
Atos de fala(linguística)
description O trabalho apresenta a arquitetura e os critérios de compilação de um corpus de fala espontânea do português angolano. Após uma breve contextualização da realidade linguística de Angola, são apresentados em detalhe as modalidades de gravação e o tratamento das diferentes variações sociolinguísticas documentadas, destacando-se a atenção à variação diafásica. Em seguida, são detalhados os primeiros 27 textos gravados, que formarão um minicorpus de pelo menos 30.000 palavras, segmentado prosodicamente e oferecendo o texto alinhado ao sinal sonoro. A última parte do artigo é dedicada à discussão dos passos metodológicos da compilação do corpus: definição da qualidade acústica, critérios de transcrição, procedimento de segmentação prosódica, revisão, alinhamento e validação estatística.
publishDate 2019
dc.date.issued.fl_str_mv 2019
dc.date.accessioned.fl_str_mv 2023-03-30T18:38:23Z
dc.date.available.fl_str_mv 2023-03-30T18:38:23Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/51388
dc.identifier.doi.pt_BR.fl_str_mv https://doi.org/10.11606/issn.2176-9419.v20iEspecialp139-157
dc.identifier.issn.pt_BR.fl_str_mv 21769419
dc.identifier.orcid.pt_BR.fl_str_mv https://orcid.org/0000-0002-3446-313X
https://orcid.org/0000-0003-0267-9005
url https://doi.org/10.11606/issn.2176-9419.v20iEspecialp139-157
http://hdl.handle.net/1843/51388
https://orcid.org/0000-0002-3446-313X
https://orcid.org/0000-0003-0267-9005
identifier_str_mv 21769419
dc.language.iso.fl_str_mv por
language por
dc.relation.ispartof.pt_BR.fl_str_mv Filologia e linguística portuguesa
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv FALE - FACULDADE DE LETRAS
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/51388/1/License.txt
https://repositorio.ufmg.br/bitstream/1843/51388/2/Para%20a%20compila%c3%a7%c3%a3o%20do%20C-ORAL-ANGOLA%20um%20corpus%20de%20fala%20espont%c3%a2nea%20informaldoportugu%c3%aas%20angolano.pdf
bitstream.checksum.fl_str_mv fa505098d172de0bc8864fc1287ffe22
8a22146a4891ebfdc990602e67e4242c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589280524664832