O C-ORAL-BRASIL e o estudo da fala informal: um novo olhar sobre o tópico no português brasileiro

Detalhes bibliográficos
Autor(a) principal: Maryuale Malvessi Mittmann
Data de Publicação: 2012
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/LETR-97YMKT
Resumo: Este trabalho trata da estrutura informacional da variedade mineira do PB falado, com enfoque no Tópico, a partir de um corpus de fala informal, o C-ORAL-BRASIL. São dois os objetivos gerais: (I) Contribuir com o projeto C-ORAL-BRASIL, através da gravação de sessões de fala espontânea (diálogos, conversações e onólogos), transcrição, segmentação, alinhamento, etiquetagem e validação da seção informal do corpus. (II) Contribuir com estudo da estrutura informacional do português brasileiro falado, através da investigação das características do Tópico. A perspectiva que fundamenta a pesquisa é a da Teoria da Língua em Ato (TLA). A TLA entende que o ato de fala é a atividade fundamental da comunicação, e que o enunciado é a sua realização linguística, devendo ser tomado como unidade de referência para o estudo da fala espontânea. Enunciados são delimitados no fluxo da fala através de fronteiras prosódicas que os falantes percebem comoconclusivas (terminais); podem ser constituídos de uma ou mais unidades entonacionais. No último caso, as unidades menores são delimitadas por fronteiras prosódicas que os falantes percebem como não conclusivas (não terminais). A segmentação prosódica da fala é a base para a estruturação informacional: unidades do padrão prosódico correspondem a unidades do padrão informacional. As unidades mais importantes de um padrão informacional são o Comentário e o Tópico (há outras, que cumprem funções de natureza textual ou dialógica). O Comentário é a unidade mínima necessária de um padrão informacional, pois veicula a força ilocucionária, sendo suficiente para formar um ato de fala. O Tópico tem a função de delimitar o domínio dereferência em relação ao qual a ilocução expressa no Comentário deve ser interpretada. O corpus de pesquisa utilizado neste trabalho, o C-ORAL-BRASIL informal, foi construído de modo a permitir o estudo da estrutura informacional da fala a partir da sua segmentação prosódica.As transcrições das sessões de fala espontânea gravadas foram segmentadas prosodicamente, assinalando as fronteiras prosódicas de tipo terminal e não terminal. Como parte do objetivo geral (I), realizou-se a validação estatística desta anotação prosódica do corpus, através da verificação do acordo entre anotadores através do teste Kappa. O resultado mostrou um acordo geral de 0.9 na anotação das fronteiras de tipo terminal e de 0.7 para as fronteiras não terminais, um resultado de grande relevância estatística. Para cumprir o objetivo (II), um subcorpus foi extraído do C-ORAL-BRASIL e cada unidade entonacional recebeu etiquetagem da função informacional, de acordo com as unidades propostas pela TLA. Verificou-se que a estrutura informacional da fala será mais ou menos complexa dependendo do tipo de situação comunicativa. Quando a interação entre os participantes é pouco ancorada no contexto imediato, os enunciados tendem a ser mais complexos, e há maior ocorrência do Tópico. O Tópico é mais comumente realizado através de um sintagma nominal (39,5%) ou verbal (37,7%). No primeiro caso, o SN é tipicamente preenchido por substantivos, mas há uma forte predominância do uso de pronomes demonstrativos em diálogos, e pronomes pessoais em monólogos. No segundo caso, há um uso predominante de sintagmas verbais que expressam situações hipotéticas em conversações e diálogos, enquanto nos monólogos é mais relevante que o Tópico delimite o domínio temporal, através de SV temporais. Quanto às propriedades prosódicas, o Tópico pode ser executado em PB com quatro diferentes formas prosódicas (tipos 1, 2, 3 e 4), sendo o Tipo 2 o mais comum (47%) e o Tipo 3 o mais raro (5%). De modo geral, esta pesquisa ofereceu uma nova perspectiva para o estudo da fala, evidenciando o uso de novos métodos que possibilitam o aprofundamento do conhecimento sobre a organização da informação na língua falada e de como o contexto influencia o uso de estruturas linguísticas específicas.
id UFMG_6f80543ed3b4beefdda0cb761a6ad5a3
oai_identifier_str oai:repositorio.ufmg.br:1843/LETR-97YMKT
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Tommaso RasoHeliana Ribeiro de MelloMaria Elizabeth Fonseca SaraivaGabriel de Avila OtheroJoao Antonio de MoraesMaryuale Malvessi Mittmann2019-08-09T16:54:36Z2019-08-09T16:54:36Z2012-09-24http://hdl.handle.net/1843/LETR-97YMKTEste trabalho trata da estrutura informacional da variedade mineira do PB falado, com enfoque no Tópico, a partir de um corpus de fala informal, o C-ORAL-BRASIL. São dois os objetivos gerais: (I) Contribuir com o projeto C-ORAL-BRASIL, através da gravação de sessões de fala espontânea (diálogos, conversações e onólogos), transcrição, segmentação, alinhamento, etiquetagem e validação da seção informal do corpus. (II) Contribuir com estudo da estrutura informacional do português brasileiro falado, através da investigação das características do Tópico. A perspectiva que fundamenta a pesquisa é a da Teoria da Língua em Ato (TLA). A TLA entende que o ato de fala é a atividade fundamental da comunicação, e que o enunciado é a sua realização linguística, devendo ser tomado como unidade de referência para o estudo da fala espontânea. Enunciados são delimitados no fluxo da fala através de fronteiras prosódicas que os falantes percebem comoconclusivas (terminais); podem ser constituídos de uma ou mais unidades entonacionais. No último caso, as unidades menores são delimitadas por fronteiras prosódicas que os falantes percebem como não conclusivas (não terminais). A segmentação prosódica da fala é a base para a estruturação informacional: unidades do padrão prosódico correspondem a unidades do padrão informacional. As unidades mais importantes de um padrão informacional são o Comentário e o Tópico (há outras, que cumprem funções de natureza textual ou dialógica). O Comentário é a unidade mínima necessária de um padrão informacional, pois veicula a força ilocucionária, sendo suficiente para formar um ato de fala. O Tópico tem a função de delimitar o domínio dereferência em relação ao qual a ilocução expressa no Comentário deve ser interpretada. O corpus de pesquisa utilizado neste trabalho, o C-ORAL-BRASIL informal, foi construído de modo a permitir o estudo da estrutura informacional da fala a partir da sua segmentação prosódica.As transcrições das sessões de fala espontânea gravadas foram segmentadas prosodicamente, assinalando as fronteiras prosódicas de tipo terminal e não terminal. Como parte do objetivo geral (I), realizou-se a validação estatística desta anotação prosódica do corpus, através da verificação do acordo entre anotadores através do teste Kappa. O resultado mostrou um acordo geral de 0.9 na anotação das fronteiras de tipo terminal e de 0.7 para as fronteiras não terminais, um resultado de grande relevância estatística. Para cumprir o objetivo (II), um subcorpus foi extraído do C-ORAL-BRASIL e cada unidade entonacional recebeu etiquetagem da função informacional, de acordo com as unidades propostas pela TLA. Verificou-se que a estrutura informacional da fala será mais ou menos complexa dependendo do tipo de situação comunicativa. Quando a interação entre os participantes é pouco ancorada no contexto imediato, os enunciados tendem a ser mais complexos, e há maior ocorrência do Tópico. O Tópico é mais comumente realizado através de um sintagma nominal (39,5%) ou verbal (37,7%). No primeiro caso, o SN é tipicamente preenchido por substantivos, mas há uma forte predominância do uso de pronomes demonstrativos em diálogos, e pronomes pessoais em monólogos. No segundo caso, há um uso predominante de sintagmas verbais que expressam situações hipotéticas em conversações e diálogos, enquanto nos monólogos é mais relevante que o Tópico delimite o domínio temporal, através de SV temporais. Quanto às propriedades prosódicas, o Tópico pode ser executado em PB com quatro diferentes formas prosódicas (tipos 1, 2, 3 e 4), sendo o Tipo 2 o mais comum (47%) e o Tipo 3 o mais raro (5%). De modo geral, esta pesquisa ofereceu uma nova perspectiva para o estudo da fala, evidenciando o uso de novos métodos que possibilitam o aprofundamento do conhecimento sobre a organização da informação na língua falada e de como o contexto influencia o uso de estruturas linguísticas específicas.This work addresses the information structure of the of the Minas Gerais variety of spoken Brazilian Portuguese (BP), focusing on Topic (TOP), based on the C-ORAL-BRASIL informal speech corpus. The general goals are two: (I) To contribute to the project C-ORALBRASILby recording sessions of spontaneous speech, by transcribing and segmenting, by performing text-to-speech alignment, by tagging and, more importantly, by validating the informal section of the corpus. (II) To contribute to the study of informational structure of spoken BP through the investigation of characteristics of the TOP. The perspective thatunderlies the research is the Theory of Language into Act (L-Act). According to L-Act, the speech act is the fundamental communication activity and the utterance is its linguistic realization, therefore, the utterance is the reference unit for the study of spontaneousspeech. Utterances are delimited in the speech flow by prosodic boundaries that speakers perceive as conclusive (terminal); it may consist of one or more intonational units. In the latter case, the smaller units are delimited by prosodic boundaries that speakers perceive asnon conclusive (non-terminal). Prosodic parsing is the basis for structuring speech: prosodic units correspond to information units. The more important units of an information pattern are Comment (COM) and Topic (there are others, fulfilling textual or dialogic functions). The COM is the single unit necessary to form an information pattern,because it conveys the illocutionary force, being sufficient to perform a speech act. The TOP has the function of defining the domain of reference in which the illocution expressed in the COM must be interpreted. Regarding the research corpus, this work contributed to thecompilation of the informal C-ORAL-BRASIL. The spontaneous speech transcriptions of the recorded sessions were prosodically segmented, marking the prosodic boundaries of terminal and non-terminal types. As part of the overall goal (I), a statistical validation of this prosodic annotation was conducted, by checking the agreement between annotators through the Kappa test. The results showed a general agreement of 0.9 on the annotation of terminal boundaries and 0.7 for non terminal boundaries, a result of great statistical relevance. To fulfill the objective (II), a subcorpus of C-ORAL-BRASIL was extracted and eachunit received intonational tagging regarding its information function according to the L-Act categories. It was found that the information structure of speech will be more or less complex depending on the communicative situation. When the interaction amongparticipants is less anchored in immediate context, utterances tend to be more complex, with more occurrences of TOP. The TOP is most commonly accomplished through a noun (39.5%) or verb (37.7%) phrase. In the first case, the NP is typically filled by nouns and itsdeterminers, but there is a high occurrence of demonstrative pronouns in dialogues, and personal pronouns in monologues. In the second case, there is a predominant use of VP to express hypothetical situations in conversations and dialogues, while in monologues it is more relevant that the TOP delimits a temporal domain of reference. As for the prosodicproperties, TOP on BP can be performed with four different prosodic forms (types 1, 2, 3 and 4), with type 2 been the most common (47%) and type 3 the rarest (5%). Overall, this study provided a new perspective to the study of speech, emphasizing the use of new methodsthat enable a deeper understanding about the organization of information in spoken language and how context influences the use of specific linguistic structures.Universidade Federal de Minas GeraisUFMGAnálise prosódica (Linguística)LingüísticaLíngua portuguesa Português falado BrasilAtos de fala (Lingüística)EnunciaçãoLinguística de corpusPortuguês BrasileiroC-ORAL-BRASILO C-ORAL-BRASIL e o estudo da fala informal: um novo olhar sobre o tópico no português brasileiroinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALmittmann_2012_.pdfapplication/pdf14469741https://repositorio.ufmg.br/bitstream/1843/LETR-97YMKT/1/mittmann_2012_.pdf249a1be7007582ed8679066ab3af517eMD51TEXTmittmann_2012_.pdf.txtmittmann_2012_.pdf.txtExtracted texttext/plain515372https://repositorio.ufmg.br/bitstream/1843/LETR-97YMKT/2/mittmann_2012_.pdf.txtc9e290e95e649f29e8811d4690389baeMD521843/LETR-97YMKT2019-11-14 07:34:56.728oai:repositorio.ufmg.br:1843/LETR-97YMKTRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T10:34:56Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv O C-ORAL-BRASIL e o estudo da fala informal: um novo olhar sobre o tópico no português brasileiro
title O C-ORAL-BRASIL e o estudo da fala informal: um novo olhar sobre o tópico no português brasileiro
spellingShingle O C-ORAL-BRASIL e o estudo da fala informal: um novo olhar sobre o tópico no português brasileiro
Maryuale Malvessi Mittmann
Português Brasileiro
C-ORAL-BRASIL
Análise prosódica (Linguística)
Lingüística
Língua portuguesa Português falado Brasil
Atos de fala (Lingüística)
Enunciação
Linguística de corpus
title_short O C-ORAL-BRASIL e o estudo da fala informal: um novo olhar sobre o tópico no português brasileiro
title_full O C-ORAL-BRASIL e o estudo da fala informal: um novo olhar sobre o tópico no português brasileiro
title_fullStr O C-ORAL-BRASIL e o estudo da fala informal: um novo olhar sobre o tópico no português brasileiro
title_full_unstemmed O C-ORAL-BRASIL e o estudo da fala informal: um novo olhar sobre o tópico no português brasileiro
title_sort O C-ORAL-BRASIL e o estudo da fala informal: um novo olhar sobre o tópico no português brasileiro
author Maryuale Malvessi Mittmann
author_facet Maryuale Malvessi Mittmann
author_role author
dc.contributor.advisor1.fl_str_mv Tommaso Raso
dc.contributor.referee1.fl_str_mv Heliana Ribeiro de Mello
dc.contributor.referee2.fl_str_mv Maria Elizabeth Fonseca Saraiva
dc.contributor.referee3.fl_str_mv Gabriel de Avila Othero
dc.contributor.referee4.fl_str_mv Joao Antonio de Moraes
dc.contributor.author.fl_str_mv Maryuale Malvessi Mittmann
contributor_str_mv Tommaso Raso
Heliana Ribeiro de Mello
Maria Elizabeth Fonseca Saraiva
Gabriel de Avila Othero
Joao Antonio de Moraes
dc.subject.por.fl_str_mv Português Brasileiro
C-ORAL-BRASIL
topic Português Brasileiro
C-ORAL-BRASIL
Análise prosódica (Linguística)
Lingüística
Língua portuguesa Português falado Brasil
Atos de fala (Lingüística)
Enunciação
Linguística de corpus
dc.subject.other.pt_BR.fl_str_mv Análise prosódica (Linguística)
Lingüística
Língua portuguesa Português falado Brasil
Atos de fala (Lingüística)
Enunciação
Linguística de corpus
description Este trabalho trata da estrutura informacional da variedade mineira do PB falado, com enfoque no Tópico, a partir de um corpus de fala informal, o C-ORAL-BRASIL. São dois os objetivos gerais: (I) Contribuir com o projeto C-ORAL-BRASIL, através da gravação de sessões de fala espontânea (diálogos, conversações e onólogos), transcrição, segmentação, alinhamento, etiquetagem e validação da seção informal do corpus. (II) Contribuir com estudo da estrutura informacional do português brasileiro falado, através da investigação das características do Tópico. A perspectiva que fundamenta a pesquisa é a da Teoria da Língua em Ato (TLA). A TLA entende que o ato de fala é a atividade fundamental da comunicação, e que o enunciado é a sua realização linguística, devendo ser tomado como unidade de referência para o estudo da fala espontânea. Enunciados são delimitados no fluxo da fala através de fronteiras prosódicas que os falantes percebem comoconclusivas (terminais); podem ser constituídos de uma ou mais unidades entonacionais. No último caso, as unidades menores são delimitadas por fronteiras prosódicas que os falantes percebem como não conclusivas (não terminais). A segmentação prosódica da fala é a base para a estruturação informacional: unidades do padrão prosódico correspondem a unidades do padrão informacional. As unidades mais importantes de um padrão informacional são o Comentário e o Tópico (há outras, que cumprem funções de natureza textual ou dialógica). O Comentário é a unidade mínima necessária de um padrão informacional, pois veicula a força ilocucionária, sendo suficiente para formar um ato de fala. O Tópico tem a função de delimitar o domínio dereferência em relação ao qual a ilocução expressa no Comentário deve ser interpretada. O corpus de pesquisa utilizado neste trabalho, o C-ORAL-BRASIL informal, foi construído de modo a permitir o estudo da estrutura informacional da fala a partir da sua segmentação prosódica.As transcrições das sessões de fala espontânea gravadas foram segmentadas prosodicamente, assinalando as fronteiras prosódicas de tipo terminal e não terminal. Como parte do objetivo geral (I), realizou-se a validação estatística desta anotação prosódica do corpus, através da verificação do acordo entre anotadores através do teste Kappa. O resultado mostrou um acordo geral de 0.9 na anotação das fronteiras de tipo terminal e de 0.7 para as fronteiras não terminais, um resultado de grande relevância estatística. Para cumprir o objetivo (II), um subcorpus foi extraído do C-ORAL-BRASIL e cada unidade entonacional recebeu etiquetagem da função informacional, de acordo com as unidades propostas pela TLA. Verificou-se que a estrutura informacional da fala será mais ou menos complexa dependendo do tipo de situação comunicativa. Quando a interação entre os participantes é pouco ancorada no contexto imediato, os enunciados tendem a ser mais complexos, e há maior ocorrência do Tópico. O Tópico é mais comumente realizado através de um sintagma nominal (39,5%) ou verbal (37,7%). No primeiro caso, o SN é tipicamente preenchido por substantivos, mas há uma forte predominância do uso de pronomes demonstrativos em diálogos, e pronomes pessoais em monólogos. No segundo caso, há um uso predominante de sintagmas verbais que expressam situações hipotéticas em conversações e diálogos, enquanto nos monólogos é mais relevante que o Tópico delimite o domínio temporal, através de SV temporais. Quanto às propriedades prosódicas, o Tópico pode ser executado em PB com quatro diferentes formas prosódicas (tipos 1, 2, 3 e 4), sendo o Tipo 2 o mais comum (47%) e o Tipo 3 o mais raro (5%). De modo geral, esta pesquisa ofereceu uma nova perspectiva para o estudo da fala, evidenciando o uso de novos métodos que possibilitam o aprofundamento do conhecimento sobre a organização da informação na língua falada e de como o contexto influencia o uso de estruturas linguísticas específicas.
publishDate 2012
dc.date.issued.fl_str_mv 2012-09-24
dc.date.accessioned.fl_str_mv 2019-08-09T16:54:36Z
dc.date.available.fl_str_mv 2019-08-09T16:54:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/LETR-97YMKT
url http://hdl.handle.net/1843/LETR-97YMKT
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/LETR-97YMKT/1/mittmann_2012_.pdf
https://repositorio.ufmg.br/bitstream/1843/LETR-97YMKT/2/mittmann_2012_.pdf.txt
bitstream.checksum.fl_str_mv 249a1be7007582ed8679066ab3af517e
c9e290e95e649f29e8811d4690389bae
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589562261307392