Truncamento em corpus do português brasileiro : descrição, análise e investigação experimental

Detalhes bibliográficos
Autor(a) principal: Heineck, Débora
Data de Publicação: 2023
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/266197
Resumo: Este trabalho tem por objetivo descrever o funcionamento do processo de truncamento no português brasileiro, delimitar suas regularidades e, consequentemente, dar continuidade a estudos a respeito do processo. Pretendemos contribuir para estudos sobre o papel de fatores fonológicos e morfológicos e da frequência lexical para o processo, bem como para a discussão sobre como se dá o processamento morfológico de processos como o truncamento. Para tanto, foi realizado um levantamento de dados a partir de estudos anteriores sobre o fenômeno (ARAÚJO, 2002; VILELA, GODOY & SILVA, 2006; SCHER, 2011; BELCHOR, 2014; SCHER, 2018), dos resultados obtidos em Heineck (2018) e do registro de dados de redes sociais, programas de televisão, entre outros. Esses dados foram organizados e decodificados a partir de critérios fonológicos e morfológicos, como acento e o número de sílabas, foi registrada a frequência no Corpus do Português (subcorpus Web/Dialects) da forma truncada e de sua palavra-base e foram acrescentados exemplos de uso de cada dado. O nosso corpus de dados de truncamento conta com 239 itens no total. Os dados de Heineck (2018) foram submetidos a uma análise descritiva e inferencial com o objetivo de observar o papel do número de sílabas para o processo do truncamento. Os resultados apontaram para uma tendência de as formas truncadas serem maiores quando há um aumento no número de sílabas da palavra-base. Esse resultado confirma os resultados de Heineck (2018) e corrobora o padrão encontrado por Martini (2010) na formação de truncamentos: palavras dissílabas geralmente formam truncamentos também dissílabos, palavras trissílabas geralmente formam truncamentos dissílabos e palavras polissílabas tendem a formar truncamentos trissílabos. De modo a investigar o papel da frequência lexical no processo de truncamento, o número de ocorrência de dados dos experimentos realizados por Heineck (2018) foi verificada na rede social Twitter. Os resultados da busca realizada no Twitter parecem confirmar algumas de nossas hipóteses: (a) os falantes conseguem recuperar a palavra-base mesmo de truncamentos frequentes na língua e (b) os dados mais frequentes nos experimentos realizados na Dissertação de Mestrado são também os mais frequentes na busca no Twitter, o que levanta a suposição de que os falantes já conhecessem essas formas. Por fim, a frequência dos diminutivos de foto e moto aponta para um resultado diferente ao encontrado nos experimentos, mas segue tendência mais geral encontrada para outros dados nos experimentos. Ao formar o diminutivo de uma forma truncada, os falantes parecem escolher entre as vogais finais a ou o de acordo com o gênero da palavra-base, independente da vogal final da forma truncada. Todos os 239 dados que compõem o nosso corpus foram verificados quanto a sua frequência de ocorrência no Corpus do Português (subcorpus Web/Dialects) e o resultado desta busca foi comparada com os resultados do estudo com dados do Twitter. Verificamos que os truncamentos mais frequentes do nosso corpus tinham como base palavras frequentes, mas algumas das palavras-base mais frequentes desse corpus têm formas truncadas com poucas ou até zero ocorrências. Pudemos inferir, nesse sentido, que truncamentos frequentes parecem ter origem em palavras também frequentes, mas que nem toda palavra muito frequente irá gerar truncamentos frequentes. Na comparação com os resultados de Heineck (2021) com os resultados da busca no Web/Dialects, verificamos que alguns dos dados mais frequentes no Twitter não eram frequentes no Web/Dialects. Isso pode ocorrer, pois o Twitter é um ambiente mais informal e mais propício para o uso de formas como o truncamento do que os sites que compõe o banco de dados do Web/Dialects. Para contribuir com a discussão sobre processamento morfológico do truncamento, desenvolvemos uma tarefa de decisão lexical com priming, em que avaliamos o índice de acertos e o tempo de reação nas respostas de 62 falantes de português brasileiros para os estímulos apresentados. Avaliamos a influência de variáveis como acento, número de sílabas e a relação entre prime e alvo. O experimento era composto de 60 truncamentos e 30 não palavras, que serviam como itens distratores. O experimento foi dividido em três listas e aplicado na plataforma Psytoolkit 3.3.4. As variáveis previsoras analisadas — relação entre prime e alvo, características morfofonológicas da base e do truncamento — não apresentaram diferenças significativas quanto ao índice de acertos. Em relação ao tempo de reação, a análise confirmou que o tempo de reação é menor quando há relação entre palavra-base e o truncamento. Isso parece confirmar que o processamento da forma truncada é mais rápido quando o falante o relaciona com sua palavra-base. As características morfofonológicas tanto da palavra-base quanto do truncamento não apresentaram diferenças significativas em relação ao tempo de reação. É importante salientar, no entanto, que os dados apresentaram distribuição não normal e, portanto, não foi possível aplicar testes paramétricos em nossa análise. Nessa perspectiva, não se descarta encontrar condicionamento das variáveis morfofonológicas, para as quais não se identificou papel significativo neste estudo.
id URGS_ca62bac5a91a697304f36e1fde7681f9
oai_identifier_str oai:www.lume.ufrgs.br:10183/266197
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Heineck, DéboraSchwindt, Luiz Carlos da Silva2023-10-24T03:34:17Z2023http://hdl.handle.net/10183/266197001177858Este trabalho tem por objetivo descrever o funcionamento do processo de truncamento no português brasileiro, delimitar suas regularidades e, consequentemente, dar continuidade a estudos a respeito do processo. Pretendemos contribuir para estudos sobre o papel de fatores fonológicos e morfológicos e da frequência lexical para o processo, bem como para a discussão sobre como se dá o processamento morfológico de processos como o truncamento. Para tanto, foi realizado um levantamento de dados a partir de estudos anteriores sobre o fenômeno (ARAÚJO, 2002; VILELA, GODOY & SILVA, 2006; SCHER, 2011; BELCHOR, 2014; SCHER, 2018), dos resultados obtidos em Heineck (2018) e do registro de dados de redes sociais, programas de televisão, entre outros. Esses dados foram organizados e decodificados a partir de critérios fonológicos e morfológicos, como acento e o número de sílabas, foi registrada a frequência no Corpus do Português (subcorpus Web/Dialects) da forma truncada e de sua palavra-base e foram acrescentados exemplos de uso de cada dado. O nosso corpus de dados de truncamento conta com 239 itens no total. Os dados de Heineck (2018) foram submetidos a uma análise descritiva e inferencial com o objetivo de observar o papel do número de sílabas para o processo do truncamento. Os resultados apontaram para uma tendência de as formas truncadas serem maiores quando há um aumento no número de sílabas da palavra-base. Esse resultado confirma os resultados de Heineck (2018) e corrobora o padrão encontrado por Martini (2010) na formação de truncamentos: palavras dissílabas geralmente formam truncamentos também dissílabos, palavras trissílabas geralmente formam truncamentos dissílabos e palavras polissílabas tendem a formar truncamentos trissílabos. De modo a investigar o papel da frequência lexical no processo de truncamento, o número de ocorrência de dados dos experimentos realizados por Heineck (2018) foi verificada na rede social Twitter. Os resultados da busca realizada no Twitter parecem confirmar algumas de nossas hipóteses: (a) os falantes conseguem recuperar a palavra-base mesmo de truncamentos frequentes na língua e (b) os dados mais frequentes nos experimentos realizados na Dissertação de Mestrado são também os mais frequentes na busca no Twitter, o que levanta a suposição de que os falantes já conhecessem essas formas. Por fim, a frequência dos diminutivos de foto e moto aponta para um resultado diferente ao encontrado nos experimentos, mas segue tendência mais geral encontrada para outros dados nos experimentos. Ao formar o diminutivo de uma forma truncada, os falantes parecem escolher entre as vogais finais a ou o de acordo com o gênero da palavra-base, independente da vogal final da forma truncada. Todos os 239 dados que compõem o nosso corpus foram verificados quanto a sua frequência de ocorrência no Corpus do Português (subcorpus Web/Dialects) e o resultado desta busca foi comparada com os resultados do estudo com dados do Twitter. Verificamos que os truncamentos mais frequentes do nosso corpus tinham como base palavras frequentes, mas algumas das palavras-base mais frequentes desse corpus têm formas truncadas com poucas ou até zero ocorrências. Pudemos inferir, nesse sentido, que truncamentos frequentes parecem ter origem em palavras também frequentes, mas que nem toda palavra muito frequente irá gerar truncamentos frequentes. Na comparação com os resultados de Heineck (2021) com os resultados da busca no Web/Dialects, verificamos que alguns dos dados mais frequentes no Twitter não eram frequentes no Web/Dialects. Isso pode ocorrer, pois o Twitter é um ambiente mais informal e mais propício para o uso de formas como o truncamento do que os sites que compõe o banco de dados do Web/Dialects. Para contribuir com a discussão sobre processamento morfológico do truncamento, desenvolvemos uma tarefa de decisão lexical com priming, em que avaliamos o índice de acertos e o tempo de reação nas respostas de 62 falantes de português brasileiros para os estímulos apresentados. Avaliamos a influência de variáveis como acento, número de sílabas e a relação entre prime e alvo. O experimento era composto de 60 truncamentos e 30 não palavras, que serviam como itens distratores. O experimento foi dividido em três listas e aplicado na plataforma Psytoolkit 3.3.4. As variáveis previsoras analisadas — relação entre prime e alvo, características morfofonológicas da base e do truncamento — não apresentaram diferenças significativas quanto ao índice de acertos. Em relação ao tempo de reação, a análise confirmou que o tempo de reação é menor quando há relação entre palavra-base e o truncamento. Isso parece confirmar que o processamento da forma truncada é mais rápido quando o falante o relaciona com sua palavra-base. As características morfofonológicas tanto da palavra-base quanto do truncamento não apresentaram diferenças significativas em relação ao tempo de reação. É importante salientar, no entanto, que os dados apresentaram distribuição não normal e, portanto, não foi possível aplicar testes paramétricos em nossa análise. Nessa perspectiva, não se descarta encontrar condicionamento das variáveis morfofonológicas, para as quais não se identificou papel significativo neste estudo.This work aims to describe the operation of the truncation process in Brazilian Portuguese, delimit its regularities and, consequently, continue studies on the process. We intend to contribute to studies on the role of phonological and morphological factors and lexical frequency for the process, as well as to the discussion about how the morphological processing of processes such as truncation takes place. To do that, a data collection was carried out from previous studies on the phenomenon (ARAÚJO, 2002; VILELA, GODOY & SILVA, 2006; SCHER, 2011; BELCHOR, 2014; SCHER, 2018), from the results obtained in Heineck (2018 ) and from the registration of data from social networks, television programs, among others. These data were organized and decoded based on phonological and morphological criteria, such as word stress and the number of syllables. The frequency in the Corpus do Português (subcorpus Web/Dialects) of the truncated form and its base word and examples of use of each data were registered. Our corpus of truncation data has 239 items in total. Heineck's (2018) data were subjected to a descriptive and inferential analysis in order to observe the role of the number of syllables in the truncation process. The results pointed to a tendency for the truncated forms to be larger when there is an increase in the number of syllables in the base word. This result confirms the results of Heineck (2018) and corroborates the pattern found by Martini (2010) in the formation of truncations: disyllable words generally form disyllable truncations, trisyllable words generally form disyllable truncations, and polysyllable words tend to form trisyllable truncations. In order to investigate the role of lexical frequency in the truncation process, the number of data occurrence of the experiments carried out by Heineck (2018) was verified on the social network Twitter. The results of the search performed on Twitter seem to confirm some of our hypotheses: (a) the speakers can recover the base word even from frequent truncations in the language and (b) the most frequent data in the experiments carried out in the Master's Thesis are also the most frequent in the search on Twitter, which raises the assumption that the speakers already knew these forms. Finally, the frequency of the diminutives of foto and moto points to a different result to that found in the experiments but follows a more general trend found for other data in the experiments. When forming the diminutive of a truncated form, speakers seem to choose between the final vowels a or o according to the gender of the base word, regardless of the final vowel of the truncated form. To contribute to the discussion on the morphological processing of truncation, we developed a lexical decision task with priming, in which we evaluated the rate of correct answers and reaction time in the responses of 62 Brazilian Portuguese speakers to the stimuli presented. We evaluated the influence of variables such as word stress, number of syllables and the relationship between prime and target. The experiment was composed of 60 truncated words and 30 non-words, which served as distracting items. The experiment was divided into three lists and applied on the Psytoolkit 3.3.4 platform. The predictive variables analyzed — relationship between prime and target, morphophonological characteristics of the base and of the truncated word — did not present significant differences regarding the rate of correct answers. Regarding the reaction time, the analysis confirmed that the reaction time is shorter when there is a relationship between the base word and the truncation. This seems to confirm that processing the truncated form is faster when the speaker relates it to their base word. The morphophonological characteristics of both the base word and the truncation did not present significant differences in relation to the reaction time. It is important to note, however, that the data presented non-normal distribution and, therefore, it was not possible to apply parametric tests in our analysis. In this perspective, it is not ruled out to find conditioning of morphophonological variables, for which no significant role was identified in this study.application/pdfporMorfofonologiaFrequência lexicalLinguísticaTruncationMorfophonologyLexical frequencyMorphological processingTruncamento em corpus do português brasileiro : descrição, análise e investigação experimentalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de LetrasPrograma de Pós-Graduação em LetrasPorto Alegre, BR-RS2023doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001177858.pdf.txt001177858.pdf.txtExtracted Texttext/plain240820http://www.lume.ufrgs.br/bitstream/10183/266197/2/001177858.pdf.txt68ce86c4cb097ad1d685c1abfa5c8cc4MD52ORIGINAL001177858.pdfTexto completoapplication/pdf6091923http://www.lume.ufrgs.br/bitstream/10183/266197/1/001177858.pdf5592d88344f85df2b2aed031f3a22b76MD5110183/2661972023-10-25 03:38:53.924251oai:www.lume.ufrgs.br:10183/266197Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532023-10-25T06:38:53Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Truncamento em corpus do português brasileiro : descrição, análise e investigação experimental
title Truncamento em corpus do português brasileiro : descrição, análise e investigação experimental
spellingShingle Truncamento em corpus do português brasileiro : descrição, análise e investigação experimental
Heineck, Débora
Morfofonologia
Frequência lexical
Linguística
Truncation
Morfophonology
Lexical frequency
Morphological processing
title_short Truncamento em corpus do português brasileiro : descrição, análise e investigação experimental
title_full Truncamento em corpus do português brasileiro : descrição, análise e investigação experimental
title_fullStr Truncamento em corpus do português brasileiro : descrição, análise e investigação experimental
title_full_unstemmed Truncamento em corpus do português brasileiro : descrição, análise e investigação experimental
title_sort Truncamento em corpus do português brasileiro : descrição, análise e investigação experimental
author Heineck, Débora
author_facet Heineck, Débora
author_role author
dc.contributor.author.fl_str_mv Heineck, Débora
dc.contributor.advisor1.fl_str_mv Schwindt, Luiz Carlos da Silva
contributor_str_mv Schwindt, Luiz Carlos da Silva
dc.subject.por.fl_str_mv Morfofonologia
Frequência lexical
Linguística
topic Morfofonologia
Frequência lexical
Linguística
Truncation
Morfophonology
Lexical frequency
Morphological processing
dc.subject.eng.fl_str_mv Truncation
Morfophonology
Lexical frequency
Morphological processing
description Este trabalho tem por objetivo descrever o funcionamento do processo de truncamento no português brasileiro, delimitar suas regularidades e, consequentemente, dar continuidade a estudos a respeito do processo. Pretendemos contribuir para estudos sobre o papel de fatores fonológicos e morfológicos e da frequência lexical para o processo, bem como para a discussão sobre como se dá o processamento morfológico de processos como o truncamento. Para tanto, foi realizado um levantamento de dados a partir de estudos anteriores sobre o fenômeno (ARAÚJO, 2002; VILELA, GODOY & SILVA, 2006; SCHER, 2011; BELCHOR, 2014; SCHER, 2018), dos resultados obtidos em Heineck (2018) e do registro de dados de redes sociais, programas de televisão, entre outros. Esses dados foram organizados e decodificados a partir de critérios fonológicos e morfológicos, como acento e o número de sílabas, foi registrada a frequência no Corpus do Português (subcorpus Web/Dialects) da forma truncada e de sua palavra-base e foram acrescentados exemplos de uso de cada dado. O nosso corpus de dados de truncamento conta com 239 itens no total. Os dados de Heineck (2018) foram submetidos a uma análise descritiva e inferencial com o objetivo de observar o papel do número de sílabas para o processo do truncamento. Os resultados apontaram para uma tendência de as formas truncadas serem maiores quando há um aumento no número de sílabas da palavra-base. Esse resultado confirma os resultados de Heineck (2018) e corrobora o padrão encontrado por Martini (2010) na formação de truncamentos: palavras dissílabas geralmente formam truncamentos também dissílabos, palavras trissílabas geralmente formam truncamentos dissílabos e palavras polissílabas tendem a formar truncamentos trissílabos. De modo a investigar o papel da frequência lexical no processo de truncamento, o número de ocorrência de dados dos experimentos realizados por Heineck (2018) foi verificada na rede social Twitter. Os resultados da busca realizada no Twitter parecem confirmar algumas de nossas hipóteses: (a) os falantes conseguem recuperar a palavra-base mesmo de truncamentos frequentes na língua e (b) os dados mais frequentes nos experimentos realizados na Dissertação de Mestrado são também os mais frequentes na busca no Twitter, o que levanta a suposição de que os falantes já conhecessem essas formas. Por fim, a frequência dos diminutivos de foto e moto aponta para um resultado diferente ao encontrado nos experimentos, mas segue tendência mais geral encontrada para outros dados nos experimentos. Ao formar o diminutivo de uma forma truncada, os falantes parecem escolher entre as vogais finais a ou o de acordo com o gênero da palavra-base, independente da vogal final da forma truncada. Todos os 239 dados que compõem o nosso corpus foram verificados quanto a sua frequência de ocorrência no Corpus do Português (subcorpus Web/Dialects) e o resultado desta busca foi comparada com os resultados do estudo com dados do Twitter. Verificamos que os truncamentos mais frequentes do nosso corpus tinham como base palavras frequentes, mas algumas das palavras-base mais frequentes desse corpus têm formas truncadas com poucas ou até zero ocorrências. Pudemos inferir, nesse sentido, que truncamentos frequentes parecem ter origem em palavras também frequentes, mas que nem toda palavra muito frequente irá gerar truncamentos frequentes. Na comparação com os resultados de Heineck (2021) com os resultados da busca no Web/Dialects, verificamos que alguns dos dados mais frequentes no Twitter não eram frequentes no Web/Dialects. Isso pode ocorrer, pois o Twitter é um ambiente mais informal e mais propício para o uso de formas como o truncamento do que os sites que compõe o banco de dados do Web/Dialects. Para contribuir com a discussão sobre processamento morfológico do truncamento, desenvolvemos uma tarefa de decisão lexical com priming, em que avaliamos o índice de acertos e o tempo de reação nas respostas de 62 falantes de português brasileiros para os estímulos apresentados. Avaliamos a influência de variáveis como acento, número de sílabas e a relação entre prime e alvo. O experimento era composto de 60 truncamentos e 30 não palavras, que serviam como itens distratores. O experimento foi dividido em três listas e aplicado na plataforma Psytoolkit 3.3.4. As variáveis previsoras analisadas — relação entre prime e alvo, características morfofonológicas da base e do truncamento — não apresentaram diferenças significativas quanto ao índice de acertos. Em relação ao tempo de reação, a análise confirmou que o tempo de reação é menor quando há relação entre palavra-base e o truncamento. Isso parece confirmar que o processamento da forma truncada é mais rápido quando o falante o relaciona com sua palavra-base. As características morfofonológicas tanto da palavra-base quanto do truncamento não apresentaram diferenças significativas em relação ao tempo de reação. É importante salientar, no entanto, que os dados apresentaram distribuição não normal e, portanto, não foi possível aplicar testes paramétricos em nossa análise. Nessa perspectiva, não se descarta encontrar condicionamento das variáveis morfofonológicas, para as quais não se identificou papel significativo neste estudo.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-10-24T03:34:17Z
dc.date.issued.fl_str_mv 2023
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/266197
dc.identifier.nrb.pt_BR.fl_str_mv 001177858
url http://hdl.handle.net/10183/266197
identifier_str_mv 001177858
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/266197/2/001177858.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/266197/1/001177858.pdf
bitstream.checksum.fl_str_mv 68ce86c4cb097ad1d685c1abfa5c8cc4
5592d88344f85df2b2aed031f3a22b76
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1800309224782168064