Vocabulário escrito de estudantes de escolas públicas do Rio Grande do Sul : um estudo léxico-estatístico

Detalhes bibliográficos
Autor(a) principal: Silva, Bruna Rodrigues da
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/225289
Resumo: Este trabalho descreve resultados de uma pesquisa de mestrado inserida no âmbito dos estudos lexicológicos de enfoque estatístico, baseados em corpora. O objetivo principal é a descrição e a análise contrastiva do perfil de vocabulário escrito empregado por estudantes dos anos finais do Ensino Fundamental de duas escolas públicas do estado do Rio Grande do Sul – Brasil. O corpus de estudo é composto por um conjunto de 154 redações desidentificadas de alunos de 6ºano e de 8º ano de duas escolas, uma administrada pelo Governo do Estado e outra pelo Município de Porto Alegre. Ambas as escolas se localizam na Zona Norte da capital gaúcha, próximas entre si e na fronteira da região metropolitana. O corpus de estudo é heterogêneo quanto às propostas geradoras das redações, mas homogêneo quanto à quantidade de textos por escola e por ano escolar. O corpus foi examinado em dois grupos principais, de acordo com a procedência por escola. Parte-se da ideia de que o perfil vocabular seria diferente entre os dois grupos de textos, em função das diferentes condições de infraestrutura em cada uma das escolas e de relatos de alguns professores. Como contraste para o exame do seu vocabulário, são usados: os textos de apoio para as produções textuais – quando existentes – e as propostas que orientaram a escrita dos alunos. Como corpora de referência para um Português escrito fundamental ou básico, conforme utilizados por pessoas adultas, são utilizados: o CorPop, o Banco de Português, o Corpus Brasileiro e o Lácio Web. Os três últimos foram utilizados como referência somente para identificação de palavras-chave das redações do corpus de estudo. O CorPop, por sua vez, forneceu uma referência sobre simplicidade do vocabulário empregado. Com apoio de ferramentas computacionais, da estatística linguística e da Linguística de Corpus, as redações foram descritas, analisadas e comparadas entre si e com os materiais de contraste e com os corpora de referência. Os resultados indicam que a riqueza vocabular exibida nas redações não tende a variar entre as produções dos estudantes da escola municipal (16,5%) e as dos estudantes da escola estadual (16,5%). Do mesmo modo, não há muita diversidade de palavras empregadas entre os dois grupos quando se considera as mais frequentes de uma mesma proposta de tema. O grupo de palavras com frequência única – hapax legomenon – empregado nas redações mostrou-se como o principal fator de especificidade do vocabulário de cada grupo. Com relação ao aspecto de simplicidade do vocabulário, verificou-se uma coincidência de quase 70% com o CorPop, ainda que esse percentual possa ser ajustado para cobrir formas não lematizadas das palavras e itens não contemplados nesse corpus. Por fim, o trabalho refuta a ideia de que os dois grupos possuiriam perfis de vocabulário escrito diferentes e apresenta algumas sugestões de atividades para professores do Ensino Fundamental tratarem do tema do vocabulário em suas aulas.
id URGS_ddac903b1c55378872fccbbd64e1820b
oai_identifier_str oai:www.lume.ufrgs.br:10183/225289
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Silva, Bruna Rodrigues daFinatto, Maria José Bocorny2021-08-06T04:42:01Z2021http://hdl.handle.net/10183/225289001129463Este trabalho descreve resultados de uma pesquisa de mestrado inserida no âmbito dos estudos lexicológicos de enfoque estatístico, baseados em corpora. O objetivo principal é a descrição e a análise contrastiva do perfil de vocabulário escrito empregado por estudantes dos anos finais do Ensino Fundamental de duas escolas públicas do estado do Rio Grande do Sul – Brasil. O corpus de estudo é composto por um conjunto de 154 redações desidentificadas de alunos de 6ºano e de 8º ano de duas escolas, uma administrada pelo Governo do Estado e outra pelo Município de Porto Alegre. Ambas as escolas se localizam na Zona Norte da capital gaúcha, próximas entre si e na fronteira da região metropolitana. O corpus de estudo é heterogêneo quanto às propostas geradoras das redações, mas homogêneo quanto à quantidade de textos por escola e por ano escolar. O corpus foi examinado em dois grupos principais, de acordo com a procedência por escola. Parte-se da ideia de que o perfil vocabular seria diferente entre os dois grupos de textos, em função das diferentes condições de infraestrutura em cada uma das escolas e de relatos de alguns professores. Como contraste para o exame do seu vocabulário, são usados: os textos de apoio para as produções textuais – quando existentes – e as propostas que orientaram a escrita dos alunos. Como corpora de referência para um Português escrito fundamental ou básico, conforme utilizados por pessoas adultas, são utilizados: o CorPop, o Banco de Português, o Corpus Brasileiro e o Lácio Web. Os três últimos foram utilizados como referência somente para identificação de palavras-chave das redações do corpus de estudo. O CorPop, por sua vez, forneceu uma referência sobre simplicidade do vocabulário empregado. Com apoio de ferramentas computacionais, da estatística linguística e da Linguística de Corpus, as redações foram descritas, analisadas e comparadas entre si e com os materiais de contraste e com os corpora de referência. Os resultados indicam que a riqueza vocabular exibida nas redações não tende a variar entre as produções dos estudantes da escola municipal (16,5%) e as dos estudantes da escola estadual (16,5%). Do mesmo modo, não há muita diversidade de palavras empregadas entre os dois grupos quando se considera as mais frequentes de uma mesma proposta de tema. O grupo de palavras com frequência única – hapax legomenon – empregado nas redações mostrou-se como o principal fator de especificidade do vocabulário de cada grupo. Com relação ao aspecto de simplicidade do vocabulário, verificou-se uma coincidência de quase 70% com o CorPop, ainda que esse percentual possa ser ajustado para cobrir formas não lematizadas das palavras e itens não contemplados nesse corpus. Por fim, o trabalho refuta a ideia de que os dois grupos possuiriam perfis de vocabulário escrito diferentes e apresenta algumas sugestões de atividades para professores do Ensino Fundamental tratarem do tema do vocabulário em suas aulas.The aim of this thesis is to describe and present the findings of an investigation in the area of Lexicology using a statistical approach based on corpora. The main objective is the description and contrastive analysis of the written vocabulary of Middle School students from two public schools of the state of Rio Grande do Sul – Brazil. The study corpus comprises 154 writing samples of 6th and 8th year students from two public schools: one run by the Government of the State, and another run by the Municipal Government of Porto Alegre. Students’ identities have been concealed in all writings. Both schools are located in the Sarandi area, in the north side of Porto Alegre. The study corpus is heterogeneous in terms of the topics presented to the students, but homogeneous in terms of the number of writing samples per school and per school year. The corpus was divided into two main groups, one group per school. It was assumed that the vocabulary to be used would be different between the two groups because of the different infrastructure conditions in each school and due to reports from the teachers. The following items were used to contrast and analyze the vocabulary: the issue topic for the written production – whenever applicable – and the rubrics for the activity. As a reference for elementary-level Portuguese used by adults, the following corpora were selected: CorPop, Banco de Português, Corpus Brasileiro and Lácio Web. The last three corpora were used as reference for identifying keywords in the writing samples of the study corpus and CorPop provided a reference on the simplicity of the vocabulary used. The description, analysis and comparisons of the written productions with one another and against the contrast corpora were aided by computer tools, Statistical Linguistics and Corpus Linguistics. The data from the study corpus and reference corpus have been compared and contrasted. Results have shown that vocabulary richness in the students’ texts tends to show little to no variation in both schools (16.5%). Similarly, there is no diversity of words between the two groups when looking for the most frequent ones in a single topic. The only difference between the productions of both groups was on words or expressions used that occurred only once – hapax legomenon – in the writing samples. Regarding the level of simplicity of the vocabulary, there was a coincidence of almost 70% with CorPop vocabulary, although this percentage can be adjusted to cover non-lemmatized forms of words and items not included in this corpus. Therefore, this investigation refutes the claim that both groups would have different vocabularies. Lastly, suggestions of activities for Middle School teachers to work with vocabulary under a linguistic analysis perspective in class are presented based on the findings of this study.application/pdfporRedação escolarVocabulárioEstatistica : LinguisticaLexicologiaLingüística de corpusEnsino fundamentalLíngua portuguesaLinguagem e línguasSchool writingVocabularyLexical StatisticsLexicologyCorpus LinguisticsMiddle SchoolPortuguese LanguageVocabulário escrito de estudantes de escolas públicas do Rio Grande do Sul : um estudo léxico-estatísticoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de LetrasPrograma de Pós-Graduação em LetrasPorto Alegre, BR-RS2021mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001129463.pdf.txt001129463.pdf.txtExtracted Texttext/plain601153http://www.lume.ufrgs.br/bitstream/10183/225289/2/001129463.pdf.txt04969daf28ab8ce087e3226e402346ccMD52ORIGINAL001129463.pdfTexto completoapplication/pdf5758891http://www.lume.ufrgs.br/bitstream/10183/225289/1/001129463.pdf6b2e2f3d7c3703646ab7acbf51a3db1fMD5110183/2252892021-08-18 04:39:53.700917oai:www.lume.ufrgs.br:10183/225289Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-08-18T07:39:53Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Vocabulário escrito de estudantes de escolas públicas do Rio Grande do Sul : um estudo léxico-estatístico
title Vocabulário escrito de estudantes de escolas públicas do Rio Grande do Sul : um estudo léxico-estatístico
spellingShingle Vocabulário escrito de estudantes de escolas públicas do Rio Grande do Sul : um estudo léxico-estatístico
Silva, Bruna Rodrigues da
Redação escolar
Vocabulário
Estatistica : Linguistica
Lexicologia
Lingüística de corpus
Ensino fundamental
Língua portuguesa
Linguagem e línguas
School writing
Vocabulary
Lexical Statistics
Lexicology
Corpus Linguistics
Middle School
Portuguese Language
title_short Vocabulário escrito de estudantes de escolas públicas do Rio Grande do Sul : um estudo léxico-estatístico
title_full Vocabulário escrito de estudantes de escolas públicas do Rio Grande do Sul : um estudo léxico-estatístico
title_fullStr Vocabulário escrito de estudantes de escolas públicas do Rio Grande do Sul : um estudo léxico-estatístico
title_full_unstemmed Vocabulário escrito de estudantes de escolas públicas do Rio Grande do Sul : um estudo léxico-estatístico
title_sort Vocabulário escrito de estudantes de escolas públicas do Rio Grande do Sul : um estudo léxico-estatístico
author Silva, Bruna Rodrigues da
author_facet Silva, Bruna Rodrigues da
author_role author
dc.contributor.author.fl_str_mv Silva, Bruna Rodrigues da
dc.contributor.advisor1.fl_str_mv Finatto, Maria José Bocorny
contributor_str_mv Finatto, Maria José Bocorny
dc.subject.por.fl_str_mv Redação escolar
Vocabulário
Estatistica : Linguistica
Lexicologia
Lingüística de corpus
Ensino fundamental
Língua portuguesa
Linguagem e línguas
topic Redação escolar
Vocabulário
Estatistica : Linguistica
Lexicologia
Lingüística de corpus
Ensino fundamental
Língua portuguesa
Linguagem e línguas
School writing
Vocabulary
Lexical Statistics
Lexicology
Corpus Linguistics
Middle School
Portuguese Language
dc.subject.eng.fl_str_mv School writing
Vocabulary
Lexical Statistics
Lexicology
Corpus Linguistics
Middle School
Portuguese Language
description Este trabalho descreve resultados de uma pesquisa de mestrado inserida no âmbito dos estudos lexicológicos de enfoque estatístico, baseados em corpora. O objetivo principal é a descrição e a análise contrastiva do perfil de vocabulário escrito empregado por estudantes dos anos finais do Ensino Fundamental de duas escolas públicas do estado do Rio Grande do Sul – Brasil. O corpus de estudo é composto por um conjunto de 154 redações desidentificadas de alunos de 6ºano e de 8º ano de duas escolas, uma administrada pelo Governo do Estado e outra pelo Município de Porto Alegre. Ambas as escolas se localizam na Zona Norte da capital gaúcha, próximas entre si e na fronteira da região metropolitana. O corpus de estudo é heterogêneo quanto às propostas geradoras das redações, mas homogêneo quanto à quantidade de textos por escola e por ano escolar. O corpus foi examinado em dois grupos principais, de acordo com a procedência por escola. Parte-se da ideia de que o perfil vocabular seria diferente entre os dois grupos de textos, em função das diferentes condições de infraestrutura em cada uma das escolas e de relatos de alguns professores. Como contraste para o exame do seu vocabulário, são usados: os textos de apoio para as produções textuais – quando existentes – e as propostas que orientaram a escrita dos alunos. Como corpora de referência para um Português escrito fundamental ou básico, conforme utilizados por pessoas adultas, são utilizados: o CorPop, o Banco de Português, o Corpus Brasileiro e o Lácio Web. Os três últimos foram utilizados como referência somente para identificação de palavras-chave das redações do corpus de estudo. O CorPop, por sua vez, forneceu uma referência sobre simplicidade do vocabulário empregado. Com apoio de ferramentas computacionais, da estatística linguística e da Linguística de Corpus, as redações foram descritas, analisadas e comparadas entre si e com os materiais de contraste e com os corpora de referência. Os resultados indicam que a riqueza vocabular exibida nas redações não tende a variar entre as produções dos estudantes da escola municipal (16,5%) e as dos estudantes da escola estadual (16,5%). Do mesmo modo, não há muita diversidade de palavras empregadas entre os dois grupos quando se considera as mais frequentes de uma mesma proposta de tema. O grupo de palavras com frequência única – hapax legomenon – empregado nas redações mostrou-se como o principal fator de especificidade do vocabulário de cada grupo. Com relação ao aspecto de simplicidade do vocabulário, verificou-se uma coincidência de quase 70% com o CorPop, ainda que esse percentual possa ser ajustado para cobrir formas não lematizadas das palavras e itens não contemplados nesse corpus. Por fim, o trabalho refuta a ideia de que os dois grupos possuiriam perfis de vocabulário escrito diferentes e apresenta algumas sugestões de atividades para professores do Ensino Fundamental tratarem do tema do vocabulário em suas aulas.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-08-06T04:42:01Z
dc.date.issued.fl_str_mv 2021
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/225289
dc.identifier.nrb.pt_BR.fl_str_mv 001129463
url http://hdl.handle.net/10183/225289
identifier_str_mv 001129463
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/225289/2/001129463.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/225289/1/001129463.pdf
bitstream.checksum.fl_str_mv 04969daf28ab8ce087e3226e402346cc
6b2e2f3d7c3703646ab7acbf51a3db1f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1800309183170478080