Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras

Bibliographic Details
Main Author: Segat, Giovana Lazzaretti
Publication Date: 2023
Format: Master thesis
Language: por
Source: Biblioteca Digital de Teses e Dissertações da UFRGS
Download full: http://hdl.handle.net/10183/264245
Summary: O Certificado de Proficiência em Língua Portuguesa para Estrangeiros (Celpe-Bras) é um exame de proficiência aplicado em larga escala que gera considerável impacto social para os atores envolvidos. Embora existam diversos estudos sobre o exame, a maioria das pesquisas emprega metodologias qualitativas. Considerando trabalhos anteriores (NEVES, 2018), entendemos, consoantes a Bachman (1990; 2004), que é necessário investigar a confiabilidade do exame também a partir de pesquisas quantitativas. Para tanto, esta pesquisa objetivou descrever o processo de avaliação da Parte Escrita do exame e apresentar e analisar os dados de 3 edições que compõem o corpus do estudo (2016.1, 2016.2 e 2017.1), discutindo a confiabilidade entre avaliadores – consenso e consistência (STEMLER, 2004) – e o impacto da reavaliação, importante instrumento para a confiabilidade, na certificação dos examinandos. Entendendo que este é um tema de interesse devido ao alto impacto gerado pelo Celpe-Bras (SCARAMUCCI, 2006) e que o processo de atribuição de notas é fundamental para a confiabilidade dos resultados de um exame de larga escala (NEVES, 2018; MCKAY; PLONSKY, 2021; YAN; FAN, 2022), propomos as seguintes análises: para a mensuração de consenso, usamos a porcentagem de concordância entre as notas atribuídas pelos avaliadores; para a mensuração de consistência entre avaliadores, utilizamos o coeficiente de correlação de Pearson; para o impacto da reavaliação na definição das notas finais da Parte Escrita e de proficiência, realizamos uma análise exploratória de nossos dados e fizemos testes-t pareados para comparar os conjuntos de dados. Além disso, comparamos os conjuntos de dados a fim de verificar se a reavaliação ocasiona mudança no nível de certificação do examinando. Os resultados da pesquisa mostraram que a confiabilidade entre avaliadores no exame é boa, apontando para um consenso entre 83%-88% das notas atribuídas pelos avaliadores em todas as edições estudadas, e uma variação de 0,71-0,85 para a consistência entre avaliadores nas tarefas do exame. Nossos resultados também apontaram para uma influência da reavaliação de textos discrepantes na definição do nível de certificação, com, pelo menos, 25% dos examinandos reavaliados tendo alteração de nível de certificação causada pela reavaliação de textos na Parte Escrita. Percebemos, ainda, que embora o número total de examinandos com alterações no nível de certificação ocasionadas pela reavaliação não seja constante entre as edições, a reavaliação possibilita, em todas as edições analisadas, uma melhora significativa na consistência entre avaliadores, o que contribui para aumentar a confiabilidade do exame. Com este estudo, esperamos contribuir para as discussões teóricas na área de avaliação de línguas e para o aprimoramento das práticas realizadas no Celpe-Bras, especialmente aquelas relacionadas à confiabilidade e à tomada de decisões com base nos resultados do exame.
id URGS_68eb36c1769014d05e960d7a4069457c
oai_identifier_str oai:www.lume.ufrgs.br:10183/264245
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Segat, Giovana LazzarettiSchoffen, Juliana Roquele2023-09-01T03:32:26Z2023http://hdl.handle.net/10183/264245001176362O Certificado de Proficiência em Língua Portuguesa para Estrangeiros (Celpe-Bras) é um exame de proficiência aplicado em larga escala que gera considerável impacto social para os atores envolvidos. Embora existam diversos estudos sobre o exame, a maioria das pesquisas emprega metodologias qualitativas. Considerando trabalhos anteriores (NEVES, 2018), entendemos, consoantes a Bachman (1990; 2004), que é necessário investigar a confiabilidade do exame também a partir de pesquisas quantitativas. Para tanto, esta pesquisa objetivou descrever o processo de avaliação da Parte Escrita do exame e apresentar e analisar os dados de 3 edições que compõem o corpus do estudo (2016.1, 2016.2 e 2017.1), discutindo a confiabilidade entre avaliadores – consenso e consistência (STEMLER, 2004) – e o impacto da reavaliação, importante instrumento para a confiabilidade, na certificação dos examinandos. Entendendo que este é um tema de interesse devido ao alto impacto gerado pelo Celpe-Bras (SCARAMUCCI, 2006) e que o processo de atribuição de notas é fundamental para a confiabilidade dos resultados de um exame de larga escala (NEVES, 2018; MCKAY; PLONSKY, 2021; YAN; FAN, 2022), propomos as seguintes análises: para a mensuração de consenso, usamos a porcentagem de concordância entre as notas atribuídas pelos avaliadores; para a mensuração de consistência entre avaliadores, utilizamos o coeficiente de correlação de Pearson; para o impacto da reavaliação na definição das notas finais da Parte Escrita e de proficiência, realizamos uma análise exploratória de nossos dados e fizemos testes-t pareados para comparar os conjuntos de dados. Além disso, comparamos os conjuntos de dados a fim de verificar se a reavaliação ocasiona mudança no nível de certificação do examinando. Os resultados da pesquisa mostraram que a confiabilidade entre avaliadores no exame é boa, apontando para um consenso entre 83%-88% das notas atribuídas pelos avaliadores em todas as edições estudadas, e uma variação de 0,71-0,85 para a consistência entre avaliadores nas tarefas do exame. Nossos resultados também apontaram para uma influência da reavaliação de textos discrepantes na definição do nível de certificação, com, pelo menos, 25% dos examinandos reavaliados tendo alteração de nível de certificação causada pela reavaliação de textos na Parte Escrita. Percebemos, ainda, que embora o número total de examinandos com alterações no nível de certificação ocasionadas pela reavaliação não seja constante entre as edições, a reavaliação possibilita, em todas as edições analisadas, uma melhora significativa na consistência entre avaliadores, o que contribui para aumentar a confiabilidade do exame. Com este estudo, esperamos contribuir para as discussões teóricas na área de avaliação de línguas e para o aprimoramento das práticas realizadas no Celpe-Bras, especialmente aquelas relacionadas à confiabilidade e à tomada de decisões com base nos resultados do exame.The Certificate of Proficiency in Portuguese Language for Foreigners (Celpe-Bras) is a large scale proficiency test that generates considerable social impact for different stakeholders. Although there is a variety of theoretical studies about the exam in Brazil, most of the research uses qualitative methodologies. Considering previous works (NEVES, 2018), we understand, along Bachman (1990; 2004), that it is necessary to investigate test reliability based on quantitative research. Thus, this research aimed to describe the rating process of the writing exam and to present the data from 3 editions (2016.1, 2016.2 and 2017.1), discussing the interrater reliability - consensus and consistency between raters (STEMLER, 2004) - and how the third rater’s grade could affect the certification of the examinees. Understanding that this is a topic of interest due to the high impact generated by Celpe-Bras (SCARAMUCCI, 2006) and that the grading process is fundamental for the reliability of the exam’s results (NEVES, 2018; MCKAY; PLONSKY, 2021; YAN; FAN, 2022), we propose the following analyses: to measure consensus, we used the percentage of agreement between the grades assigned by the raters; to measure consistency between raters, we used Pearson's correlation coefficient; for the impact of the reassessment on defining the final Written Part and proficiency scores, we did an exploratory analysis of our data and paired t-tests to compare the data sets. In addition, we compared the datasets in order to verify whether the reassessment causes a change in the examinee's certification level. The results showed that the reliability between raters in the exam is good, pointing to a consensus between 83%-88% of the grades assigned by the raters in all editions studied, and a variation of 0.71-0.85 for consistency between raters on exam tasks. Our results also point to an influence of the reassessment of discrepant texts in the definition of the certification level, with at least 25% of the reassessed examinees having a change in the certification level caused by the reassessment of texts in the Written Part. We also noticed that although the total number of examinees with alterations in the certification level caused by the reassessment is not constant between editions, the reassessment allows, in all analyzed editions, a significant improvement in the consistency between raters, contributing to the increase of exam’s reliability. With this study, we hope to contribute to theoretical discussions in the area of language assessment and to the improvement of practices carried out at Celpe-Bras, especially those related to reliability and decision-making based on the results of the exam.application/pdfporCelpe-BrasProficiênciaCelpe-Bras examWriting examInter-rater reliabilityEstudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Brasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de LetrasPrograma de Pós-Graduação em LetrasPorto Alegre, BR-RS2023mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001176362.pdf.txt001176362.pdf.txtExtracted Texttext/plain383687http://www.lume.ufrgs.br/bitstream/10183/264245/2/001176362.pdf.txta021234da5077f98cc486f3629016be8MD52ORIGINAL001176362.pdfTexto parcialapplication/pdf2689064http://www.lume.ufrgs.br/bitstream/10183/264245/1/001176362.pdf6458403714e8ccef6b04348e61ab25c6MD5110183/2642452023-09-02 03:35:11.240803oai:www.lume.ufrgs.br:10183/264245Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532023-09-02T06:35:11Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras
title Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras
spellingShingle Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras
Segat, Giovana Lazzaretti
Celpe-Bras
Proficiência
Celpe-Bras exam
Writing exam
Inter-rater reliability
title_short Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras
title_full Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras
title_fullStr Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras
title_full_unstemmed Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras
title_sort Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras
author Segat, Giovana Lazzaretti
author_facet Segat, Giovana Lazzaretti
author_role author
dc.contributor.author.fl_str_mv Segat, Giovana Lazzaretti
dc.contributor.advisor1.fl_str_mv Schoffen, Juliana Roquele
contributor_str_mv Schoffen, Juliana Roquele
dc.subject.por.fl_str_mv Celpe-Bras
Proficiência
topic Celpe-Bras
Proficiência
Celpe-Bras exam
Writing exam
Inter-rater reliability
dc.subject.eng.fl_str_mv Celpe-Bras exam
Writing exam
Inter-rater reliability
description O Certificado de Proficiência em Língua Portuguesa para Estrangeiros (Celpe-Bras) é um exame de proficiência aplicado em larga escala que gera considerável impacto social para os atores envolvidos. Embora existam diversos estudos sobre o exame, a maioria das pesquisas emprega metodologias qualitativas. Considerando trabalhos anteriores (NEVES, 2018), entendemos, consoantes a Bachman (1990; 2004), que é necessário investigar a confiabilidade do exame também a partir de pesquisas quantitativas. Para tanto, esta pesquisa objetivou descrever o processo de avaliação da Parte Escrita do exame e apresentar e analisar os dados de 3 edições que compõem o corpus do estudo (2016.1, 2016.2 e 2017.1), discutindo a confiabilidade entre avaliadores – consenso e consistência (STEMLER, 2004) – e o impacto da reavaliação, importante instrumento para a confiabilidade, na certificação dos examinandos. Entendendo que este é um tema de interesse devido ao alto impacto gerado pelo Celpe-Bras (SCARAMUCCI, 2006) e que o processo de atribuição de notas é fundamental para a confiabilidade dos resultados de um exame de larga escala (NEVES, 2018; MCKAY; PLONSKY, 2021; YAN; FAN, 2022), propomos as seguintes análises: para a mensuração de consenso, usamos a porcentagem de concordância entre as notas atribuídas pelos avaliadores; para a mensuração de consistência entre avaliadores, utilizamos o coeficiente de correlação de Pearson; para o impacto da reavaliação na definição das notas finais da Parte Escrita e de proficiência, realizamos uma análise exploratória de nossos dados e fizemos testes-t pareados para comparar os conjuntos de dados. Além disso, comparamos os conjuntos de dados a fim de verificar se a reavaliação ocasiona mudança no nível de certificação do examinando. Os resultados da pesquisa mostraram que a confiabilidade entre avaliadores no exame é boa, apontando para um consenso entre 83%-88% das notas atribuídas pelos avaliadores em todas as edições estudadas, e uma variação de 0,71-0,85 para a consistência entre avaliadores nas tarefas do exame. Nossos resultados também apontaram para uma influência da reavaliação de textos discrepantes na definição do nível de certificação, com, pelo menos, 25% dos examinandos reavaliados tendo alteração de nível de certificação causada pela reavaliação de textos na Parte Escrita. Percebemos, ainda, que embora o número total de examinandos com alterações no nível de certificação ocasionadas pela reavaliação não seja constante entre as edições, a reavaliação possibilita, em todas as edições analisadas, uma melhora significativa na consistência entre avaliadores, o que contribui para aumentar a confiabilidade do exame. Com este estudo, esperamos contribuir para as discussões teóricas na área de avaliação de línguas e para o aprimoramento das práticas realizadas no Celpe-Bras, especialmente aquelas relacionadas à confiabilidade e à tomada de decisões com base nos resultados do exame.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-09-01T03:32:26Z
dc.date.issued.fl_str_mv 2023
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/264245
dc.identifier.nrb.pt_BR.fl_str_mv 001176362
url http://hdl.handle.net/10183/264245
identifier_str_mv 001176362
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/264245/2/001176362.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/264245/1/001176362.pdf
bitstream.checksum.fl_str_mv a021234da5077f98cc486f3629016be8
6458403714e8ccef6b04348e61ab25c6
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1797064781454114816