Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras
Main Author: | |
---|---|
Publication Date: | 2023 |
Format: | Master thesis |
Language: | por |
Source: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Download full: | http://hdl.handle.net/10183/264245 |
Summary: | O Certificado de Proficiência em Língua Portuguesa para Estrangeiros (Celpe-Bras) é um exame de proficiência aplicado em larga escala que gera considerável impacto social para os atores envolvidos. Embora existam diversos estudos sobre o exame, a maioria das pesquisas emprega metodologias qualitativas. Considerando trabalhos anteriores (NEVES, 2018), entendemos, consoantes a Bachman (1990; 2004), que é necessário investigar a confiabilidade do exame também a partir de pesquisas quantitativas. Para tanto, esta pesquisa objetivou descrever o processo de avaliação da Parte Escrita do exame e apresentar e analisar os dados de 3 edições que compõem o corpus do estudo (2016.1, 2016.2 e 2017.1), discutindo a confiabilidade entre avaliadores – consenso e consistência (STEMLER, 2004) – e o impacto da reavaliação, importante instrumento para a confiabilidade, na certificação dos examinandos. Entendendo que este é um tema de interesse devido ao alto impacto gerado pelo Celpe-Bras (SCARAMUCCI, 2006) e que o processo de atribuição de notas é fundamental para a confiabilidade dos resultados de um exame de larga escala (NEVES, 2018; MCKAY; PLONSKY, 2021; YAN; FAN, 2022), propomos as seguintes análises: para a mensuração de consenso, usamos a porcentagem de concordância entre as notas atribuídas pelos avaliadores; para a mensuração de consistência entre avaliadores, utilizamos o coeficiente de correlação de Pearson; para o impacto da reavaliação na definição das notas finais da Parte Escrita e de proficiência, realizamos uma análise exploratória de nossos dados e fizemos testes-t pareados para comparar os conjuntos de dados. Além disso, comparamos os conjuntos de dados a fim de verificar se a reavaliação ocasiona mudança no nível de certificação do examinando. Os resultados da pesquisa mostraram que a confiabilidade entre avaliadores no exame é boa, apontando para um consenso entre 83%-88% das notas atribuídas pelos avaliadores em todas as edições estudadas, e uma variação de 0,71-0,85 para a consistência entre avaliadores nas tarefas do exame. Nossos resultados também apontaram para uma influência da reavaliação de textos discrepantes na definição do nível de certificação, com, pelo menos, 25% dos examinandos reavaliados tendo alteração de nível de certificação causada pela reavaliação de textos na Parte Escrita. Percebemos, ainda, que embora o número total de examinandos com alterações no nível de certificação ocasionadas pela reavaliação não seja constante entre as edições, a reavaliação possibilita, em todas as edições analisadas, uma melhora significativa na consistência entre avaliadores, o que contribui para aumentar a confiabilidade do exame. Com este estudo, esperamos contribuir para as discussões teóricas na área de avaliação de línguas e para o aprimoramento das práticas realizadas no Celpe-Bras, especialmente aquelas relacionadas à confiabilidade e à tomada de decisões com base nos resultados do exame. |
id |
URGS_68eb36c1769014d05e960d7a4069457c |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/264245 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Segat, Giovana LazzarettiSchoffen, Juliana Roquele2023-09-01T03:32:26Z2023http://hdl.handle.net/10183/264245001176362O Certificado de Proficiência em Língua Portuguesa para Estrangeiros (Celpe-Bras) é um exame de proficiência aplicado em larga escala que gera considerável impacto social para os atores envolvidos. Embora existam diversos estudos sobre o exame, a maioria das pesquisas emprega metodologias qualitativas. Considerando trabalhos anteriores (NEVES, 2018), entendemos, consoantes a Bachman (1990; 2004), que é necessário investigar a confiabilidade do exame também a partir de pesquisas quantitativas. Para tanto, esta pesquisa objetivou descrever o processo de avaliação da Parte Escrita do exame e apresentar e analisar os dados de 3 edições que compõem o corpus do estudo (2016.1, 2016.2 e 2017.1), discutindo a confiabilidade entre avaliadores – consenso e consistência (STEMLER, 2004) – e o impacto da reavaliação, importante instrumento para a confiabilidade, na certificação dos examinandos. Entendendo que este é um tema de interesse devido ao alto impacto gerado pelo Celpe-Bras (SCARAMUCCI, 2006) e que o processo de atribuição de notas é fundamental para a confiabilidade dos resultados de um exame de larga escala (NEVES, 2018; MCKAY; PLONSKY, 2021; YAN; FAN, 2022), propomos as seguintes análises: para a mensuração de consenso, usamos a porcentagem de concordância entre as notas atribuídas pelos avaliadores; para a mensuração de consistência entre avaliadores, utilizamos o coeficiente de correlação de Pearson; para o impacto da reavaliação na definição das notas finais da Parte Escrita e de proficiência, realizamos uma análise exploratória de nossos dados e fizemos testes-t pareados para comparar os conjuntos de dados. Além disso, comparamos os conjuntos de dados a fim de verificar se a reavaliação ocasiona mudança no nível de certificação do examinando. Os resultados da pesquisa mostraram que a confiabilidade entre avaliadores no exame é boa, apontando para um consenso entre 83%-88% das notas atribuídas pelos avaliadores em todas as edições estudadas, e uma variação de 0,71-0,85 para a consistência entre avaliadores nas tarefas do exame. Nossos resultados também apontaram para uma influência da reavaliação de textos discrepantes na definição do nível de certificação, com, pelo menos, 25% dos examinandos reavaliados tendo alteração de nível de certificação causada pela reavaliação de textos na Parte Escrita. Percebemos, ainda, que embora o número total de examinandos com alterações no nível de certificação ocasionadas pela reavaliação não seja constante entre as edições, a reavaliação possibilita, em todas as edições analisadas, uma melhora significativa na consistência entre avaliadores, o que contribui para aumentar a confiabilidade do exame. Com este estudo, esperamos contribuir para as discussões teóricas na área de avaliação de línguas e para o aprimoramento das práticas realizadas no Celpe-Bras, especialmente aquelas relacionadas à confiabilidade e à tomada de decisões com base nos resultados do exame.The Certificate of Proficiency in Portuguese Language for Foreigners (Celpe-Bras) is a large scale proficiency test that generates considerable social impact for different stakeholders. Although there is a variety of theoretical studies about the exam in Brazil, most of the research uses qualitative methodologies. Considering previous works (NEVES, 2018), we understand, along Bachman (1990; 2004), that it is necessary to investigate test reliability based on quantitative research. Thus, this research aimed to describe the rating process of the writing exam and to present the data from 3 editions (2016.1, 2016.2 and 2017.1), discussing the interrater reliability - consensus and consistency between raters (STEMLER, 2004) - and how the third rater’s grade could affect the certification of the examinees. Understanding that this is a topic of interest due to the high impact generated by Celpe-Bras (SCARAMUCCI, 2006) and that the grading process is fundamental for the reliability of the exam’s results (NEVES, 2018; MCKAY; PLONSKY, 2021; YAN; FAN, 2022), we propose the following analyses: to measure consensus, we used the percentage of agreement between the grades assigned by the raters; to measure consistency between raters, we used Pearson's correlation coefficient; for the impact of the reassessment on defining the final Written Part and proficiency scores, we did an exploratory analysis of our data and paired t-tests to compare the data sets. In addition, we compared the datasets in order to verify whether the reassessment causes a change in the examinee's certification level. The results showed that the reliability between raters in the exam is good, pointing to a consensus between 83%-88% of the grades assigned by the raters in all editions studied, and a variation of 0.71-0.85 for consistency between raters on exam tasks. Our results also point to an influence of the reassessment of discrepant texts in the definition of the certification level, with at least 25% of the reassessed examinees having a change in the certification level caused by the reassessment of texts in the Written Part. We also noticed that although the total number of examinees with alterations in the certification level caused by the reassessment is not constant between editions, the reassessment allows, in all analyzed editions, a significant improvement in the consistency between raters, contributing to the increase of exam’s reliability. With this study, we hope to contribute to theoretical discussions in the area of language assessment and to the improvement of practices carried out at Celpe-Bras, especially those related to reliability and decision-making based on the results of the exam.application/pdfporCelpe-BrasProficiênciaCelpe-Bras examWriting examInter-rater reliabilityEstudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Brasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de LetrasPrograma de Pós-Graduação em LetrasPorto Alegre, BR-RS2023mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001176362.pdf.txt001176362.pdf.txtExtracted Texttext/plain383687http://www.lume.ufrgs.br/bitstream/10183/264245/2/001176362.pdf.txta021234da5077f98cc486f3629016be8MD52ORIGINAL001176362.pdfTexto parcialapplication/pdf2689064http://www.lume.ufrgs.br/bitstream/10183/264245/1/001176362.pdf6458403714e8ccef6b04348e61ab25c6MD5110183/2642452023-09-02 03:35:11.240803oai:www.lume.ufrgs.br:10183/264245Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532023-09-02T06:35:11Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras |
title |
Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras |
spellingShingle |
Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras Segat, Giovana Lazzaretti Celpe-Bras Proficiência Celpe-Bras exam Writing exam Inter-rater reliability |
title_short |
Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras |
title_full |
Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras |
title_fullStr |
Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras |
title_full_unstemmed |
Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras |
title_sort |
Estudos sobre confiabilidade em exames de proficiência : o processo de atribuição de notas e a reavaliação na parte escrita do Celpe-Bras |
author |
Segat, Giovana Lazzaretti |
author_facet |
Segat, Giovana Lazzaretti |
author_role |
author |
dc.contributor.author.fl_str_mv |
Segat, Giovana Lazzaretti |
dc.contributor.advisor1.fl_str_mv |
Schoffen, Juliana Roquele |
contributor_str_mv |
Schoffen, Juliana Roquele |
dc.subject.por.fl_str_mv |
Celpe-Bras Proficiência |
topic |
Celpe-Bras Proficiência Celpe-Bras exam Writing exam Inter-rater reliability |
dc.subject.eng.fl_str_mv |
Celpe-Bras exam Writing exam Inter-rater reliability |
description |
O Certificado de Proficiência em Língua Portuguesa para Estrangeiros (Celpe-Bras) é um exame de proficiência aplicado em larga escala que gera considerável impacto social para os atores envolvidos. Embora existam diversos estudos sobre o exame, a maioria das pesquisas emprega metodologias qualitativas. Considerando trabalhos anteriores (NEVES, 2018), entendemos, consoantes a Bachman (1990; 2004), que é necessário investigar a confiabilidade do exame também a partir de pesquisas quantitativas. Para tanto, esta pesquisa objetivou descrever o processo de avaliação da Parte Escrita do exame e apresentar e analisar os dados de 3 edições que compõem o corpus do estudo (2016.1, 2016.2 e 2017.1), discutindo a confiabilidade entre avaliadores – consenso e consistência (STEMLER, 2004) – e o impacto da reavaliação, importante instrumento para a confiabilidade, na certificação dos examinandos. Entendendo que este é um tema de interesse devido ao alto impacto gerado pelo Celpe-Bras (SCARAMUCCI, 2006) e que o processo de atribuição de notas é fundamental para a confiabilidade dos resultados de um exame de larga escala (NEVES, 2018; MCKAY; PLONSKY, 2021; YAN; FAN, 2022), propomos as seguintes análises: para a mensuração de consenso, usamos a porcentagem de concordância entre as notas atribuídas pelos avaliadores; para a mensuração de consistência entre avaliadores, utilizamos o coeficiente de correlação de Pearson; para o impacto da reavaliação na definição das notas finais da Parte Escrita e de proficiência, realizamos uma análise exploratória de nossos dados e fizemos testes-t pareados para comparar os conjuntos de dados. Além disso, comparamos os conjuntos de dados a fim de verificar se a reavaliação ocasiona mudança no nível de certificação do examinando. Os resultados da pesquisa mostraram que a confiabilidade entre avaliadores no exame é boa, apontando para um consenso entre 83%-88% das notas atribuídas pelos avaliadores em todas as edições estudadas, e uma variação de 0,71-0,85 para a consistência entre avaliadores nas tarefas do exame. Nossos resultados também apontaram para uma influência da reavaliação de textos discrepantes na definição do nível de certificação, com, pelo menos, 25% dos examinandos reavaliados tendo alteração de nível de certificação causada pela reavaliação de textos na Parte Escrita. Percebemos, ainda, que embora o número total de examinandos com alterações no nível de certificação ocasionadas pela reavaliação não seja constante entre as edições, a reavaliação possibilita, em todas as edições analisadas, uma melhora significativa na consistência entre avaliadores, o que contribui para aumentar a confiabilidade do exame. Com este estudo, esperamos contribuir para as discussões teóricas na área de avaliação de línguas e para o aprimoramento das práticas realizadas no Celpe-Bras, especialmente aquelas relacionadas à confiabilidade e à tomada de decisões com base nos resultados do exame. |
publishDate |
2023 |
dc.date.accessioned.fl_str_mv |
2023-09-01T03:32:26Z |
dc.date.issued.fl_str_mv |
2023 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/264245 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001176362 |
url |
http://hdl.handle.net/10183/264245 |
identifier_str_mv |
001176362 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/264245/2/001176362.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/264245/1/001176362.pdf |
bitstream.checksum.fl_str_mv |
a021234da5077f98cc486f3629016be8 6458403714e8ccef6b04348e61ab25c6 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1797064781454114816 |