Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM

Detalhes bibliográficos
Autor(a) principal: Pereira, Fernanda da Silva
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10773/16879
Resumo: A teoria de resposta a itens (TRI) engloba uma família de modelos não lineares que fornecem uma estimativa da probabilidade de responder corretamente a uma pergunta de escolha múltipla (item) de um teste. Esta família de modelos caracteriza-se em função da capacidade dos estudantes e das características dos itens, como sejam a dificuldade e a discriminação. Os modelos TRI têm como variáveis dependentes itens dicotómicos e como variáveis independentes uma ou mais variáveis latentes. Um dos modelos TRI habitualmente utilizado para analise de testes com perguntas de escolha múltipla e o modelo logístico com 1 parâmetro (1-PL). Uma das problemáticas associada a perguntas de escolha múltipla e a facilidade do estudante cometer fraude. A fraude académica e definida como uma atividade na qual existe uma violação das regras durante o processo de avaliação. A maior parte da investigação na área de deteção de fraude académica tem-se focado na deteção de fraude através da copia das respostas a partir de outros estudantes. No entanto, a literatura e mais escassa em relação a fraude através do conhecimento prévio dos itens. Este ultimo tipo de fraude ocorre na maioria das vezes pela exposição ou memorização de perguntas pelos estudantes. Os modelos TRI referidos anteriormente não permitem a deteção deste tipo de fraude académica. Para dar resposta a esta problemática foi proposto o modelo DGM (Deterministic, Gated Item Response Theory Mo- del) (Shu et al., 2013), que consiste numa mistura de dois modelos 1-PL, que incorpora a divisão dos estudantes em dois grupos. O modelo DGM clássica os estudantes como fraudulentos ou não fraudulentos pelo condicionamento a dois tipos de perguntas; o primeiro tipo inclui os itens que provavelmente estão comprometidos e o segundo tipo os itens não comprometidos. O modelo DGM permite a deteção de fraude através da analise da diferença entre a capacidade de um estudante cometer este tipo de fraude e a sua verdadeira capacidade. Neste trabalho faz-se a aplicação do modelo DGM com o objetivo de estimar a prevalência de estudantes que cometeram fraude devido ao conhecimento prévio dos itens a partir de seis exames de escolha múltipla da unidade curricular de Anatomia Cl nica da Faculdade de Medicina da Universidade do Porto. Cada exame consistiu em 100 questões com cerca de 20% de perguntas repetidas realizado em média por 200 estudantes. Foi utilizada a metodologia Bayesiana para a estimação dos parâmetros do modelo DGM utilizando métodos de Monte Carlo via Cadeias de Markov. As distribuições a priori para os parâmetros do modelo foram definidas utilizando distribuições Normais. A estimação da sensibilidade e especificidade do modelo DGM foi baseada num estudo de simulação, onde se avaliou a proporção dos estudantes que são corretamente classificados como sendo fraudulentos - sensibilidade - e a proporção dos estudantes que são corretamente classificados como não fraudulentos - especificidade. Tendo em conta as estimativas para a sensibilidade e especificidade estimou-se a prevalência real dos estudantes que cometeram fraude nos testes da UC em analise.
id RCAP_d583a54129990561b83616807a87be9e
oai_identifier_str oai:ria.ua.pt:10773/16879
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGMMatemática aplicadaTestes de avaliação de conhecimentosTestes de escolha múltipla - FraudeProbabilidadesA teoria de resposta a itens (TRI) engloba uma família de modelos não lineares que fornecem uma estimativa da probabilidade de responder corretamente a uma pergunta de escolha múltipla (item) de um teste. Esta família de modelos caracteriza-se em função da capacidade dos estudantes e das características dos itens, como sejam a dificuldade e a discriminação. Os modelos TRI têm como variáveis dependentes itens dicotómicos e como variáveis independentes uma ou mais variáveis latentes. Um dos modelos TRI habitualmente utilizado para analise de testes com perguntas de escolha múltipla e o modelo logístico com 1 parâmetro (1-PL). Uma das problemáticas associada a perguntas de escolha múltipla e a facilidade do estudante cometer fraude. A fraude académica e definida como uma atividade na qual existe uma violação das regras durante o processo de avaliação. A maior parte da investigação na área de deteção de fraude académica tem-se focado na deteção de fraude através da copia das respostas a partir de outros estudantes. No entanto, a literatura e mais escassa em relação a fraude através do conhecimento prévio dos itens. Este ultimo tipo de fraude ocorre na maioria das vezes pela exposição ou memorização de perguntas pelos estudantes. Os modelos TRI referidos anteriormente não permitem a deteção deste tipo de fraude académica. Para dar resposta a esta problemática foi proposto o modelo DGM (Deterministic, Gated Item Response Theory Mo- del) (Shu et al., 2013), que consiste numa mistura de dois modelos 1-PL, que incorpora a divisão dos estudantes em dois grupos. O modelo DGM clássica os estudantes como fraudulentos ou não fraudulentos pelo condicionamento a dois tipos de perguntas; o primeiro tipo inclui os itens que provavelmente estão comprometidos e o segundo tipo os itens não comprometidos. O modelo DGM permite a deteção de fraude através da analise da diferença entre a capacidade de um estudante cometer este tipo de fraude e a sua verdadeira capacidade. Neste trabalho faz-se a aplicação do modelo DGM com o objetivo de estimar a prevalência de estudantes que cometeram fraude devido ao conhecimento prévio dos itens a partir de seis exames de escolha múltipla da unidade curricular de Anatomia Cl nica da Faculdade de Medicina da Universidade do Porto. Cada exame consistiu em 100 questões com cerca de 20% de perguntas repetidas realizado em média por 200 estudantes. Foi utilizada a metodologia Bayesiana para a estimação dos parâmetros do modelo DGM utilizando métodos de Monte Carlo via Cadeias de Markov. As distribuições a priori para os parâmetros do modelo foram definidas utilizando distribuições Normais. A estimação da sensibilidade e especificidade do modelo DGM foi baseada num estudo de simulação, onde se avaliou a proporção dos estudantes que são corretamente classificados como sendo fraudulentos - sensibilidade - e a proporção dos estudantes que são corretamente classificados como não fraudulentos - especificidade. Tendo em conta as estimativas para a sensibilidade e especificidade estimou-se a prevalência real dos estudantes que cometeram fraude nos testes da UC em analise.The item response theory (IRT) comprises a family of nonlinear models that provide an estimate of the probability of correctly answer to a question (item) of a multiple choice test. This models family is characterized according to students ability and items characteristics such as di culty and discrimination. The IRT models have dichotomous items as dependent variables and as independent variables one or more latent variables. One of the commonly IRT model used for examination analysis with multiple choice questions is the logistic model with one parameter (1-PL). One of the problems associated with multiple choice questions is the easiness for a student to commit fraud. Academic fraud is de ned as an activity in which there is a violation of the rules during the evaluation process. Most of the research in academic fraud detection area has been focused on fraud detection due to students copying of responses from other students. However, the literature is scarce in relation to fraud through prior knowledge of the items. This type of fraud occurs most often by exposure or memorization of questions by students. The IRT models mentioned above do not allow the detection of this type of fraud. To address this issue DGM Model (Deterministic, Gated Item Response Theory Model) (Shu et al., 2013) was proposed, consisting of a two 1-PL models mixture which splits the students into two groups. The DGM model classi es students as fraudulent or not fraudulent by conditioning them to two types of questions; the rst type includes the items that are probably committed and the second type the uncommitted items. The DGM model allows fraud detection by the analysis of the variation between the student fraud ability to commit this type of fraud and its true ability. In this work the DGM model was applied in order to estimate the prevalence of students who committed fraud due to item prior knowledge from six multiple choice examimations of the Clinical Anatomy course at Faculty of Medicine of University of Porto. Each examination consisted of 100 questions with an average of 200 students and 20% of repeat questions per examination. Bayesian methodology was used to estimate DGM model parameters using Monte Carlo Markov Chain Methods. The a priori distributions were de ned as Normal distributions. The estimation of the sensibility and speci city was based on a simulation study, which evaluated the proportion of students who are correctly classi ed as fraudulent - sensibility - and the proportion of students who are correctly classi ed as non-fraudulent - speci city. The estimates of sensibility and speci city were used to estimate true prevalence of fraudulent students in the UC examinations under study.Universidade de Aveiro2017-02-24T14:17:05Z2015-01-01T00:00:00Z2015info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/16879TID:201574560porPereira, Fernanda da Silvainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T11:32:19Zoai:ria.ua.pt:10773/16879Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:52:10.364795Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
title Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
spellingShingle Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
Pereira, Fernanda da Silva
Matemática aplicada
Testes de avaliação de conhecimentos
Testes de escolha múltipla - Fraude
Probabilidades
title_short Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
title_full Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
title_fullStr Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
title_full_unstemmed Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
title_sort Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
author Pereira, Fernanda da Silva
author_facet Pereira, Fernanda da Silva
author_role author
dc.contributor.author.fl_str_mv Pereira, Fernanda da Silva
dc.subject.por.fl_str_mv Matemática aplicada
Testes de avaliação de conhecimentos
Testes de escolha múltipla - Fraude
Probabilidades
topic Matemática aplicada
Testes de avaliação de conhecimentos
Testes de escolha múltipla - Fraude
Probabilidades
description A teoria de resposta a itens (TRI) engloba uma família de modelos não lineares que fornecem uma estimativa da probabilidade de responder corretamente a uma pergunta de escolha múltipla (item) de um teste. Esta família de modelos caracteriza-se em função da capacidade dos estudantes e das características dos itens, como sejam a dificuldade e a discriminação. Os modelos TRI têm como variáveis dependentes itens dicotómicos e como variáveis independentes uma ou mais variáveis latentes. Um dos modelos TRI habitualmente utilizado para analise de testes com perguntas de escolha múltipla e o modelo logístico com 1 parâmetro (1-PL). Uma das problemáticas associada a perguntas de escolha múltipla e a facilidade do estudante cometer fraude. A fraude académica e definida como uma atividade na qual existe uma violação das regras durante o processo de avaliação. A maior parte da investigação na área de deteção de fraude académica tem-se focado na deteção de fraude através da copia das respostas a partir de outros estudantes. No entanto, a literatura e mais escassa em relação a fraude através do conhecimento prévio dos itens. Este ultimo tipo de fraude ocorre na maioria das vezes pela exposição ou memorização de perguntas pelos estudantes. Os modelos TRI referidos anteriormente não permitem a deteção deste tipo de fraude académica. Para dar resposta a esta problemática foi proposto o modelo DGM (Deterministic, Gated Item Response Theory Mo- del) (Shu et al., 2013), que consiste numa mistura de dois modelos 1-PL, que incorpora a divisão dos estudantes em dois grupos. O modelo DGM clássica os estudantes como fraudulentos ou não fraudulentos pelo condicionamento a dois tipos de perguntas; o primeiro tipo inclui os itens que provavelmente estão comprometidos e o segundo tipo os itens não comprometidos. O modelo DGM permite a deteção de fraude através da analise da diferença entre a capacidade de um estudante cometer este tipo de fraude e a sua verdadeira capacidade. Neste trabalho faz-se a aplicação do modelo DGM com o objetivo de estimar a prevalência de estudantes que cometeram fraude devido ao conhecimento prévio dos itens a partir de seis exames de escolha múltipla da unidade curricular de Anatomia Cl nica da Faculdade de Medicina da Universidade do Porto. Cada exame consistiu em 100 questões com cerca de 20% de perguntas repetidas realizado em média por 200 estudantes. Foi utilizada a metodologia Bayesiana para a estimação dos parâmetros do modelo DGM utilizando métodos de Monte Carlo via Cadeias de Markov. As distribuições a priori para os parâmetros do modelo foram definidas utilizando distribuições Normais. A estimação da sensibilidade e especificidade do modelo DGM foi baseada num estudo de simulação, onde se avaliou a proporção dos estudantes que são corretamente classificados como sendo fraudulentos - sensibilidade - e a proporção dos estudantes que são corretamente classificados como não fraudulentos - especificidade. Tendo em conta as estimativas para a sensibilidade e especificidade estimou-se a prevalência real dos estudantes que cometeram fraude nos testes da UC em analise.
publishDate 2015
dc.date.none.fl_str_mv 2015-01-01T00:00:00Z
2015
2017-02-24T14:17:05Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10773/16879
TID:201574560
url http://hdl.handle.net/10773/16879
identifier_str_mv TID:201574560
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade de Aveiro
publisher.none.fl_str_mv Universidade de Aveiro
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137572294754304