Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM

Pereira, Fernanda da Silva

Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM

Detalhes bibliográficos
Autor(a) principal:	Pereira, Fernanda da Silva
Data de Publicação:	2015
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo:	http://hdl.handle.net/10773/16879
Resumo:	A teoria de resposta a itens (TRI) engloba uma família de modelos não lineares que fornecem uma estimativa da probabilidade de responder corretamente a uma pergunta de escolha múltipla (item) de um teste. Esta família de modelos caracteriza-se em função da capacidade dos estudantes e das características dos itens, como sejam a dificuldade e a discriminação. Os modelos TRI têm como variáveis dependentes itens dicotómicos e como variáveis independentes uma ou mais variáveis latentes. Um dos modelos TRI habitualmente utilizado para analise de testes com perguntas de escolha múltipla e o modelo logístico com 1 parâmetro (1-PL). Uma das problemáticas associada a perguntas de escolha múltipla e a facilidade do estudante cometer fraude. A fraude académica e definida como uma atividade na qual existe uma violação das regras durante o processo de avaliação. A maior parte da investigação na área de deteção de fraude académica tem-se focado na deteção de fraude através da copia das respostas a partir de outros estudantes. No entanto, a literatura e mais escassa em relação a fraude através do conhecimento prévio dos itens. Este ultimo tipo de fraude ocorre na maioria das vezes pela exposição ou memorização de perguntas pelos estudantes. Os modelos TRI referidos anteriormente não permitem a deteção deste tipo de fraude académica. Para dar resposta a esta problemática foi proposto o modelo DGM (Deterministic, Gated Item Response Theory Mo- del) (Shu et al., 2013), que consiste numa mistura de dois modelos 1-PL, que incorpora a divisão dos estudantes em dois grupos. O modelo DGM clássica os estudantes como fraudulentos ou não fraudulentos pelo condicionamento a dois tipos de perguntas; o primeiro tipo inclui os itens que provavelmente estão comprometidos e o segundo tipo os itens não comprometidos. O modelo DGM permite a deteção de fraude através da analise da diferença entre a capacidade de um estudante cometer este tipo de fraude e a sua verdadeira capacidade. Neste trabalho faz-se a aplicação do modelo DGM com o objetivo de estimar a prevalência de estudantes que cometeram fraude devido ao conhecimento prévio dos itens a partir de seis exames de escolha múltipla da unidade curricular de Anatomia Cl nica da Faculdade de Medicina da Universidade do Porto. Cada exame consistiu em 100 questões com cerca de 20% de perguntas repetidas realizado em média por 200 estudantes. Foi utilizada a metodologia Bayesiana para a estimação dos parâmetros do modelo DGM utilizando métodos de Monte Carlo via Cadeias de Markov. As distribuições a priori para os parâmetros do modelo foram definidas utilizando distribuições Normais. A estimação da sensibilidade e especificidade do modelo DGM foi baseada num estudo de simulação, onde se avaliou a proporção dos estudantes que são corretamente classificados como sendo fraudulentos - sensibilidade - e a proporção dos estudantes que são corretamente classificados como não fraudulentos - especificidade. Tendo em conta as estimativas para a sensibilidade e especificidade estimou-se a prevalência real dos estudantes que cometeram fraude nos testes da UC em analise.

Metadados do item

id	RCAP_d583a54129990561b83616807a87be9e
oai_identifier_str	oai:ria.ua.pt:10773/16879
network_acronym_str	RCAP
network_name_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str	7160
spelling	Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGMMatemática aplicadaTestes de avaliação de conhecimentosTestes de escolha múltipla - FraudeProbabilidadesA teoria de resposta a itens (TRI) engloba uma família de modelos não lineares que fornecem uma estimativa da probabilidade de responder corretamente a uma pergunta de escolha múltipla (item) de um teste. Esta família de modelos caracteriza-se em função da capacidade dos estudantes e das características dos itens, como sejam a dificuldade e a discriminação. Os modelos TRI têm como variáveis dependentes itens dicotómicos e como variáveis independentes uma ou mais variáveis latentes. Um dos modelos TRI habitualmente utilizado para analise de testes com perguntas de escolha múltipla e o modelo logístico com 1 parâmetro (1-PL). Uma das problemáticas associada a perguntas de escolha múltipla e a facilidade do estudante cometer fraude. A fraude académica e definida como uma atividade na qual existe uma violação das regras durante o processo de avaliação. A maior parte da investigação na área de deteção de fraude académica tem-se focado na deteção de fraude através da copia das respostas a partir de outros estudantes. No entanto, a literatura e mais escassa em relação a fraude através do conhecimento prévio dos itens. Este ultimo tipo de fraude ocorre na maioria das vezes pela exposição ou memorização de perguntas pelos estudantes. Os modelos TRI referidos anteriormente não permitem a deteção deste tipo de fraude académica. Para dar resposta a esta problemática foi proposto o modelo DGM (Deterministic, Gated Item Response Theory Mo- del) (Shu et al., 2013), que consiste numa mistura de dois modelos 1-PL, que incorpora a divisão dos estudantes em dois grupos. O modelo DGM clássica os estudantes como fraudulentos ou não fraudulentos pelo condicionamento a dois tipos de perguntas; o primeiro tipo inclui os itens que provavelmente estão comprometidos e o segundo tipo os itens não comprometidos. O modelo DGM permite a deteção de fraude através da analise da diferença entre a capacidade de um estudante cometer este tipo de fraude e a sua verdadeira capacidade. Neste trabalho faz-se a aplicação do modelo DGM com o objetivo de estimar a prevalência de estudantes que cometeram fraude devido ao conhecimento prévio dos itens a partir de seis exames de escolha múltipla da unidade curricular de Anatomia Cl nica da Faculdade de Medicina da Universidade do Porto. Cada exame consistiu em 100 questões com cerca de 20% de perguntas repetidas realizado em média por 200 estudantes. Foi utilizada a metodologia Bayesiana para a estimação dos parâmetros do modelo DGM utilizando métodos de Monte Carlo via Cadeias de Markov. As distribuições a priori para os parâmetros do modelo foram definidas utilizando distribuições Normais. A estimação da sensibilidade e especificidade do modelo DGM foi baseada num estudo de simulação, onde se avaliou a proporção dos estudantes que são corretamente classificados como sendo fraudulentos - sensibilidade - e a proporção dos estudantes que são corretamente classificados como não fraudulentos - especificidade. Tendo em conta as estimativas para a sensibilidade e especificidade estimou-se a prevalência real dos estudantes que cometeram fraude nos testes da UC em analise.The item response theory (IRT) comprises a family of nonlinear models that provide an estimate of the probability of correctly answer to a question (item) of a multiple choice test. This models family is characterized according to students ability and items characteristics such as di culty and discrimination. The IRT models have dichotomous items as dependent variables and as independent variables one or more latent variables. One of the commonly IRT model used for examination analysis with multiple choice questions is the logistic model with one parameter (1-PL). One of the problems associated with multiple choice questions is the easiness for a student to commit fraud. Academic fraud is de ned as an activity in which there is a violation of the rules during the evaluation process. Most of the research in academic fraud detection area has been focused on fraud detection due to students copying of responses from other students. However, the literature is scarce in relation to fraud through prior knowledge of the items. This type of fraud occurs most often by exposure or memorization of questions by students. The IRT models mentioned above do not allow the detection of this type of fraud. To address this issue DGM Model (Deterministic, Gated Item Response Theory Model) (Shu et al., 2013) was proposed, consisting of a two 1-PL models mixture which splits the students into two groups. The DGM model classi es students as fraudulent or not fraudulent by conditioning them to two types of questions; the rst type includes the items that are probably committed and the second type the uncommitted items. The DGM model allows fraud detection by the analysis of the variation between the student fraud ability to commit this type of fraud and its true ability. In this work the DGM model was applied in order to estimate the prevalence of students who committed fraud due to item prior knowledge from six multiple choice examimations of the Clinical Anatomy course at Faculty of Medicine of University of Porto. Each examination consisted of 100 questions with an average of 200 students and 20% of repeat questions per examination. Bayesian methodology was used to estimate DGM model parameters using Monte Carlo Markov Chain Methods. The a priori distributions were de ned as Normal distributions. The estimation of the sensibility and speci city was based on a simulation study, which evaluated the proportion of students who are correctly classi ed as fraudulent - sensibility - and the proportion of students who are correctly classi ed as non-fraudulent - speci city. The estimates of sensibility and speci city were used to estimate true prevalence of fraudulent students in the UC examinations under study.Universidade de Aveiro2017-02-24T14:17:05Z2015-01-01T00:00:00Z2015info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/16879TID:201574560porPereira, Fernanda da Silvainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T11:32:19Zoai:ria.ua.pt:10773/16879Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:52:10.364795Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv	Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
title	Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
spellingShingle	Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM Pereira, Fernanda da Silva Matemática aplicada Testes de avaliação de conhecimentos Testes de escolha múltipla - Fraude Probabilidades
title_short	Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
title_full	Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
title_fullStr	Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
title_full_unstemmed	Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
title_sort	Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM
author	Pereira, Fernanda da Silva
author_facet	Pereira, Fernanda da Silva
author_role	author
dc.contributor.author.fl_str_mv	Pereira, Fernanda da Silva
dc.subject.por.fl_str_mv	Matemática aplicada Testes de avaliação de conhecimentos Testes de escolha múltipla - Fraude Probabilidades
topic	Matemática aplicada Testes de avaliação de conhecimentos Testes de escolha múltipla - Fraude Probabilidades
description	A teoria de resposta a itens (TRI) engloba uma família de modelos não lineares que fornecem uma estimativa da probabilidade de responder corretamente a uma pergunta de escolha múltipla (item) de um teste. Esta família de modelos caracteriza-se em função da capacidade dos estudantes e das características dos itens, como sejam a dificuldade e a discriminação. Os modelos TRI têm como variáveis dependentes itens dicotómicos e como variáveis independentes uma ou mais variáveis latentes. Um dos modelos TRI habitualmente utilizado para analise de testes com perguntas de escolha múltipla e o modelo logístico com 1 parâmetro (1-PL). Uma das problemáticas associada a perguntas de escolha múltipla e a facilidade do estudante cometer fraude. A fraude académica e definida como uma atividade na qual existe uma violação das regras durante o processo de avaliação. A maior parte da investigação na área de deteção de fraude académica tem-se focado na deteção de fraude através da copia das respostas a partir de outros estudantes. No entanto, a literatura e mais escassa em relação a fraude através do conhecimento prévio dos itens. Este ultimo tipo de fraude ocorre na maioria das vezes pela exposição ou memorização de perguntas pelos estudantes. Os modelos TRI referidos anteriormente não permitem a deteção deste tipo de fraude académica. Para dar resposta a esta problemática foi proposto o modelo DGM (Deterministic, Gated Item Response Theory Mo- del) (Shu et al., 2013), que consiste numa mistura de dois modelos 1-PL, que incorpora a divisão dos estudantes em dois grupos. O modelo DGM clássica os estudantes como fraudulentos ou não fraudulentos pelo condicionamento a dois tipos de perguntas; o primeiro tipo inclui os itens que provavelmente estão comprometidos e o segundo tipo os itens não comprometidos. O modelo DGM permite a deteção de fraude através da analise da diferença entre a capacidade de um estudante cometer este tipo de fraude e a sua verdadeira capacidade. Neste trabalho faz-se a aplicação do modelo DGM com o objetivo de estimar a prevalência de estudantes que cometeram fraude devido ao conhecimento prévio dos itens a partir de seis exames de escolha múltipla da unidade curricular de Anatomia Cl nica da Faculdade de Medicina da Universidade do Porto. Cada exame consistiu em 100 questões com cerca de 20% de perguntas repetidas realizado em média por 200 estudantes. Foi utilizada a metodologia Bayesiana para a estimação dos parâmetros do modelo DGM utilizando métodos de Monte Carlo via Cadeias de Markov. As distribuições a priori para os parâmetros do modelo foram definidas utilizando distribuições Normais. A estimação da sensibilidade e especificidade do modelo DGM foi baseada num estudo de simulação, onde se avaliou a proporção dos estudantes que são corretamente classificados como sendo fraudulentos - sensibilidade - e a proporção dos estudantes que são corretamente classificados como não fraudulentos - especificidade. Tendo em conta as estimativas para a sensibilidade e especificidade estimou-se a prevalência real dos estudantes que cometeram fraude nos testes da UC em analise.
publishDate	2015
dc.date.none.fl_str_mv	2015-01-01T00:00:00Z 2015 2017-02-24T14:17:05Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10773/16879 TID:201574560
url	http://hdl.handle.net/10773/16879
identifier_str_mv	TID:201574560
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidade de Aveiro
publisher.none.fl_str_mv	Universidade de Aveiro
dc.source.none.fl_str_mv	reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP
instname_str	Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str	RCAAP
institution	RCAAP
reponame_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_	1799137572294754304

Deteção da existência de conhecimento prévio de questões de escolha múltipla utilizando o modelo DGM

Registros relacionados