Um método estatístico para identificação de fraude em exames de larga escala com questões do tipo múltipla escolha

Detalhes bibliográficos
Autor(a) principal: Cotrim, Eduardo Augusto Comenda
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.2/12451
Resumo: No Brasil, exames de larga escala são utilizados em concursos para admissão a cargos públicos ou para ingresso em universidades. Existem organizações criminosas especializadas em fraudar tais exames, causando enormes danos para a sociedade, possibilitando que pessoas não qualificadas e desonestas ingressem nas universidades e funções públicas, em detrimento de pessoas qualificadas e honestas. Em busca de uma forma de provar cientificamente a ocorrência de fraude em exames compostos por questões tipo múltipla-escolha, desenvolveu-se um método de análise estatística da similaridade das respostas dos candidatos. O método se baseia no fato de que as respostas dadas por uma população de candidatos em determinado exame seguem uma distribuição probabilística, cujos parâmetros podem ser estimados a partir de dados intrínsecos do exame. Compara-se o número de respostas coincidentes obtidas entre cada par de candidatos com o número que seria esperado, e calcula-se a probabilidade associada a essa ocorrência. Destacam-se os casos cuja probabilidade de ocorrência é muito pequena, menor que um nível de significância préestabelecido. O método foi desenvolvido de maneira a preservar a segurança, de modo a garantir que todos os candidatos sinalizados como fraudadores tenham probabilidade elevada de terem cometido a fraude, mesmo correndo o risco de eventualmente deixar de indicar algum candidato culpado. Isso é feito através da escolha adequada do nível de significância para os testes de hipóteses. As limitações de aplicabilidade do método são analisadas através de simulação de dados, determinando-se os limites dentro dos quais o método pode ser aplicado de forma eficaz e fiável.
id RCAP_1ab1acd6d99811323b5eec767fec79a3
oai_identifier_str oai:repositorioaberto.uab.pt:10400.2/12451
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Um método estatístico para identificação de fraude em exames de larga escala com questões do tipo múltipla escolhaA statistical method for the identification of fraud in large scale exams with multiple choice questionsDistribuição Bernoulli com probabilidades variáveisTeorema de LiapounovTeorema do limite central para variáveis não identicamente distribuídasIdentificação de fraude em exames tipo múltipla escolhaBernoulli Distribution with variable probabilitiesLiapounov TheoremsCentral limit theorem for non-identical variablesFraud identification in multiple-choice examODS::04:Educação de QualidadeNo Brasil, exames de larga escala são utilizados em concursos para admissão a cargos públicos ou para ingresso em universidades. Existem organizações criminosas especializadas em fraudar tais exames, causando enormes danos para a sociedade, possibilitando que pessoas não qualificadas e desonestas ingressem nas universidades e funções públicas, em detrimento de pessoas qualificadas e honestas. Em busca de uma forma de provar cientificamente a ocorrência de fraude em exames compostos por questões tipo múltipla-escolha, desenvolveu-se um método de análise estatística da similaridade das respostas dos candidatos. O método se baseia no fato de que as respostas dadas por uma população de candidatos em determinado exame seguem uma distribuição probabilística, cujos parâmetros podem ser estimados a partir de dados intrínsecos do exame. Compara-se o número de respostas coincidentes obtidas entre cada par de candidatos com o número que seria esperado, e calcula-se a probabilidade associada a essa ocorrência. Destacam-se os casos cuja probabilidade de ocorrência é muito pequena, menor que um nível de significância préestabelecido. O método foi desenvolvido de maneira a preservar a segurança, de modo a garantir que todos os candidatos sinalizados como fraudadores tenham probabilidade elevada de terem cometido a fraude, mesmo correndo o risco de eventualmente deixar de indicar algum candidato culpado. Isso é feito através da escolha adequada do nível de significância para os testes de hipóteses. As limitações de aplicabilidade do método são analisadas através de simulação de dados, determinando-se os limites dentro dos quais o método pode ser aplicado de forma eficaz e fiável.In Brazil, large-scale exams are used in selection processes for admission to public positions or universities. There are criminal organizations specialized in defrauding such exams, causing enormous damage to society, allowing unqualified and dishonest people to enter universities and public functions, instead of qualified and honest people. In search of a way to scientifically prove the occurrence of fraud in exams composed of multiple-choice questions, a statistical analysis method to determine the similarity of the candidates' answers was developed. The method is based on the fact that the answers given by a population of candidates in a given exam follow a probability distribution, whose parameters can be estimated from the intrinsic data of the exam. The number of coincident responses between each pair of candidates is compared with what would be expected, and the probability associated with this occurrence is calculated. Cases whose probability of occurrence is very small, less than a pre-established level of significance, stand out. The method was developed to preserve security, in a way that it guarantees that all candidates indicated as fraudsters have a high probability of having committed the fraud, even at the risk of eventually failing to nominate a guilty candidate. This is done by choosing the appropriate level of significance for the hypothesis tests. The limitations of applicability of the method is analyzed through data simulation, determining the limits within which the method can be applied effectively and reliably.Nunes, Catarina S.Oliveira, Maria JoãoRepositório AbertoCotrim, Eduardo Augusto Comenda2022-11-02T11:57:06Z2022-09-262022-11-022022-09-26T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.2/12451TID:203103173porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-16T15:42:40Zoai:repositorioaberto.uab.pt:10400.2/12451Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:51:45.596520Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Um método estatístico para identificação de fraude em exames de larga escala com questões do tipo múltipla escolha
A statistical method for the identification of fraud in large scale exams with multiple choice questions
title Um método estatístico para identificação de fraude em exames de larga escala com questões do tipo múltipla escolha
spellingShingle Um método estatístico para identificação de fraude em exames de larga escala com questões do tipo múltipla escolha
Cotrim, Eduardo Augusto Comenda
Distribuição Bernoulli com probabilidades variáveis
Teorema de Liapounov
Teorema do limite central para variáveis não identicamente distribuídas
Identificação de fraude em exames tipo múltipla escolha
Bernoulli Distribution with variable probabilities
Liapounov Theorems
Central limit theorem for non-identical variables
Fraud identification in multiple-choice exam
ODS::04:Educação de Qualidade
title_short Um método estatístico para identificação de fraude em exames de larga escala com questões do tipo múltipla escolha
title_full Um método estatístico para identificação de fraude em exames de larga escala com questões do tipo múltipla escolha
title_fullStr Um método estatístico para identificação de fraude em exames de larga escala com questões do tipo múltipla escolha
title_full_unstemmed Um método estatístico para identificação de fraude em exames de larga escala com questões do tipo múltipla escolha
title_sort Um método estatístico para identificação de fraude em exames de larga escala com questões do tipo múltipla escolha
author Cotrim, Eduardo Augusto Comenda
author_facet Cotrim, Eduardo Augusto Comenda
author_role author
dc.contributor.none.fl_str_mv Nunes, Catarina S.
Oliveira, Maria João
Repositório Aberto
dc.contributor.author.fl_str_mv Cotrim, Eduardo Augusto Comenda
dc.subject.por.fl_str_mv Distribuição Bernoulli com probabilidades variáveis
Teorema de Liapounov
Teorema do limite central para variáveis não identicamente distribuídas
Identificação de fraude em exames tipo múltipla escolha
Bernoulli Distribution with variable probabilities
Liapounov Theorems
Central limit theorem for non-identical variables
Fraud identification in multiple-choice exam
ODS::04:Educação de Qualidade
topic Distribuição Bernoulli com probabilidades variáveis
Teorema de Liapounov
Teorema do limite central para variáveis não identicamente distribuídas
Identificação de fraude em exames tipo múltipla escolha
Bernoulli Distribution with variable probabilities
Liapounov Theorems
Central limit theorem for non-identical variables
Fraud identification in multiple-choice exam
ODS::04:Educação de Qualidade
description No Brasil, exames de larga escala são utilizados em concursos para admissão a cargos públicos ou para ingresso em universidades. Existem organizações criminosas especializadas em fraudar tais exames, causando enormes danos para a sociedade, possibilitando que pessoas não qualificadas e desonestas ingressem nas universidades e funções públicas, em detrimento de pessoas qualificadas e honestas. Em busca de uma forma de provar cientificamente a ocorrência de fraude em exames compostos por questões tipo múltipla-escolha, desenvolveu-se um método de análise estatística da similaridade das respostas dos candidatos. O método se baseia no fato de que as respostas dadas por uma população de candidatos em determinado exame seguem uma distribuição probabilística, cujos parâmetros podem ser estimados a partir de dados intrínsecos do exame. Compara-se o número de respostas coincidentes obtidas entre cada par de candidatos com o número que seria esperado, e calcula-se a probabilidade associada a essa ocorrência. Destacam-se os casos cuja probabilidade de ocorrência é muito pequena, menor que um nível de significância préestabelecido. O método foi desenvolvido de maneira a preservar a segurança, de modo a garantir que todos os candidatos sinalizados como fraudadores tenham probabilidade elevada de terem cometido a fraude, mesmo correndo o risco de eventualmente deixar de indicar algum candidato culpado. Isso é feito através da escolha adequada do nível de significância para os testes de hipóteses. As limitações de aplicabilidade do método são analisadas através de simulação de dados, determinando-se os limites dentro dos quais o método pode ser aplicado de forma eficaz e fiável.
publishDate 2022
dc.date.none.fl_str_mv 2022-11-02T11:57:06Z
2022-09-26
2022-11-02
2022-09-26T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.2/12451
TID:203103173
url http://hdl.handle.net/10400.2/12451
identifier_str_mv TID:203103173
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799135109798952960