Digit analysis using Benford's Law : a bayesian approach
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.5/13105 |
Resumo: | Mestrado em Econometria Aplicada e Previsão |
id |
RCAP_75be94e1f91fb2092fe3c68abbc6906f |
---|---|
oai_identifier_str |
oai:www.repository.utl.pt:10400.5/13105 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Digit analysis using Benford's Law : a bayesian approachAnálise da Frequência dos DígitosCalibração do Valor-PLei de BenfordMedidas Condicionais de EvidenciaSelecção Bayesiana de ModelosTestes de HipotesesBayesian Model SelectionBenford's LawConditional Measures of EvidenceDigit AnalysisHypothesis TestingP-Value CalibrationMestrado em Econometria Aplicada e PrevisãoA lei de Benford, regularidade empírica segundo a qual muitos dos conjuntos de números gerados sem intervenção humana exibem um padrão de decaimento logarítmico nas frequências de ocorrência de primeiros dígitos, pode ser utilizada para, através da análise da frequência de dígitos, identificar conjuntos de números potencialmente erróneos ou fraudulentos. Devido ao elevado nível de potência alcançado pelos testes de hipóteses clássicos de dimensão fixa em amostras grandes, espera-se que, se a amostra for suficientemente grande, estes consigam identificar qualquer desvio em relação à lei de Benford, por mais pequeno que seja, como sendo estatisticamente significativo. Isto pode levar à rejeição da presença da lei de Benford em amostras onde o desvio em relação à mesma não tem significância prática e à identificação de amostras legitimas como sendo fraudulentas. Esta dissertação sugere uma abordagem baseada na seleção bayesiana de modelos. A metodologia proposta é aplicada num estudo empírico que utiliza estatísticas macroeconómicas de países da Zona Euro e explora o conflito entre o valor-p e as medidas bayesianas de evidência (fator de Bayes e probabilidades a posteriori) a nível do suporte por elas fornecido à presença da lei de Benford numa amostra. Conclui-se que os testes clássicos rejeitam frequentemente a presença da lei de Benford em amostras onde as medidas bayesianas são favoráveis à sua presença, e que mesmo limites inferiores destas medidas sobre largas famílias de distribuições a priori frequentemente fornecem bastante mais suporte à presença da lei de Benford do que o valor-p e os testes clássicos.According to Benford's law, many of the collections of numbers which are generated without human intervention exhibit a logarithmically decaying pattern in leading digit frequencies. Through digit analysis, this empirical regularity can help identifying erroneous or fraudulent data. Due to the power that classical significance tests with fixed dimension attain in large samples, they produce small p-values and, if the sample is big enough, are able to identify any deviation from Benford's law, no matter how tiny, as statistically significant. This may result in the rejection of Benford's law in samples where the deviations from it are without practical importance, and consequently samples which are legit are likely to be classified as erroneous or fraudulent. This dissertation proposes a Bayesian model selection approach to digit analysis. An empirical application with macroeconomic statistics from Eurozone countries demonstrates the applicability of the suggested methodology and explores the conflict between the p-value and Bayesian measures of evidence (Bayes factors and posterior probabilities) in the support they provide to the presence of Benford's law in a given sample. It is concluded that classical significance tests often reject the presence of Benford's law in samples which are deemed to be in conformance to it by Bayesian measures, and that even lower bounds on such measures over wide classes of prior distributions often provide more evidence in favour of Benford's law than the p-value and classical significance tests seem to suggest.Instituto Superior de Economia e GestãoPaulo, RuiRepositório da Universidade de LisboaFonseca, Pedro Miguel Teles da2017-02-02T13:34:12Z2016-102016-10-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.5/13105engFonseca, Pedro Miguel Teles da (2016). "Digit analysis using Benford's Law : a bayesian approach". Dissertação de Mestrado, Universidade de Lisboa. Instituto Superior de Economia e Gestão.info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-06T14:43:13Zoai:www.repository.utl.pt:10400.5/13105Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T16:59:08.427380Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Digit analysis using Benford's Law : a bayesian approach |
title |
Digit analysis using Benford's Law : a bayesian approach |
spellingShingle |
Digit analysis using Benford's Law : a bayesian approach Fonseca, Pedro Miguel Teles da Análise da Frequência dos Dígitos Calibração do Valor-P Lei de Benford Medidas Condicionais de Evidencia Selecção Bayesiana de Modelos Testes de Hipoteses Bayesian Model Selection Benford's Law Conditional Measures of Evidence Digit Analysis Hypothesis Testing P-Value Calibration |
title_short |
Digit analysis using Benford's Law : a bayesian approach |
title_full |
Digit analysis using Benford's Law : a bayesian approach |
title_fullStr |
Digit analysis using Benford's Law : a bayesian approach |
title_full_unstemmed |
Digit analysis using Benford's Law : a bayesian approach |
title_sort |
Digit analysis using Benford's Law : a bayesian approach |
author |
Fonseca, Pedro Miguel Teles da |
author_facet |
Fonseca, Pedro Miguel Teles da |
author_role |
author |
dc.contributor.none.fl_str_mv |
Paulo, Rui Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Fonseca, Pedro Miguel Teles da |
dc.subject.por.fl_str_mv |
Análise da Frequência dos Dígitos Calibração do Valor-P Lei de Benford Medidas Condicionais de Evidencia Selecção Bayesiana de Modelos Testes de Hipoteses Bayesian Model Selection Benford's Law Conditional Measures of Evidence Digit Analysis Hypothesis Testing P-Value Calibration |
topic |
Análise da Frequência dos Dígitos Calibração do Valor-P Lei de Benford Medidas Condicionais de Evidencia Selecção Bayesiana de Modelos Testes de Hipoteses Bayesian Model Selection Benford's Law Conditional Measures of Evidence Digit Analysis Hypothesis Testing P-Value Calibration |
description |
Mestrado em Econometria Aplicada e Previsão |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016-10 2016-10-01T00:00:00Z 2017-02-02T13:34:12Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.5/13105 |
url |
http://hdl.handle.net/10400.5/13105 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
Fonseca, Pedro Miguel Teles da (2016). "Digit analysis using Benford's Law : a bayesian approach". Dissertação de Mestrado, Universidade de Lisboa. Instituto Superior de Economia e Gestão. |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Instituto Superior de Economia e Gestão |
publisher.none.fl_str_mv |
Instituto Superior de Economia e Gestão |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799131078329368576 |