Digit analysis using Benford's Law : a bayesian approach

Detalhes bibliográficos
Autor(a) principal: Fonseca, Pedro Miguel Teles da
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.5/13105
Resumo: Mestrado em Econometria Aplicada e Previsão
id RCAP_75be94e1f91fb2092fe3c68abbc6906f
oai_identifier_str oai:www.repository.utl.pt:10400.5/13105
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Digit analysis using Benford's Law : a bayesian approachAnálise da Frequência dos DígitosCalibração do Valor-PLei de BenfordMedidas Condicionais de EvidenciaSelecção Bayesiana de ModelosTestes de HipotesesBayesian Model SelectionBenford's LawConditional Measures of EvidenceDigit AnalysisHypothesis TestingP-Value CalibrationMestrado em Econometria Aplicada e PrevisãoA lei de Benford, regularidade empírica segundo a qual muitos dos conjuntos de números gerados sem intervenção humana exibem um padrão de decaimento logarítmico nas frequências de ocorrência de primeiros dígitos, pode ser utilizada para, através da análise da frequência de dígitos, identificar conjuntos de números potencialmente erróneos ou fraudulentos. Devido ao elevado nível de potência alcançado pelos testes de hipóteses clássicos de dimensão fixa em amostras grandes, espera-se que, se a amostra for suficientemente grande, estes consigam identificar qualquer desvio em relação à lei de Benford, por mais pequeno que seja, como sendo estatisticamente significativo. Isto pode levar à rejeição da presença da lei de Benford em amostras onde o desvio em relação à mesma não tem significância prática e à identificação de amostras legitimas como sendo fraudulentas. Esta dissertação sugere uma abordagem baseada na seleção bayesiana de modelos. A metodologia proposta é aplicada num estudo empírico que utiliza estatísticas macroeconómicas de países da Zona Euro e explora o conflito entre o valor-p e as medidas bayesianas de evidência (fator de Bayes e probabilidades a posteriori) a nível do suporte por elas fornecido à presença da lei de Benford numa amostra. Conclui-se que os testes clássicos rejeitam frequentemente a presença da lei de Benford em amostras onde as medidas bayesianas são favoráveis à sua presença, e que mesmo limites inferiores destas medidas sobre largas famílias de distribuições a priori frequentemente fornecem bastante mais suporte à presença da lei de Benford do que o valor-p e os testes clássicos.According to Benford's law, many of the collections of numbers which are generated without human intervention exhibit a logarithmically decaying pattern in leading digit frequencies. Through digit analysis, this empirical regularity can help identifying erroneous or fraudulent data. Due to the power that classical significance tests with fixed dimension attain in large samples, they produce small p-values and, if the sample is big enough, are able to identify any deviation from Benford's law, no matter how tiny, as statistically significant. This may result in the rejection of Benford's law in samples where the deviations from it are without practical importance, and consequently samples which are legit are likely to be classified as erroneous or fraudulent. This dissertation proposes a Bayesian model selection approach to digit analysis. An empirical application with macroeconomic statistics from Eurozone countries demonstrates the applicability of the suggested methodology and explores the conflict between the p-value and Bayesian measures of evidence (Bayes factors and posterior probabilities) in the support they provide to the presence of Benford's law in a given sample. It is concluded that classical significance tests often reject the presence of Benford's law in samples which are deemed to be in conformance to it by Bayesian measures, and that even lower bounds on such measures over wide classes of prior distributions often provide more evidence in favour of Benford's law than the p-value and classical significance tests seem to suggest.Instituto Superior de Economia e GestãoPaulo, RuiRepositório da Universidade de LisboaFonseca, Pedro Miguel Teles da2017-02-02T13:34:12Z2016-102016-10-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.5/13105engFonseca, Pedro Miguel Teles da (2016). "Digit analysis using Benford's Law : a bayesian approach". Dissertação de Mestrado, Universidade de Lisboa. Instituto Superior de Economia e Gestão.info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-06T14:43:13Zoai:www.repository.utl.pt:10400.5/13105Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T16:59:08.427380Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Digit analysis using Benford's Law : a bayesian approach
title Digit analysis using Benford's Law : a bayesian approach
spellingShingle Digit analysis using Benford's Law : a bayesian approach
Fonseca, Pedro Miguel Teles da
Análise da Frequência dos Dígitos
Calibração do Valor-P
Lei de Benford
Medidas Condicionais de Evidencia
Selecção Bayesiana de Modelos
Testes de Hipoteses
Bayesian Model Selection
Benford's Law
Conditional Measures of Evidence
Digit Analysis
Hypothesis Testing
P-Value Calibration
title_short Digit analysis using Benford's Law : a bayesian approach
title_full Digit analysis using Benford's Law : a bayesian approach
title_fullStr Digit analysis using Benford's Law : a bayesian approach
title_full_unstemmed Digit analysis using Benford's Law : a bayesian approach
title_sort Digit analysis using Benford's Law : a bayesian approach
author Fonseca, Pedro Miguel Teles da
author_facet Fonseca, Pedro Miguel Teles da
author_role author
dc.contributor.none.fl_str_mv Paulo, Rui
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Fonseca, Pedro Miguel Teles da
dc.subject.por.fl_str_mv Análise da Frequência dos Dígitos
Calibração do Valor-P
Lei de Benford
Medidas Condicionais de Evidencia
Selecção Bayesiana de Modelos
Testes de Hipoteses
Bayesian Model Selection
Benford's Law
Conditional Measures of Evidence
Digit Analysis
Hypothesis Testing
P-Value Calibration
topic Análise da Frequência dos Dígitos
Calibração do Valor-P
Lei de Benford
Medidas Condicionais de Evidencia
Selecção Bayesiana de Modelos
Testes de Hipoteses
Bayesian Model Selection
Benford's Law
Conditional Measures of Evidence
Digit Analysis
Hypothesis Testing
P-Value Calibration
description Mestrado em Econometria Aplicada e Previsão
publishDate 2016
dc.date.none.fl_str_mv 2016-10
2016-10-01T00:00:00Z
2017-02-02T13:34:12Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.5/13105
url http://hdl.handle.net/10400.5/13105
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv Fonseca, Pedro Miguel Teles da (2016). "Digit analysis using Benford's Law : a bayesian approach". Dissertação de Mestrado, Universidade de Lisboa. Instituto Superior de Economia e Gestão.
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Instituto Superior de Economia e Gestão
publisher.none.fl_str_mv Instituto Superior de Economia e Gestão
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799131078329368576