Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas

Detalhes bibliográficos
Autor(a) principal: Souza, Danilo Nogueira de
Data de Publicação: 2011
Outros Autores: Studart, Ticiana Marinho de Carvalho, Campos, José Nilson Bezerra, Nogueira, Marcelo Leão, Luna, Renata Mendes
Tipo de documento: Artigo de conferência
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal do Ceará (UFC)
Texto Completo: http://www.repositorio.ufc.br/handle/riufc/10710
Resumo: This paper intends to study the sensibility of two goodness of fit tests – Kolmogorov-Smirnov and Chi-Square – when a set of data is compared with a certain probability distribution. The sensibility for these tests was analyzed using Type I and Type II errors. Several synthetic series with a large number of values, generated by a known distribution (Gamma), were used. These series were submitted to the tests, which assessed the fitting of the data with four distributions: Gamma, Gumbel, Lognormal and Normal. Also, the sensibility analysis considered the variability of the data, represented by the coefficient of variation. In the end, it was found that Kolmogorov-Smirnov test shows higher Type II errors (acceptance of the false distribution) than the Chi-Square test for all the coefficients of variation. But, Kolmogorov-Smirnov test shows zero Type I errors (rejection of the true distribution). It means that this test always “recognizes” the set’s real distribution. It was observed that the series’ number of values greatly influences on the tests’ sensibility. Depending on the coefficient of variation, the rejection of a false distribution, for both tests, occurs only for very large series. In other cases, none of the tests is able to reject the false distribution.
id UFC-7_b4fa69ba3b5483f963ce2d6b5eb80401
oai_identifier_str oai:repositorio.ufc.br:riufc/10710
network_acronym_str UFC-7
network_name_str Repositório Institucional da Universidade Federal do Ceará (UFC)
repository_id_str
spelling Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticasTestes de aderênciaDistribuição de probabilidadeSéries sintéticasThis paper intends to study the sensibility of two goodness of fit tests – Kolmogorov-Smirnov and Chi-Square – when a set of data is compared with a certain probability distribution. The sensibility for these tests was analyzed using Type I and Type II errors. Several synthetic series with a large number of values, generated by a known distribution (Gamma), were used. These series were submitted to the tests, which assessed the fitting of the data with four distributions: Gamma, Gumbel, Lognormal and Normal. Also, the sensibility analysis considered the variability of the data, represented by the coefficient of variation. In the end, it was found that Kolmogorov-Smirnov test shows higher Type II errors (acceptance of the false distribution) than the Chi-Square test for all the coefficients of variation. But, Kolmogorov-Smirnov test shows zero Type I errors (rejection of the true distribution). It means that this test always “recognizes” the set’s real distribution. It was observed that the series’ number of values greatly influences on the tests’ sensibility. Depending on the coefficient of variation, the rejection of a false distribution, for both tests, occurs only for very large series. In other cases, none of the tests is able to reject the false distribution.O artigo se propõe a estudar a sensibilidade de dois testes de aderência –Kolmogorov-Smirnov e Qui-Quadrado – no ajuste de uma série de dados a uma determinada distribuição de probabilidade. A sensibilidade dos testes de ajustamento foi medida através dos erros tipos I e II. Foram utilizadas várias séries sintéticas com diversas extensões, as quais seguiam uma distribuição de probabilidade conhecida. Estas séries foram submetidas aos dois testes, os quais avaliaram o ajustamento a quatro distribuições de probabilidade: Gama, Gumbel, Lognormal e Normal. A sensibilidade também considerou a variabilidade dos dados, representada no coeficiente de variação. Concluiu-se que o teste de Kolmogorov-Smirnov apresenta erros do tipo II maiores do que o teste do Qui-Quadrado, para todos os coeficientes de variação utilizados. Porém, o teste de Kolmogorov-Smirnov apresenta erros do tipo I nulos. Ou seja, para todos os coeficientes de variação analisados, este teste sempre “reconhece” a distribuição real da série. Foi observado que a extensão das séries tem grande influência na sensibilidade dos testes de aderência. Dependendo do coeficiente de variação, a rejeição de uma distribuição falsa, para ambos os testes, só ocorre com séries muito extensas. Em outros casos, nenhum dos dois testes apresenta sensibilidade para rejeitar uma distribuição falsa.Simpósio Brasileiro de Recursos Hídricos2015-02-20T19:22:36Z2015-02-20T19:22:36Z2011info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/conferenceObjectapplication/pdfSOUZA, D. N. et al. Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas. In: SIMPÓSIO BRASILEIRO DE RECURSOS HÍDRICOS, 19., 2011, Maceió. Anais... Maceió: ABRH, 2011.http://www.repositorio.ufc.br/handle/riufc/10710Souza, Danilo Nogueira deStudart, Ticiana Marinho de CarvalhoCampos, José Nilson BezerraNogueira, Marcelo LeãoLuna, Renata Mendesporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFCinfo:eu-repo/semantics/openAccess2022-11-21T12:29:22Zoai:repositorio.ufc.br:riufc/10710Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2024-09-11T18:17:44.142080Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false
dc.title.none.fl_str_mv Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas
title Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas
spellingShingle Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas
Souza, Danilo Nogueira de
Testes de aderência
Distribuição de probabilidade
Séries sintéticas
title_short Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas
title_full Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas
title_fullStr Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas
title_full_unstemmed Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas
title_sort Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas
author Souza, Danilo Nogueira de
author_facet Souza, Danilo Nogueira de
Studart, Ticiana Marinho de Carvalho
Campos, José Nilson Bezerra
Nogueira, Marcelo Leão
Luna, Renata Mendes
author_role author
author2 Studart, Ticiana Marinho de Carvalho
Campos, José Nilson Bezerra
Nogueira, Marcelo Leão
Luna, Renata Mendes
author2_role author
author
author
author
dc.contributor.author.fl_str_mv Souza, Danilo Nogueira de
Studart, Ticiana Marinho de Carvalho
Campos, José Nilson Bezerra
Nogueira, Marcelo Leão
Luna, Renata Mendes
dc.subject.por.fl_str_mv Testes de aderência
Distribuição de probabilidade
Séries sintéticas
topic Testes de aderência
Distribuição de probabilidade
Séries sintéticas
description This paper intends to study the sensibility of two goodness of fit tests – Kolmogorov-Smirnov and Chi-Square – when a set of data is compared with a certain probability distribution. The sensibility for these tests was analyzed using Type I and Type II errors. Several synthetic series with a large number of values, generated by a known distribution (Gamma), were used. These series were submitted to the tests, which assessed the fitting of the data with four distributions: Gamma, Gumbel, Lognormal and Normal. Also, the sensibility analysis considered the variability of the data, represented by the coefficient of variation. In the end, it was found that Kolmogorov-Smirnov test shows higher Type II errors (acceptance of the false distribution) than the Chi-Square test for all the coefficients of variation. But, Kolmogorov-Smirnov test shows zero Type I errors (rejection of the true distribution). It means that this test always “recognizes” the set’s real distribution. It was observed that the series’ number of values greatly influences on the tests’ sensibility. Depending on the coefficient of variation, the rejection of a false distribution, for both tests, occurs only for very large series. In other cases, none of the tests is able to reject the false distribution.
publishDate 2011
dc.date.none.fl_str_mv 2011
2015-02-20T19:22:36Z
2015-02-20T19:22:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/conferenceObject
format conferenceObject
status_str publishedVersion
dc.identifier.uri.fl_str_mv SOUZA, D. N. et al. Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas. In: SIMPÓSIO BRASILEIRO DE RECURSOS HÍDRICOS, 19., 2011, Maceió. Anais... Maceió: ABRH, 2011.
http://www.repositorio.ufc.br/handle/riufc/10710
identifier_str_mv SOUZA, D. N. et al. Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas. In: SIMPÓSIO BRASILEIRO DE RECURSOS HÍDRICOS, 19., 2011, Maceió. Anais... Maceió: ABRH, 2011.
url http://www.repositorio.ufc.br/handle/riufc/10710
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Simpósio Brasileiro de Recursos Hídricos
publisher.none.fl_str_mv Simpósio Brasileiro de Recursos Hídricos
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Ceará (UFC)
instname:Universidade Federal do Ceará (UFC)
instacron:UFC
instname_str Universidade Federal do Ceará (UFC)
instacron_str UFC
institution UFC
reponame_str Repositório Institucional da Universidade Federal do Ceará (UFC)
collection Repositório Institucional da Universidade Federal do Ceará (UFC)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)
repository.mail.fl_str_mv bu@ufc.br || repositorio@ufc.br
_version_ 1813028742673465344