Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2011 |
Outros Autores: | , , , |
Tipo de documento: | Artigo de conferência |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal do Ceará (UFC) |
Texto Completo: | http://www.repositorio.ufc.br/handle/riufc/10710 |
Resumo: | This paper intends to study the sensibility of two goodness of fit tests – Kolmogorov-Smirnov and Chi-Square – when a set of data is compared with a certain probability distribution. The sensibility for these tests was analyzed using Type I and Type II errors. Several synthetic series with a large number of values, generated by a known distribution (Gamma), were used. These series were submitted to the tests, which assessed the fitting of the data with four distributions: Gamma, Gumbel, Lognormal and Normal. Also, the sensibility analysis considered the variability of the data, represented by the coefficient of variation. In the end, it was found that Kolmogorov-Smirnov test shows higher Type II errors (acceptance of the false distribution) than the Chi-Square test for all the coefficients of variation. But, Kolmogorov-Smirnov test shows zero Type I errors (rejection of the true distribution). It means that this test always “recognizes” the set’s real distribution. It was observed that the series’ number of values greatly influences on the tests’ sensibility. Depending on the coefficient of variation, the rejection of a false distribution, for both tests, occurs only for very large series. In other cases, none of the tests is able to reject the false distribution. |
id |
UFC-7_b4fa69ba3b5483f963ce2d6b5eb80401 |
---|---|
oai_identifier_str |
oai:repositorio.ufc.br:riufc/10710 |
network_acronym_str |
UFC-7 |
network_name_str |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
repository_id_str |
|
spelling |
Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticasTestes de aderênciaDistribuição de probabilidadeSéries sintéticasThis paper intends to study the sensibility of two goodness of fit tests – Kolmogorov-Smirnov and Chi-Square – when a set of data is compared with a certain probability distribution. The sensibility for these tests was analyzed using Type I and Type II errors. Several synthetic series with a large number of values, generated by a known distribution (Gamma), were used. These series were submitted to the tests, which assessed the fitting of the data with four distributions: Gamma, Gumbel, Lognormal and Normal. Also, the sensibility analysis considered the variability of the data, represented by the coefficient of variation. In the end, it was found that Kolmogorov-Smirnov test shows higher Type II errors (acceptance of the false distribution) than the Chi-Square test for all the coefficients of variation. But, Kolmogorov-Smirnov test shows zero Type I errors (rejection of the true distribution). It means that this test always “recognizes” the set’s real distribution. It was observed that the series’ number of values greatly influences on the tests’ sensibility. Depending on the coefficient of variation, the rejection of a false distribution, for both tests, occurs only for very large series. In other cases, none of the tests is able to reject the false distribution.O artigo se propõe a estudar a sensibilidade de dois testes de aderência –Kolmogorov-Smirnov e Qui-Quadrado – no ajuste de uma série de dados a uma determinada distribuição de probabilidade. A sensibilidade dos testes de ajustamento foi medida através dos erros tipos I e II. Foram utilizadas várias séries sintéticas com diversas extensões, as quais seguiam uma distribuição de probabilidade conhecida. Estas séries foram submetidas aos dois testes, os quais avaliaram o ajustamento a quatro distribuições de probabilidade: Gama, Gumbel, Lognormal e Normal. A sensibilidade também considerou a variabilidade dos dados, representada no coeficiente de variação. Concluiu-se que o teste de Kolmogorov-Smirnov apresenta erros do tipo II maiores do que o teste do Qui-Quadrado, para todos os coeficientes de variação utilizados. Porém, o teste de Kolmogorov-Smirnov apresenta erros do tipo I nulos. Ou seja, para todos os coeficientes de variação analisados, este teste sempre “reconhece” a distribuição real da série. Foi observado que a extensão das séries tem grande influência na sensibilidade dos testes de aderência. Dependendo do coeficiente de variação, a rejeição de uma distribuição falsa, para ambos os testes, só ocorre com séries muito extensas. Em outros casos, nenhum dos dois testes apresenta sensibilidade para rejeitar uma distribuição falsa.Simpósio Brasileiro de Recursos Hídricos2015-02-20T19:22:36Z2015-02-20T19:22:36Z2011info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/conferenceObjectapplication/pdfSOUZA, D. N. et al. Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas. In: SIMPÓSIO BRASILEIRO DE RECURSOS HÍDRICOS, 19., 2011, Maceió. Anais... Maceió: ABRH, 2011.http://www.repositorio.ufc.br/handle/riufc/10710Souza, Danilo Nogueira deStudart, Ticiana Marinho de CarvalhoCampos, José Nilson BezerraNogueira, Marcelo LeãoLuna, Renata Mendesporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFCinfo:eu-repo/semantics/openAccess2022-11-21T12:29:22Zoai:repositorio.ufc.br:riufc/10710Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2024-09-11T18:17:44.142080Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false |
dc.title.none.fl_str_mv |
Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas |
title |
Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas |
spellingShingle |
Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas Souza, Danilo Nogueira de Testes de aderência Distribuição de probabilidade Séries sintéticas |
title_short |
Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas |
title_full |
Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas |
title_fullStr |
Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas |
title_full_unstemmed |
Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas |
title_sort |
Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas |
author |
Souza, Danilo Nogueira de |
author_facet |
Souza, Danilo Nogueira de Studart, Ticiana Marinho de Carvalho Campos, José Nilson Bezerra Nogueira, Marcelo Leão Luna, Renata Mendes |
author_role |
author |
author2 |
Studart, Ticiana Marinho de Carvalho Campos, José Nilson Bezerra Nogueira, Marcelo Leão Luna, Renata Mendes |
author2_role |
author author author author |
dc.contributor.author.fl_str_mv |
Souza, Danilo Nogueira de Studart, Ticiana Marinho de Carvalho Campos, José Nilson Bezerra Nogueira, Marcelo Leão Luna, Renata Mendes |
dc.subject.por.fl_str_mv |
Testes de aderência Distribuição de probabilidade Séries sintéticas |
topic |
Testes de aderência Distribuição de probabilidade Séries sintéticas |
description |
This paper intends to study the sensibility of two goodness of fit tests – Kolmogorov-Smirnov and Chi-Square – when a set of data is compared with a certain probability distribution. The sensibility for these tests was analyzed using Type I and Type II errors. Several synthetic series with a large number of values, generated by a known distribution (Gamma), were used. These series were submitted to the tests, which assessed the fitting of the data with four distributions: Gamma, Gumbel, Lognormal and Normal. Also, the sensibility analysis considered the variability of the data, represented by the coefficient of variation. In the end, it was found that Kolmogorov-Smirnov test shows higher Type II errors (acceptance of the false distribution) than the Chi-Square test for all the coefficients of variation. But, Kolmogorov-Smirnov test shows zero Type I errors (rejection of the true distribution). It means that this test always “recognizes” the set’s real distribution. It was observed that the series’ number of values greatly influences on the tests’ sensibility. Depending on the coefficient of variation, the rejection of a false distribution, for both tests, occurs only for very large series. In other cases, none of the tests is able to reject the false distribution. |
publishDate |
2011 |
dc.date.none.fl_str_mv |
2011 2015-02-20T19:22:36Z 2015-02-20T19:22:36Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/conferenceObject |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SOUZA, D. N. et al. Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas. In: SIMPÓSIO BRASILEIRO DE RECURSOS HÍDRICOS, 19., 2011, Maceió. Anais... Maceió: ABRH, 2011. http://www.repositorio.ufc.br/handle/riufc/10710 |
identifier_str_mv |
SOUZA, D. N. et al. Estudo dos erros tipos I e II para testes de aderência utilizando séries sintéticas. In: SIMPÓSIO BRASILEIRO DE RECURSOS HÍDRICOS, 19., 2011, Maceió. Anais... Maceió: ABRH, 2011. |
url |
http://www.repositorio.ufc.br/handle/riufc/10710 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Simpósio Brasileiro de Recursos Hídricos |
publisher.none.fl_str_mv |
Simpósio Brasileiro de Recursos Hídricos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Ceará (UFC) instname:Universidade Federal do Ceará (UFC) instacron:UFC |
instname_str |
Universidade Federal do Ceará (UFC) |
instacron_str |
UFC |
institution |
UFC |
reponame_str |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
collection |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC) |
repository.mail.fl_str_mv |
bu@ufc.br || repositorio@ufc.br |
_version_ |
1813028742673465344 |