Classificação com inferência para dados de alta dimensão
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/247555 |
Resumo: | Neste trabalho propomos um método de classificação com inferência para dois ou mais grupos no contexto de alta dimensionalidade e baixo tamanho amostral. Nesse contexto, o método de classificação proposto é comparado com uma metodologia recentemente proposta, através de simulações e aplicação a dados reais. Além disso, um teste de hipóteses é proposto e as propriedades assintóticas da estatística de teste são obtidas, no entanto a estimação da variância se dá a partir de um procedimento de reamostragem. Resultados das simulações mostram que o classificador é competitivo com a metodologia existente e a possibilidade de identificar se a classificação em um determinado grupo é estatisticamente significativa possibilita controlar o erro do tipo I, mostrando-se uma importante ferramenta em problemas de classificação. |
id |
URGS_d5e2931cc607d2fa8840eb1918dbe06a |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/247555 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Lacerda, Eduardo CavalliValk, MárcioCybis, Gabriela Bettella2022-08-20T04:55:56Z2022http://hdl.handle.net/10183/247555001147607Neste trabalho propomos um método de classificação com inferência para dois ou mais grupos no contexto de alta dimensionalidade e baixo tamanho amostral. Nesse contexto, o método de classificação proposto é comparado com uma metodologia recentemente proposta, através de simulações e aplicação a dados reais. Além disso, um teste de hipóteses é proposto e as propriedades assintóticas da estatística de teste são obtidas, no entanto a estimação da variância se dá a partir de um procedimento de reamostragem. Resultados das simulações mostram que o classificador é competitivo com a metodologia existente e a possibilidade de identificar se a classificação em um determinado grupo é estatisticamente significativa possibilita controlar o erro do tipo I, mostrando-se uma importante ferramenta em problemas de classificação.In this work we propose a classification method with inference for two or more groups in the high dimensional low sample size context. The classification method is compared with a recently proposed methodology, through simulations and application to a real dataset. Furthermore, a hypothesis test is proposed and the asymptotic properties of the test statistics are obtained, however the estimation of the variance is given from a procedure resampling process. Simulation results show that the classifier is competitive with the existing methodology and the possibility of identifying whether the classification in a certain group is statistically significant makes it possible to control the type I error, proving to be an important tool in classification problems.application/pdfporInferenciaTamanho da amostraInferenceHigh Dimensional Low Sample Size (HDLSS)Classification methodU-statisticsClassificação com inferência para dados de alta dimensãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de Matemática e EstatísticaPrograma de Pós-Graduação em EstatísticaPorto Alegre, BR-RS2022mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001147607.pdf.txt001147607.pdf.txtExtracted Texttext/plain138273http://www.lume.ufrgs.br/bitstream/10183/247555/2/001147607.pdf.txta3a689a36c2459ab8a47519b7924a6e3MD52ORIGINAL001147607.pdfTexto completoapplication/pdf2244203http://www.lume.ufrgs.br/bitstream/10183/247555/1/001147607.pdfbbe37f316a8bc00cdbe4829a4e41dbeeMD5110183/2475552022-08-21 04:40:19.724553oai:www.lume.ufrgs.br:10183/247555Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-08-21T07:40:19Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Classificação com inferência para dados de alta dimensão |
title |
Classificação com inferência para dados de alta dimensão |
spellingShingle |
Classificação com inferência para dados de alta dimensão Lacerda, Eduardo Cavalli Inferencia Tamanho da amostra Inference High Dimensional Low Sample Size (HDLSS) Classification method U-statistics |
title_short |
Classificação com inferência para dados de alta dimensão |
title_full |
Classificação com inferência para dados de alta dimensão |
title_fullStr |
Classificação com inferência para dados de alta dimensão |
title_full_unstemmed |
Classificação com inferência para dados de alta dimensão |
title_sort |
Classificação com inferência para dados de alta dimensão |
author |
Lacerda, Eduardo Cavalli |
author_facet |
Lacerda, Eduardo Cavalli |
author_role |
author |
dc.contributor.author.fl_str_mv |
Lacerda, Eduardo Cavalli |
dc.contributor.advisor1.fl_str_mv |
Valk, Márcio |
dc.contributor.advisor-co1.fl_str_mv |
Cybis, Gabriela Bettella |
contributor_str_mv |
Valk, Márcio Cybis, Gabriela Bettella |
dc.subject.por.fl_str_mv |
Inferencia Tamanho da amostra |
topic |
Inferencia Tamanho da amostra Inference High Dimensional Low Sample Size (HDLSS) Classification method U-statistics |
dc.subject.eng.fl_str_mv |
Inference High Dimensional Low Sample Size (HDLSS) Classification method U-statistics |
description |
Neste trabalho propomos um método de classificação com inferência para dois ou mais grupos no contexto de alta dimensionalidade e baixo tamanho amostral. Nesse contexto, o método de classificação proposto é comparado com uma metodologia recentemente proposta, através de simulações e aplicação a dados reais. Além disso, um teste de hipóteses é proposto e as propriedades assintóticas da estatística de teste são obtidas, no entanto a estimação da variância se dá a partir de um procedimento de reamostragem. Resultados das simulações mostram que o classificador é competitivo com a metodologia existente e a possibilidade de identificar se a classificação em um determinado grupo é estatisticamente significativa possibilita controlar o erro do tipo I, mostrando-se uma importante ferramenta em problemas de classificação. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-08-20T04:55:56Z |
dc.date.issued.fl_str_mv |
2022 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/247555 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001147607 |
url |
http://hdl.handle.net/10183/247555 |
identifier_str_mv |
001147607 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/247555/2/001147607.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/247555/1/001147607.pdf |
bitstream.checksum.fl_str_mv |
a3a689a36c2459ab8a47519b7924a6e3 bbe37f316a8bc00cdbe4829a4e41dbee |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1800309201038213120 |