Classificação com inferência para dados de alta dimensão

Detalhes bibliográficos
Autor(a) principal: Lacerda, Eduardo Cavalli
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/247555
Resumo: Neste trabalho propomos um método de classificação com inferência para dois ou mais grupos no contexto de alta dimensionalidade e baixo tamanho amostral. Nesse contexto, o método de classificação proposto é comparado com uma metodologia recentemente proposta, através de simulações e aplicação a dados reais. Além disso, um teste de hipóteses é proposto e as propriedades assintóticas da estatística de teste são obtidas, no entanto a estimação da variância se dá a partir de um procedimento de reamostragem. Resultados das simulações mostram que o classificador é competitivo com a metodologia existente e a possibilidade de identificar se a classificação em um determinado grupo é estatisticamente significativa possibilita controlar o erro do tipo I, mostrando-se uma importante ferramenta em problemas de classificação.
id URGS_d5e2931cc607d2fa8840eb1918dbe06a
oai_identifier_str oai:www.lume.ufrgs.br:10183/247555
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Lacerda, Eduardo CavalliValk, MárcioCybis, Gabriela Bettella2022-08-20T04:55:56Z2022http://hdl.handle.net/10183/247555001147607Neste trabalho propomos um método de classificação com inferência para dois ou mais grupos no contexto de alta dimensionalidade e baixo tamanho amostral. Nesse contexto, o método de classificação proposto é comparado com uma metodologia recentemente proposta, através de simulações e aplicação a dados reais. Além disso, um teste de hipóteses é proposto e as propriedades assintóticas da estatística de teste são obtidas, no entanto a estimação da variância se dá a partir de um procedimento de reamostragem. Resultados das simulações mostram que o classificador é competitivo com a metodologia existente e a possibilidade de identificar se a classificação em um determinado grupo é estatisticamente significativa possibilita controlar o erro do tipo I, mostrando-se uma importante ferramenta em problemas de classificação.In this work we propose a classification method with inference for two or more groups in the high dimensional low sample size context. The classification method is compared with a recently proposed methodology, through simulations and application to a real dataset. Furthermore, a hypothesis test is proposed and the asymptotic properties of the test statistics are obtained, however the estimation of the variance is given from a procedure resampling process. Simulation results show that the classifier is competitive with the existing methodology and the possibility of identifying whether the classification in a certain group is statistically significant makes it possible to control the type I error, proving to be an important tool in classification problems.application/pdfporInferenciaTamanho da amostraInferenceHigh Dimensional Low Sample Size (HDLSS)Classification methodU-statisticsClassificação com inferência para dados de alta dimensãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de Matemática e EstatísticaPrograma de Pós-Graduação em EstatísticaPorto Alegre, BR-RS2022mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001147607.pdf.txt001147607.pdf.txtExtracted Texttext/plain138273http://www.lume.ufrgs.br/bitstream/10183/247555/2/001147607.pdf.txta3a689a36c2459ab8a47519b7924a6e3MD52ORIGINAL001147607.pdfTexto completoapplication/pdf2244203http://www.lume.ufrgs.br/bitstream/10183/247555/1/001147607.pdfbbe37f316a8bc00cdbe4829a4e41dbeeMD5110183/2475552022-08-21 04:40:19.724553oai:www.lume.ufrgs.br:10183/247555Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-08-21T07:40:19Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Classificação com inferência para dados de alta dimensão
title Classificação com inferência para dados de alta dimensão
spellingShingle Classificação com inferência para dados de alta dimensão
Lacerda, Eduardo Cavalli
Inferencia
Tamanho da amostra
Inference
High Dimensional Low Sample Size (HDLSS)
Classification method
U-statistics
title_short Classificação com inferência para dados de alta dimensão
title_full Classificação com inferência para dados de alta dimensão
title_fullStr Classificação com inferência para dados de alta dimensão
title_full_unstemmed Classificação com inferência para dados de alta dimensão
title_sort Classificação com inferência para dados de alta dimensão
author Lacerda, Eduardo Cavalli
author_facet Lacerda, Eduardo Cavalli
author_role author
dc.contributor.author.fl_str_mv Lacerda, Eduardo Cavalli
dc.contributor.advisor1.fl_str_mv Valk, Márcio
dc.contributor.advisor-co1.fl_str_mv Cybis, Gabriela Bettella
contributor_str_mv Valk, Márcio
Cybis, Gabriela Bettella
dc.subject.por.fl_str_mv Inferencia
Tamanho da amostra
topic Inferencia
Tamanho da amostra
Inference
High Dimensional Low Sample Size (HDLSS)
Classification method
U-statistics
dc.subject.eng.fl_str_mv Inference
High Dimensional Low Sample Size (HDLSS)
Classification method
U-statistics
description Neste trabalho propomos um método de classificação com inferência para dois ou mais grupos no contexto de alta dimensionalidade e baixo tamanho amostral. Nesse contexto, o método de classificação proposto é comparado com uma metodologia recentemente proposta, através de simulações e aplicação a dados reais. Além disso, um teste de hipóteses é proposto e as propriedades assintóticas da estatística de teste são obtidas, no entanto a estimação da variância se dá a partir de um procedimento de reamostragem. Resultados das simulações mostram que o classificador é competitivo com a metodologia existente e a possibilidade de identificar se a classificação em um determinado grupo é estatisticamente significativa possibilita controlar o erro do tipo I, mostrando-se uma importante ferramenta em problemas de classificação.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-08-20T04:55:56Z
dc.date.issued.fl_str_mv 2022
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/247555
dc.identifier.nrb.pt_BR.fl_str_mv 001147607
url http://hdl.handle.net/10183/247555
identifier_str_mv 001147607
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/247555/2/001147607.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/247555/1/001147607.pdf
bitstream.checksum.fl_str_mv a3a689a36c2459ab8a47519b7924a6e3
bbe37f316a8bc00cdbe4829a4e41dbee
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1800309201038213120