Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )

Detalhes bibliográficos
Autor(a) principal: Marcelo Henrique Casagrande
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://doi.org/10.11606/D.104.2019.tde-13082019-083254
Resumo: Este trabalho apresenta um estudo comparativo do poder de predição de quatro métodos de regressão adequados para situações nas quais os dados, dispostos na matriz de planejamento, apresentam sérios problemas de multicolinearidade e/ou de alta dimensionalidade, em que o número de covariáveis é maior do que o número de observações. No presente trabalho, os métodos abordados são: regressão por componentes principais, regressão por mínimos quadrados parciais, regressão ridge e LASSO. O trabalho engloba simulações, em que o poder preditivo de cada uma das técnicas é avaliado para diferentes cenários definidos por número de covariáveis, tamanho de amostra e quantidade e intensidade de coeficientes (efeitos) significativos, destacando as principais diferenças entre os métodos e possibilitando a criação de um guia para que o usuário possa escolher qual metodologia usar com base em algum conhecimento prévio que o mesmo possa ter. Uma aplicação em dados reais (não simulados) também é abordada.
id USP_60f687a5b47cd946f00e6a818713c7a9
oai_identifier_str oai:teses.usp.br:tde-13082019-083254
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n ) Comparison of estimation methods for problems with collinear and/or high dimensionality (p > n) 2016-04-29Carlos Alberto Ribeiro DinizCaio Lucidius Naberezny AzevedoEnrico Antônio ColosimoMarcelo Henrique CasagrandeUniversidade de São PauloEstatísticaUSPBR Alta dimensionalidade Highdimensionality LASSO LASSO Mínimos quadrados parciais Partial least squares Principal component regression Regressão por componentes principais Regressão ridge Ridge regression Este trabalho apresenta um estudo comparativo do poder de predição de quatro métodos de regressão adequados para situações nas quais os dados, dispostos na matriz de planejamento, apresentam sérios problemas de multicolinearidade e/ou de alta dimensionalidade, em que o número de covariáveis é maior do que o número de observações. No presente trabalho, os métodos abordados são: regressão por componentes principais, regressão por mínimos quadrados parciais, regressão ridge e LASSO. O trabalho engloba simulações, em que o poder preditivo de cada uma das técnicas é avaliado para diferentes cenários definidos por número de covariáveis, tamanho de amostra e quantidade e intensidade de coeficientes (efeitos) significativos, destacando as principais diferenças entre os métodos e possibilitando a criação de um guia para que o usuário possa escolher qual metodologia usar com base em algum conhecimento prévio que o mesmo possa ter. Uma aplicação em dados reais (não simulados) também é abordada. This paper presents a comparative study of the predictive power of four suitable regression methods for situations in which data, arranged in the planning matrix, are very poorly multicolinearity and / or highdimensionality, wherein the number of covariatesis greater the number of observations. In this study, the methods discussed are: principal component regression,partial least squares regression,ridge regression and LASSO. The work includes simulations, where in the predictive power of each of the techniques is evaluated for different scenarios defined by the number of covariates, sample size and quantity and intensity ratios (effects) significant, high lighting the main dffierences between the methods and allowing for the creating a guide for the user to choose which method to use based on some prior knowledge that it may have. An applicationon real data (not simulated) is also addressed. https://doi.org/10.11606/D.104.2019.tde-13082019-083254info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2023-12-21T18:52:34Zoai:teses.usp.br:tde-13082019-083254Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-12-22T12:36:33.433766Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.pt.fl_str_mv Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
dc.title.alternative.en.fl_str_mv Comparison of estimation methods for problems with collinear and/or high dimensionality (p > n)
title Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
spellingShingle Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
Marcelo Henrique Casagrande
title_short Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
title_full Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
title_fullStr Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
title_full_unstemmed Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
title_sort Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
author Marcelo Henrique Casagrande
author_facet Marcelo Henrique Casagrande
author_role author
dc.contributor.advisor1.fl_str_mv Carlos Alberto Ribeiro Diniz
dc.contributor.referee1.fl_str_mv Caio Lucidius Naberezny Azevedo
dc.contributor.referee2.fl_str_mv Enrico Antônio Colosimo
dc.contributor.author.fl_str_mv Marcelo Henrique Casagrande
contributor_str_mv Carlos Alberto Ribeiro Diniz
Caio Lucidius Naberezny Azevedo
Enrico Antônio Colosimo
description Este trabalho apresenta um estudo comparativo do poder de predição de quatro métodos de regressão adequados para situações nas quais os dados, dispostos na matriz de planejamento, apresentam sérios problemas de multicolinearidade e/ou de alta dimensionalidade, em que o número de covariáveis é maior do que o número de observações. No presente trabalho, os métodos abordados são: regressão por componentes principais, regressão por mínimos quadrados parciais, regressão ridge e LASSO. O trabalho engloba simulações, em que o poder preditivo de cada uma das técnicas é avaliado para diferentes cenários definidos por número de covariáveis, tamanho de amostra e quantidade e intensidade de coeficientes (efeitos) significativos, destacando as principais diferenças entre os métodos e possibilitando a criação de um guia para que o usuário possa escolher qual metodologia usar com base em algum conhecimento prévio que o mesmo possa ter. Uma aplicação em dados reais (não simulados) também é abordada.
publishDate 2016
dc.date.issued.fl_str_mv 2016-04-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.11606/D.104.2019.tde-13082019-083254
url https://doi.org/10.11606/D.104.2019.tde-13082019-083254
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade de São Paulo
dc.publisher.program.fl_str_mv Estatística
dc.publisher.initials.fl_str_mv USP
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade de São Paulo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1794502710148464640