Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)

Detalhes bibliográficos
Autor(a) principal: Casagrande, Marcelo Henrique
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/7954
Resumo: This paper presents a comparative study of the predictive power of four suitable regression methods for situations in which data, arranged in the planning matrix, are very poorly multicolinearity and / or high dimensionality, wherein the number of covariates is greater the number of observations. In this study, the methods discussed are: principal component regression, partial least squares regression, ridge regression and LASSO. The work includes simulations, wherein the predictive power of each of the techniques is evaluated for di erent scenarios de ned by the number of covariates, sample size and quantity and intensity ratios (e ects) signi cant, highlighting the main di erences between the methods and allowing for the creating a guide for the user to choose which method to use based on some prior knowledge that it may have. An application on real data (not simulated) is also addressed.
id SCAR_1bf3b69e6e34195ff4c9d8f6d111e75d
oai_identifier_str oai:repositorio.ufscar.br:ufscar/7954
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Casagrande, Marcelo HenriqueDiniz, Carlos Alberto Ribeirohttp://lattes.cnpq.br/3277371897783194http://lattes.cnpq.br/95694316402751683e2b1b70-4092-4785-b33f-b4508c50d6792016-10-20T13:58:52Z2016-10-20T13:58:52Z2016-04-29CASAGRANDE, Marcelo Henrique. Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n). 2016. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/ufscar/7954.https://repositorio.ufscar.br/handle/ufscar/7954This paper presents a comparative study of the predictive power of four suitable regression methods for situations in which data, arranged in the planning matrix, are very poorly multicolinearity and / or high dimensionality, wherein the number of covariates is greater the number of observations. In this study, the methods discussed are: principal component regression, partial least squares regression, ridge regression and LASSO. The work includes simulations, wherein the predictive power of each of the techniques is evaluated for di erent scenarios de ned by the number of covariates, sample size and quantity and intensity ratios (e ects) signi cant, highlighting the main di erences between the methods and allowing for the creating a guide for the user to choose which method to use based on some prior knowledge that it may have. An application on real data (not simulated) is also addressed.Este trabalho apresenta um estudo comparativo do poder de predi c~ao de quatro m etodos de regress~ao adequados para situa c~oes nas quais os dados, dispostos na matriz de planejamento, apresentam s erios problemas de multicolinearidade e/ou de alta dimensionalidade, em que o n umero de covari aveis e maior do que o n umero de observa c~oes. No presente trabalho, os m etodos abordados s~ao: regress~ao por componentes principais, regress~ao por m nimos quadrados parciais, regress~ao ridge e LASSO. O trabalho engloba simula c~oes, em que o poder preditivo de cada uma das t ecnicas e avaliado para diferentes cen arios de nidos por n umero de covari aveis, tamanho de amostra e quantidade e intensidade de coe cientes (efeitos) signi cativos, destacando as principais diferen cas entre os m etodos e possibilitando a cria c~ao de um guia para que o usu ario possa escolher qual metodologia usar com base em algum conhecimento pr evio que o mesmo possa ter. Uma aplica c~ao em dados reais (n~ao simulados) tamb em e abordadaCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarRegressão ridgeLASSOMínimos quadrados parciaisRegressão por componentes principaisAlta dimensionalidadeRidge regressionPartial least squaresPrincipal component regressionHigh dimensionalityCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICAComparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisOnline60060084611362-11c0-4efd-b118-a7df9999df87info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissMHC.pdfDissMHC.pdfapplication/pdf1077783https://repositorio.ufscar.br/bitstream/ufscar/7954/1/DissMHC.pdfc81f777131e6de8fb219b8c34c4337dfMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81957https://repositorio.ufscar.br/bitstream/ufscar/7954/2/license.txtae0398b6f8b235e40ad82cba6c50031dMD52TEXTDissMHC.pdf.txtDissMHC.pdf.txtExtracted texttext/plain111643https://repositorio.ufscar.br/bitstream/ufscar/7954/3/DissMHC.pdf.txtcbc5ee73007a7205e3df2d2a5fe877e8MD53THUMBNAILDissMHC.pdf.jpgDissMHC.pdf.jpgIM Thumbnailimage/jpeg5131https://repositorio.ufscar.br/bitstream/ufscar/7954/4/DissMHC.pdf.jpg37737b1e7771615b24840087ce31f0aaMD54ufscar/79542023-09-18 18:31:01.334oai:repositorio.ufscar.br:ufscar/7954TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlCkZlZGVyYWwgZGUgU8OjbyBDYXJsb3MgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdQpkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlCmVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyBmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZTQ2FyIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28KcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGU0NhciBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgYSBzdWEgdGVzZSBvdQpkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcwpuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldQpjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6oKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFVGU0NhcgpvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRlNDYXIsClZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVRlNDYXIgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:01Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)
title Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)
spellingShingle Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)
Casagrande, Marcelo Henrique
Regressão ridge
LASSO
Mínimos quadrados parciais
Regressão por componentes principais
Alta dimensionalidade
Ridge regression
Partial least squares
Principal component regression
High dimensionality
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
title_short Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)
title_full Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)
title_fullStr Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)
title_full_unstemmed Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)
title_sort Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)
author Casagrande, Marcelo Henrique
author_facet Casagrande, Marcelo Henrique
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/9569431640275168
dc.contributor.author.fl_str_mv Casagrande, Marcelo Henrique
dc.contributor.advisor1.fl_str_mv Diniz, Carlos Alberto Ribeiro
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/3277371897783194
dc.contributor.authorID.fl_str_mv 3e2b1b70-4092-4785-b33f-b4508c50d679
contributor_str_mv Diniz, Carlos Alberto Ribeiro
dc.subject.por.fl_str_mv Regressão ridge
LASSO
Mínimos quadrados parciais
Regressão por componentes principais
Alta dimensionalidade
topic Regressão ridge
LASSO
Mínimos quadrados parciais
Regressão por componentes principais
Alta dimensionalidade
Ridge regression
Partial least squares
Principal component regression
High dimensionality
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
dc.subject.eng.fl_str_mv Ridge regression
Partial least squares
Principal component regression
High dimensionality
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
description This paper presents a comparative study of the predictive power of four suitable regression methods for situations in which data, arranged in the planning matrix, are very poorly multicolinearity and / or high dimensionality, wherein the number of covariates is greater the number of observations. In this study, the methods discussed are: principal component regression, partial least squares regression, ridge regression and LASSO. The work includes simulations, wherein the predictive power of each of the techniques is evaluated for di erent scenarios de ned by the number of covariates, sample size and quantity and intensity ratios (e ects) signi cant, highlighting the main di erences between the methods and allowing for the creating a guide for the user to choose which method to use based on some prior knowledge that it may have. An application on real data (not simulated) is also addressed.
publishDate 2016
dc.date.accessioned.fl_str_mv 2016-10-20T13:58:52Z
dc.date.available.fl_str_mv 2016-10-20T13:58:52Z
dc.date.issued.fl_str_mv 2016-04-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv CASAGRANDE, Marcelo Henrique. Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n). 2016. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/ufscar/7954.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/7954
identifier_str_mv CASAGRANDE, Marcelo Henrique. Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n). 2016. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/ufscar/7954.
url https://repositorio.ufscar.br/handle/ufscar/7954
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv 84611362-11c0-4efd-b118-a7df9999df87
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/7954/1/DissMHC.pdf
https://repositorio.ufscar.br/bitstream/ufscar/7954/2/license.txt
https://repositorio.ufscar.br/bitstream/ufscar/7954/3/DissMHC.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/7954/4/DissMHC.pdf.jpg
bitstream.checksum.fl_str_mv c81f777131e6de8fb219b8c34c4337df
ae0398b6f8b235e40ad82cba6c50031d
cbc5ee73007a7205e3df2d2a5fe877e8
37737b1e7771615b24840087ce31f0aa
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1802136312994594816