Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/7954 |
Resumo: | This paper presents a comparative study of the predictive power of four suitable regression methods for situations in which data, arranged in the planning matrix, are very poorly multicolinearity and / or high dimensionality, wherein the number of covariates is greater the number of observations. In this study, the methods discussed are: principal component regression, partial least squares regression, ridge regression and LASSO. The work includes simulations, wherein the predictive power of each of the techniques is evaluated for di erent scenarios de ned by the number of covariates, sample size and quantity and intensity ratios (e ects) signi cant, highlighting the main di erences between the methods and allowing for the creating a guide for the user to choose which method to use based on some prior knowledge that it may have. An application on real data (not simulated) is also addressed. |
id |
SCAR_1bf3b69e6e34195ff4c9d8f6d111e75d |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/7954 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Casagrande, Marcelo HenriqueDiniz, Carlos Alberto Ribeirohttp://lattes.cnpq.br/3277371897783194http://lattes.cnpq.br/95694316402751683e2b1b70-4092-4785-b33f-b4508c50d6792016-10-20T13:58:52Z2016-10-20T13:58:52Z2016-04-29CASAGRANDE, Marcelo Henrique. Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n). 2016. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/ufscar/7954.https://repositorio.ufscar.br/handle/ufscar/7954This paper presents a comparative study of the predictive power of four suitable regression methods for situations in which data, arranged in the planning matrix, are very poorly multicolinearity and / or high dimensionality, wherein the number of covariates is greater the number of observations. In this study, the methods discussed are: principal component regression, partial least squares regression, ridge regression and LASSO. The work includes simulations, wherein the predictive power of each of the techniques is evaluated for di erent scenarios de ned by the number of covariates, sample size and quantity and intensity ratios (e ects) signi cant, highlighting the main di erences between the methods and allowing for the creating a guide for the user to choose which method to use based on some prior knowledge that it may have. An application on real data (not simulated) is also addressed.Este trabalho apresenta um estudo comparativo do poder de predi c~ao de quatro m etodos de regress~ao adequados para situa c~oes nas quais os dados, dispostos na matriz de planejamento, apresentam s erios problemas de multicolinearidade e/ou de alta dimensionalidade, em que o n umero de covari aveis e maior do que o n umero de observa c~oes. No presente trabalho, os m etodos abordados s~ao: regress~ao por componentes principais, regress~ao por m nimos quadrados parciais, regress~ao ridge e LASSO. O trabalho engloba simula c~oes, em que o poder preditivo de cada uma das t ecnicas e avaliado para diferentes cen arios de nidos por n umero de covari aveis, tamanho de amostra e quantidade e intensidade de coe cientes (efeitos) signi cativos, destacando as principais diferen cas entre os m etodos e possibilitando a cria c~ao de um guia para que o usu ario possa escolher qual metodologia usar com base em algum conhecimento pr evio que o mesmo possa ter. Uma aplica c~ao em dados reais (n~ao simulados) tamb em e abordadaCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarRegressão ridgeLASSOMínimos quadrados parciaisRegressão por componentes principaisAlta dimensionalidadeRidge regressionPartial least squaresPrincipal component regressionHigh dimensionalityCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICAComparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisOnline60060084611362-11c0-4efd-b118-a7df9999df87info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissMHC.pdfDissMHC.pdfapplication/pdf1077783https://repositorio.ufscar.br/bitstream/ufscar/7954/1/DissMHC.pdfc81f777131e6de8fb219b8c34c4337dfMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81957https://repositorio.ufscar.br/bitstream/ufscar/7954/2/license.txtae0398b6f8b235e40ad82cba6c50031dMD52TEXTDissMHC.pdf.txtDissMHC.pdf.txtExtracted texttext/plain111643https://repositorio.ufscar.br/bitstream/ufscar/7954/3/DissMHC.pdf.txtcbc5ee73007a7205e3df2d2a5fe877e8MD53THUMBNAILDissMHC.pdf.jpgDissMHC.pdf.jpgIM Thumbnailimage/jpeg5131https://repositorio.ufscar.br/bitstream/ufscar/7954/4/DissMHC.pdf.jpg37737b1e7771615b24840087ce31f0aaMD54ufscar/79542023-09-18 18:31:01.334oai:repositorio.ufscar.br:ufscar/7954TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlCkZlZGVyYWwgZGUgU8OjbyBDYXJsb3MgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdQpkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlCmVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyBmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZTQ2FyIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28KcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGU0NhciBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgYSBzdWEgdGVzZSBvdQpkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcwpuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldQpjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6oKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFVGU0NhcgpvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRlNDYXIsClZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVRlNDYXIgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:01Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) |
title |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) |
spellingShingle |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) Casagrande, Marcelo Henrique Regressão ridge LASSO Mínimos quadrados parciais Regressão por componentes principais Alta dimensionalidade Ridge regression Partial least squares Principal component regression High dimensionality CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
title_short |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) |
title_full |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) |
title_fullStr |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) |
title_full_unstemmed |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) |
title_sort |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) |
author |
Casagrande, Marcelo Henrique |
author_facet |
Casagrande, Marcelo Henrique |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/9569431640275168 |
dc.contributor.author.fl_str_mv |
Casagrande, Marcelo Henrique |
dc.contributor.advisor1.fl_str_mv |
Diniz, Carlos Alberto Ribeiro |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/3277371897783194 |
dc.contributor.authorID.fl_str_mv |
3e2b1b70-4092-4785-b33f-b4508c50d679 |
contributor_str_mv |
Diniz, Carlos Alberto Ribeiro |
dc.subject.por.fl_str_mv |
Regressão ridge LASSO Mínimos quadrados parciais Regressão por componentes principais Alta dimensionalidade |
topic |
Regressão ridge LASSO Mínimos quadrados parciais Regressão por componentes principais Alta dimensionalidade Ridge regression Partial least squares Principal component regression High dimensionality CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
dc.subject.eng.fl_str_mv |
Ridge regression Partial least squares Principal component regression High dimensionality |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
description |
This paper presents a comparative study of the predictive power of four suitable regression methods for situations in which data, arranged in the planning matrix, are very poorly multicolinearity and / or high dimensionality, wherein the number of covariates is greater the number of observations. In this study, the methods discussed are: principal component regression, partial least squares regression, ridge regression and LASSO. The work includes simulations, wherein the predictive power of each of the techniques is evaluated for di erent scenarios de ned by the number of covariates, sample size and quantity and intensity ratios (e ects) signi cant, highlighting the main di erences between the methods and allowing for the creating a guide for the user to choose which method to use based on some prior knowledge that it may have. An application on real data (not simulated) is also addressed. |
publishDate |
2016 |
dc.date.accessioned.fl_str_mv |
2016-10-20T13:58:52Z |
dc.date.available.fl_str_mv |
2016-10-20T13:58:52Z |
dc.date.issued.fl_str_mv |
2016-04-29 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
CASAGRANDE, Marcelo Henrique. Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n). 2016. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/ufscar/7954. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/7954 |
identifier_str_mv |
CASAGRANDE, Marcelo Henrique. Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n). 2016. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/ufscar/7954. |
url |
https://repositorio.ufscar.br/handle/ufscar/7954 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
600 600 |
dc.relation.authority.fl_str_mv |
84611362-11c0-4efd-b118-a7df9999df87 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.publisher.program.fl_str_mv |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs |
dc.publisher.initials.fl_str_mv |
UFSCar |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/7954/1/DissMHC.pdf https://repositorio.ufscar.br/bitstream/ufscar/7954/2/license.txt https://repositorio.ufscar.br/bitstream/ufscar/7954/3/DissMHC.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/7954/4/DissMHC.pdf.jpg |
bitstream.checksum.fl_str_mv |
c81f777131e6de8fb219b8c34c4337df ae0398b6f8b235e40ad82cba6c50031d cbc5ee73007a7205e3df2d2a5fe877e8 37737b1e7771615b24840087ce31f0aa |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1802136312994594816 |