Estimadores viesados para modelos de regressão em presença de multicolinearidade

Detalhes bibliográficos
Autor(a) principal: Fernando Ferrari
Data de Publicação: 1989
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://doi.org/10.11606/T.11.2020.tde-20200111-132820
Resumo: No presente trabalho, analisou-se o desempenho de dois estimadores viesados, a saber, o estimador sobre cristas e o estimador em componentes principais, como métodos alternativos ao estimador de mínimos quadrados no ajuste de modelos de regressão, quando os dados têm problemas de multicolinearidade. Para tanto, considerou-se o modelo de regressão linear múltipla: Y = X&#946; + &#949; onde, y = vetor de observações da variável dependente na forma padronizada, de dimensões nx1. X = Matriz dos valores das variáveis independentes na forma padronizada, de dimensões nxp, de posto p < n; &#946; = Vetor de constantes desconhecidas, de dimensões px1 ; &#949; = vetor de erros aleatórios não observáveis, de dimensões nx1, tal que E(&#949;) = &#216; e E(&#949;&#949;’) = &#963;2 In. Como as variáveis independentes e a variável dependente são consideradas na forma padronizada, X’X é a matriz de correlações entre as variáveis independentes , e X’ y é o vetor de correlações entre as variáveis independentes e a variável dependente. Para obter-se uma maior abrangência nas comparações entre os estimadores adotados, procedeu-se a um estudo de simulação, onde foram analisados dois modelos distintos, conforme o número p de variáveis independentes envolvidas. Também foram analisados dois valores para o número n de observações sobre cada variável independente. Em cada um desses modelos, foram considerados quatro configurações, segundo uma estrutura de correlação, que foi estabelecida entre as variáveis independentes. Como critérios de comparações, entre os métodos de estimação abordados, consideraram-se:
id USP_c06a25d684805310f01bf963ba111815
oai_identifier_str oai:teses.usp.br:tde-20200111-132820
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis Estimadores viesados para modelos de regressão em presença de multicolinearidade Biased estimators for regression models in the presence of multicollinearity 1989-12-22Antonio Francisco IemmaFernando FerrariUniversidade de São PauloAgronomia (Estatística e Experimentação Agronômica)USPBR COMPONENTES PRINCIPAIS ESTIMADORES MODELOS DE REGRESSÃO LINEAR MULTICOLINEARIDADE No presente trabalho, analisou-se o desempenho de dois estimadores viesados, a saber, o estimador sobre cristas e o estimador em componentes principais, como métodos alternativos ao estimador de mínimos quadrados no ajuste de modelos de regressão, quando os dados têm problemas de multicolinearidade. Para tanto, considerou-se o modelo de regressão linear múltipla: Y = X&#946; + &#949; onde, y = vetor de observações da variável dependente na forma padronizada, de dimensões nx1. X = Matriz dos valores das variáveis independentes na forma padronizada, de dimensões nxp, de posto p < n; &#946; = Vetor de constantes desconhecidas, de dimensões px1 ; &#949; = vetor de erros aleatórios não observáveis, de dimensões nx1, tal que E(&#949;) = &#216; e E(&#949;&#949;’) = &#963;2 In. Como as variáveis independentes e a variável dependente são consideradas na forma padronizada, X’X é a matriz de correlações entre as variáveis independentes , e X’ y é o vetor de correlações entre as variáveis independentes e a variável dependente. Para obter-se uma maior abrangência nas comparações entre os estimadores adotados, procedeu-se a um estudo de simulação, onde foram analisados dois modelos distintos, conforme o número p de variáveis independentes envolvidas. Também foram analisados dois valores para o número n de observações sobre cada variável independente. Em cada um desses modelos, foram considerados quatro configurações, segundo uma estrutura de correlação, que foi estabelecida entre as variáveis independentes. Como critérios de comparações, entre os métodos de estimação abordados, consideraram-se: This work consists of fitting linear models on data having problems of multicollinearity, and analyses two biased estimators, namely, the ridge regression estimator, and the principal components estimator. These estimators are considered as alternatives to the least square estimator. For this purpose the following multiple linear regression model was considered: Y = X&#946; + &#949; where y is an nx1 response vector in the standardized form; x is an nxp full column rank matrix of n observation on p regressor variables in the standardized form; &#946; is a px1 parameter-vector; &#949; is a nx1 vector unobservable random-errors, with E(&#949;) = &#216; e E(&#949;&#949;’) = &#963;2 In. As the regressor variables and the response variables are considered in the standardized form, X’X is the correlation matrix between the regressor variables, and x’y is the vector of correlation between the regressor variables and the response variables. To get a broader scope the comparisons of the adopted estimators, simulations were made, where two distinct models were analysed according to the number p of independent variables involved. Two values for the number n of observations about each independent variable were also analysed. In each of these models four configurations, according to a structure of correlation which was established among the independent variables, were considered. The following two criteria of comparisons among the methods of estimators studied, were considered : 1 - L21 = ( b - &#946; )’(b - &#946; ) to measure estimation accuracy, and 2 -L22 = (b -&#946;)’ X’X( b - &#946;) to measure prediction accuracy so that the values of b in L21 e L22 refer to the estimators considered, namely, least squares, ridge regression and principal components regression estimators. https://doi.org/10.11606/T.11.2020.tde-20200111-132820info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2023-12-21T19:38:45Zoai:teses.usp.br:tde-20200111-132820Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-12-22T13:01:27.352163Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.pt.fl_str_mv Estimadores viesados para modelos de regressão em presença de multicolinearidade
dc.title.alternative.en.fl_str_mv Biased estimators for regression models in the presence of multicollinearity
title Estimadores viesados para modelos de regressão em presença de multicolinearidade
spellingShingle Estimadores viesados para modelos de regressão em presença de multicolinearidade
Fernando Ferrari
title_short Estimadores viesados para modelos de regressão em presença de multicolinearidade
title_full Estimadores viesados para modelos de regressão em presença de multicolinearidade
title_fullStr Estimadores viesados para modelos de regressão em presença de multicolinearidade
title_full_unstemmed Estimadores viesados para modelos de regressão em presença de multicolinearidade
title_sort Estimadores viesados para modelos de regressão em presença de multicolinearidade
author Fernando Ferrari
author_facet Fernando Ferrari
author_role author
dc.contributor.advisor1.fl_str_mv Antonio Francisco Iemma
dc.contributor.author.fl_str_mv Fernando Ferrari
contributor_str_mv Antonio Francisco Iemma
description No presente trabalho, analisou-se o desempenho de dois estimadores viesados, a saber, o estimador sobre cristas e o estimador em componentes principais, como métodos alternativos ao estimador de mínimos quadrados no ajuste de modelos de regressão, quando os dados têm problemas de multicolinearidade. Para tanto, considerou-se o modelo de regressão linear múltipla: Y = X&#946; + &#949; onde, y = vetor de observações da variável dependente na forma padronizada, de dimensões nx1. X = Matriz dos valores das variáveis independentes na forma padronizada, de dimensões nxp, de posto p < n; &#946; = Vetor de constantes desconhecidas, de dimensões px1 ; &#949; = vetor de erros aleatórios não observáveis, de dimensões nx1, tal que E(&#949;) = &#216; e E(&#949;&#949;’) = &#963;2 In. Como as variáveis independentes e a variável dependente são consideradas na forma padronizada, X’X é a matriz de correlações entre as variáveis independentes , e X’ y é o vetor de correlações entre as variáveis independentes e a variável dependente. Para obter-se uma maior abrangência nas comparações entre os estimadores adotados, procedeu-se a um estudo de simulação, onde foram analisados dois modelos distintos, conforme o número p de variáveis independentes envolvidas. Também foram analisados dois valores para o número n de observações sobre cada variável independente. Em cada um desses modelos, foram considerados quatro configurações, segundo uma estrutura de correlação, que foi estabelecida entre as variáveis independentes. Como critérios de comparações, entre os métodos de estimação abordados, consideraram-se:
publishDate 1989
dc.date.issued.fl_str_mv 1989-12-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.11606/T.11.2020.tde-20200111-132820
url https://doi.org/10.11606/T.11.2020.tde-20200111-132820
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade de São Paulo
dc.publisher.program.fl_str_mv Agronomia (Estatística e Experimentação Agronômica)
dc.publisher.initials.fl_str_mv USP
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade de São Paulo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1794502915559260160