Seleção de variáveis preditivas com base em índices de importância das variáveis e regressão PLS

Detalhes bibliográficos
Autor(a) principal: Zimmer, Juliano
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/75913
Resumo: A presente dissertação propõe métodos para seleção de variáveis preditivas com base em índices de importância das variáveis e regressão PLS (Partial Least Squares). Partindo-se de uma revisão da bibliografia sobre PLS e índices de importância das variáveis, sugere-se um método, denominado Eliminação Backward (EB), para seleção de variáveis a partir da eliminação sistemática de variáveis de acordo com a ordem definida por índices de importância das variáveis. Um novo índice de importância de variáveis, proposto com base nos parâmetros da regressão PLS, tem seu desempenho avaliado frente a outros índices reportados pela literatura. Duas variações do método EB são propostas e testadas através de simulação: (i) o método EBM (Eliminação backward por mínimos), que identifica o conjunto que maximiza o indicador de acurácia preditiva sem considerar o percentual de variáveis retidas, e (ii) o método EBDE (Eliminação backward por distância euclidiana), que seleciona o conjunto de variáveis responsável pela mínima distância euclidiana entre os pontos do perfil gerado pela eliminação das variáveis e um ponto ideal hipotético definido pelo usuário. A aplicação dos três métodos em quatro bancos de dados reais aponta o EBDE como recomendável, visto que retém, em média, apenas 13% das variáveis originais e eleva a acurácia de predição em 32% em relação à utilização de todas as variáveis.
id URGS_28f1fc487897ce5c9028fc58aae2d1c6
oai_identifier_str oai:www.lume.ufrgs.br:10183/75913
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Zimmer, JulianoAnzanello, Michel José2013-07-17T01:49:34Z2012http://hdl.handle.net/10183/75913000891304A presente dissertação propõe métodos para seleção de variáveis preditivas com base em índices de importância das variáveis e regressão PLS (Partial Least Squares). Partindo-se de uma revisão da bibliografia sobre PLS e índices de importância das variáveis, sugere-se um método, denominado Eliminação Backward (EB), para seleção de variáveis a partir da eliminação sistemática de variáveis de acordo com a ordem definida por índices de importância das variáveis. Um novo índice de importância de variáveis, proposto com base nos parâmetros da regressão PLS, tem seu desempenho avaliado frente a outros índices reportados pela literatura. Duas variações do método EB são propostas e testadas através de simulação: (i) o método EBM (Eliminação backward por mínimos), que identifica o conjunto que maximiza o indicador de acurácia preditiva sem considerar o percentual de variáveis retidas, e (ii) o método EBDE (Eliminação backward por distância euclidiana), que seleciona o conjunto de variáveis responsável pela mínima distância euclidiana entre os pontos do perfil gerado pela eliminação das variáveis e um ponto ideal hipotético definido pelo usuário. A aplicação dos três métodos em quatro bancos de dados reais aponta o EBDE como recomendável, visto que retém, em média, apenas 13% das variáveis originais e eleva a acurácia de predição em 32% em relação à utilização de todas as variáveis.This dissertation presents new methods for predictive variable selection based on variable importance indices and PLS regression. The novel method, namely Backward Elimination (BE), selects the most important variables by eliminating process variables according to their importance described by the variable importance indices. A new variable importance index is proposed, and compared to previous indices for that purpose. We then offer two modifications on the BE method: (i) the EBM method, which selects the subset of variables yielding the maximum predictive accuracy (i.e., the minimum residual index), and (ii) the EBDE, which selects the subset leading to the minimum Euclidian distance between the points generated by variable removal and a hypothetical ideal point defined by the user. When applied to four manufacturing data sets, the recommended method, EBDE, retains average 13% of the original variables and increases the prediction accuracy in average 32% compared to using all the variables.application/pdfporControle estatístico de processoModelos de regressãoAnálise multivariadaVariable selectionPLS regressionVariable importance indicesSeleção de variáveis preditivas com base em índices de importância das variáveis e regressão PLSSelecting the most relevant predictive variables based on variable importance indices and PLS regression info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia de ProduçãoPorto Alegre, BR-RS2012mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000891304.pdf000891304.pdfTexto completoapplication/pdf1632638http://www.lume.ufrgs.br/bitstream/10183/75913/1/000891304.pdfca123f8f1381df62927d50bbb5e8f839MD51TEXT000891304.pdf.txt000891304.pdf.txtExtracted Texttext/plain139369http://www.lume.ufrgs.br/bitstream/10183/75913/2/000891304.pdf.txtbc18df9625fe3c8b6e4826672777616fMD52THUMBNAIL000891304.pdf.jpg000891304.pdf.jpgGenerated Thumbnailimage/jpeg1156http://www.lume.ufrgs.br/bitstream/10183/75913/3/000891304.pdf.jpg45b371bd1149b133258c1f74973e5a96MD5310183/759132018-10-15 08:10:27.87oai:www.lume.ufrgs.br:10183/75913Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-15T11:10:27Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Seleção de variáveis preditivas com base em índices de importância das variáveis e regressão PLS
dc.title.alternative.en.fl_str_mv Selecting the most relevant predictive variables based on variable importance indices and PLS regression
title Seleção de variáveis preditivas com base em índices de importância das variáveis e regressão PLS
spellingShingle Seleção de variáveis preditivas com base em índices de importância das variáveis e regressão PLS
Zimmer, Juliano
Controle estatístico de processo
Modelos de regressão
Análise multivariada
Variable selection
PLS regression
Variable importance indices
title_short Seleção de variáveis preditivas com base em índices de importância das variáveis e regressão PLS
title_full Seleção de variáveis preditivas com base em índices de importância das variáveis e regressão PLS
title_fullStr Seleção de variáveis preditivas com base em índices de importância das variáveis e regressão PLS
title_full_unstemmed Seleção de variáveis preditivas com base em índices de importância das variáveis e regressão PLS
title_sort Seleção de variáveis preditivas com base em índices de importância das variáveis e regressão PLS
author Zimmer, Juliano
author_facet Zimmer, Juliano
author_role author
dc.contributor.author.fl_str_mv Zimmer, Juliano
dc.contributor.advisor1.fl_str_mv Anzanello, Michel José
contributor_str_mv Anzanello, Michel José
dc.subject.por.fl_str_mv Controle estatístico de processo
Modelos de regressão
Análise multivariada
topic Controle estatístico de processo
Modelos de regressão
Análise multivariada
Variable selection
PLS regression
Variable importance indices
dc.subject.eng.fl_str_mv Variable selection
PLS regression
Variable importance indices
description A presente dissertação propõe métodos para seleção de variáveis preditivas com base em índices de importância das variáveis e regressão PLS (Partial Least Squares). Partindo-se de uma revisão da bibliografia sobre PLS e índices de importância das variáveis, sugere-se um método, denominado Eliminação Backward (EB), para seleção de variáveis a partir da eliminação sistemática de variáveis de acordo com a ordem definida por índices de importância das variáveis. Um novo índice de importância de variáveis, proposto com base nos parâmetros da regressão PLS, tem seu desempenho avaliado frente a outros índices reportados pela literatura. Duas variações do método EB são propostas e testadas através de simulação: (i) o método EBM (Eliminação backward por mínimos), que identifica o conjunto que maximiza o indicador de acurácia preditiva sem considerar o percentual de variáveis retidas, e (ii) o método EBDE (Eliminação backward por distância euclidiana), que seleciona o conjunto de variáveis responsável pela mínima distância euclidiana entre os pontos do perfil gerado pela eliminação das variáveis e um ponto ideal hipotético definido pelo usuário. A aplicação dos três métodos em quatro bancos de dados reais aponta o EBDE como recomendável, visto que retém, em média, apenas 13% das variáveis originais e eleva a acurácia de predição em 32% em relação à utilização de todas as variáveis.
publishDate 2012
dc.date.issued.fl_str_mv 2012
dc.date.accessioned.fl_str_mv 2013-07-17T01:49:34Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/75913
dc.identifier.nrb.pt_BR.fl_str_mv 000891304
url http://hdl.handle.net/10183/75913
identifier_str_mv 000891304
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/75913/1/000891304.pdf
http://www.lume.ufrgs.br/bitstream/10183/75913/2/000891304.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/75913/3/000891304.pdf.jpg
bitstream.checksum.fl_str_mv ca123f8f1381df62927d50bbb5e8f839
bc18df9625fe3c8b6e4826672777616f
45b371bd1149b133258c1f74973e5a96
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085262715256832