Um novo método para seleção de variáveis preditivas com base em índices de importância

Detalhes bibliográficos
Autor(a) principal: Zimmer, Juliano
Data de Publicação: 2014
Outros Autores: Anzanello, Michel José
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/111877
Resumo: O grande volume de variáveis coletadas em processos industriais impõe dificuldades ao controle e monitoramento de tais processos. A regressão PLS (partial least squares) vem sendo amplamente utilizada em procedimentos de seleção de variáveis por sua capacidade de operar com grande número de variáveis correlacionadas e afetadas por ruído. Este artigo propõe um método para identificar o melhor subconjunto de variáveis de processo para a predição das variáveis de resposta. Indicadores de importância das variáveis são desenvolvidos a partir de parâmetros da regressão PLS e guiam a eliminação das variáveis irrelevantes. Tais índices são então testados em termos de seu desempenho. Ao ser aplicado em cinco bancos de dados industriais, o método utilizando o índice recomendado reteve apenas 31% das variáveis originais e aumentou a acurácia de predição do conjunto de teste em 6%. O método proposto também superou a acurácia do método Stepwise, tradicionalmente utilizado em procedimentos de seleção com propósitos de predição.
id UFRGS-2_3730516f600c6793347bf664e0172fbb
oai_identifier_str oai:www.lume.ufrgs.br:10183/111877
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Zimmer, JulianoAnzanello, Michel José2015-03-11T02:01:16Z20140103-6513http://hdl.handle.net/10183/111877000922033O grande volume de variáveis coletadas em processos industriais impõe dificuldades ao controle e monitoramento de tais processos. A regressão PLS (partial least squares) vem sendo amplamente utilizada em procedimentos de seleção de variáveis por sua capacidade de operar com grande número de variáveis correlacionadas e afetadas por ruído. Este artigo propõe um método para identificar o melhor subconjunto de variáveis de processo para a predição das variáveis de resposta. Indicadores de importância das variáveis são desenvolvidos a partir de parâmetros da regressão PLS e guiam a eliminação das variáveis irrelevantes. Tais índices são então testados em termos de seu desempenho. Ao ser aplicado em cinco bancos de dados industriais, o método utilizando o índice recomendado reteve apenas 31% das variáveis originais e aumentou a acurácia de predição do conjunto de teste em 6%. O método proposto também superou a acurácia do método Stepwise, tradicionalmente utilizado em procedimentos de seleção com propósitos de predição.The large volume of process variables collected from manufacturing applications has jeopardized process control activities. The Partial Least Squares (PLS) regression has been widely used for variable selection due to its ability to handle a large number of correlated and noisy variables. This paper presents a method for selecting the most relevant variables aimed at predicting product variables. For that matter, variable importance indices are developed based on PLS parameters and used to guide the elimination of noisy and irrelevant variables. Variables are then systematically removed from the dataset and the performance of the predictive model evaluated. When applied to five manufacturing datasets, the proposed method retained 31% of the original variables and yielded 6% more accurate predictions than using all original variables. Further, the proposed method outperformed the traditional Stepwise method regarding prediction accuracy.application/pdfporProduction = Produção. Porto Alegre, RS. vol. 24, n. 1 (jan./mar. 2014), p. 84-93.Análise multivariadaControle estatístico de processoModelos de regressãoVariable selectionPLS regressionVariable importance índicesUm novo método para seleção de variáveis preditivas com base em índices de importânciaA new framework for predictive variable selection based on variable importance indices info:eu-repo/semantics/articleinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000922033.pdf000922033.pdfTexto completoapplication/pdf639958http://www.lume.ufrgs.br/bitstream/10183/111877/1/000922033.pdf25c7e4edc6972596eb80c1752ba1b9f5MD51TEXT000922033.pdf.txt000922033.pdf.txtExtracted Texttext/plain40763http://www.lume.ufrgs.br/bitstream/10183/111877/2/000922033.pdf.txt2ca1d27e8719e1ee834d45d9ce6d803aMD52THUMBNAIL000922033.pdf.jpg000922033.pdf.jpgGenerated Thumbnailimage/jpeg1863http://www.lume.ufrgs.br/bitstream/10183/111877/3/000922033.pdf.jpg4a07fd72745058c0e8da7c07b1bcfe04MD5310183/1118772022-08-19 04:44:55.016767oai:www.lume.ufrgs.br:10183/111877Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2022-08-19T07:44:55Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Um novo método para seleção de variáveis preditivas com base em índices de importância
dc.title.alternative.en.fl_str_mv A new framework for predictive variable selection based on variable importance indices
title Um novo método para seleção de variáveis preditivas com base em índices de importância
spellingShingle Um novo método para seleção de variáveis preditivas com base em índices de importância
Zimmer, Juliano
Análise multivariada
Controle estatístico de processo
Modelos de regressão
Variable selection
PLS regression
Variable importance índices
title_short Um novo método para seleção de variáveis preditivas com base em índices de importância
title_full Um novo método para seleção de variáveis preditivas com base em índices de importância
title_fullStr Um novo método para seleção de variáveis preditivas com base em índices de importância
title_full_unstemmed Um novo método para seleção de variáveis preditivas com base em índices de importância
title_sort Um novo método para seleção de variáveis preditivas com base em índices de importância
author Zimmer, Juliano
author_facet Zimmer, Juliano
Anzanello, Michel José
author_role author
author2 Anzanello, Michel José
author2_role author
dc.contributor.author.fl_str_mv Zimmer, Juliano
Anzanello, Michel José
dc.subject.por.fl_str_mv Análise multivariada
Controle estatístico de processo
Modelos de regressão
topic Análise multivariada
Controle estatístico de processo
Modelos de regressão
Variable selection
PLS regression
Variable importance índices
dc.subject.eng.fl_str_mv Variable selection
PLS regression
Variable importance índices
description O grande volume de variáveis coletadas em processos industriais impõe dificuldades ao controle e monitoramento de tais processos. A regressão PLS (partial least squares) vem sendo amplamente utilizada em procedimentos de seleção de variáveis por sua capacidade de operar com grande número de variáveis correlacionadas e afetadas por ruído. Este artigo propõe um método para identificar o melhor subconjunto de variáveis de processo para a predição das variáveis de resposta. Indicadores de importância das variáveis são desenvolvidos a partir de parâmetros da regressão PLS e guiam a eliminação das variáveis irrelevantes. Tais índices são então testados em termos de seu desempenho. Ao ser aplicado em cinco bancos de dados industriais, o método utilizando o índice recomendado reteve apenas 31% das variáveis originais e aumentou a acurácia de predição do conjunto de teste em 6%. O método proposto também superou a acurácia do método Stepwise, tradicionalmente utilizado em procedimentos de seleção com propósitos de predição.
publishDate 2014
dc.date.issued.fl_str_mv 2014
dc.date.accessioned.fl_str_mv 2015-03-11T02:01:16Z
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/other
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/111877
dc.identifier.issn.pt_BR.fl_str_mv 0103-6513
dc.identifier.nrb.pt_BR.fl_str_mv 000922033
identifier_str_mv 0103-6513
000922033
url http://hdl.handle.net/10183/111877
dc.language.iso.fl_str_mv por
language por
dc.relation.ispartof.pt_BR.fl_str_mv Production = Produção. Porto Alegre, RS. vol. 24, n. 1 (jan./mar. 2014), p. 84-93.
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/111877/1/000922033.pdf
http://www.lume.ufrgs.br/bitstream/10183/111877/2/000922033.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/111877/3/000922033.pdf.jpg
bitstream.checksum.fl_str_mv 25c7e4edc6972596eb80c1752ba1b9f5
2ca1d27e8719e1ee834d45d9ce6d803a
4a07fd72745058c0e8da7c07b1bcfe04
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1815447578028802048