Um novo método para seleção de variáveis preditivas com base em índices de importância
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/111877 |
Resumo: | O grande volume de variáveis coletadas em processos industriais impõe dificuldades ao controle e monitoramento de tais processos. A regressão PLS (partial least squares) vem sendo amplamente utilizada em procedimentos de seleção de variáveis por sua capacidade de operar com grande número de variáveis correlacionadas e afetadas por ruído. Este artigo propõe um método para identificar o melhor subconjunto de variáveis de processo para a predição das variáveis de resposta. Indicadores de importância das variáveis são desenvolvidos a partir de parâmetros da regressão PLS e guiam a eliminação das variáveis irrelevantes. Tais índices são então testados em termos de seu desempenho. Ao ser aplicado em cinco bancos de dados industriais, o método utilizando o índice recomendado reteve apenas 31% das variáveis originais e aumentou a acurácia de predição do conjunto de teste em 6%. O método proposto também superou a acurácia do método Stepwise, tradicionalmente utilizado em procedimentos de seleção com propósitos de predição. |
id |
UFRGS-2_3730516f600c6793347bf664e0172fbb |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/111877 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Zimmer, JulianoAnzanello, Michel José2015-03-11T02:01:16Z20140103-6513http://hdl.handle.net/10183/111877000922033O grande volume de variáveis coletadas em processos industriais impõe dificuldades ao controle e monitoramento de tais processos. A regressão PLS (partial least squares) vem sendo amplamente utilizada em procedimentos de seleção de variáveis por sua capacidade de operar com grande número de variáveis correlacionadas e afetadas por ruído. Este artigo propõe um método para identificar o melhor subconjunto de variáveis de processo para a predição das variáveis de resposta. Indicadores de importância das variáveis são desenvolvidos a partir de parâmetros da regressão PLS e guiam a eliminação das variáveis irrelevantes. Tais índices são então testados em termos de seu desempenho. Ao ser aplicado em cinco bancos de dados industriais, o método utilizando o índice recomendado reteve apenas 31% das variáveis originais e aumentou a acurácia de predição do conjunto de teste em 6%. O método proposto também superou a acurácia do método Stepwise, tradicionalmente utilizado em procedimentos de seleção com propósitos de predição.The large volume of process variables collected from manufacturing applications has jeopardized process control activities. The Partial Least Squares (PLS) regression has been widely used for variable selection due to its ability to handle a large number of correlated and noisy variables. This paper presents a method for selecting the most relevant variables aimed at predicting product variables. For that matter, variable importance indices are developed based on PLS parameters and used to guide the elimination of noisy and irrelevant variables. Variables are then systematically removed from the dataset and the performance of the predictive model evaluated. When applied to five manufacturing datasets, the proposed method retained 31% of the original variables and yielded 6% more accurate predictions than using all original variables. Further, the proposed method outperformed the traditional Stepwise method regarding prediction accuracy.application/pdfporProduction = Produção. Porto Alegre, RS. vol. 24, n. 1 (jan./mar. 2014), p. 84-93.Análise multivariadaControle estatístico de processoModelos de regressãoVariable selectionPLS regressionVariable importance índicesUm novo método para seleção de variáveis preditivas com base em índices de importânciaA new framework for predictive variable selection based on variable importance indices info:eu-repo/semantics/articleinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000922033.pdf000922033.pdfTexto completoapplication/pdf639958http://www.lume.ufrgs.br/bitstream/10183/111877/1/000922033.pdf25c7e4edc6972596eb80c1752ba1b9f5MD51TEXT000922033.pdf.txt000922033.pdf.txtExtracted Texttext/plain40763http://www.lume.ufrgs.br/bitstream/10183/111877/2/000922033.pdf.txt2ca1d27e8719e1ee834d45d9ce6d803aMD52THUMBNAIL000922033.pdf.jpg000922033.pdf.jpgGenerated Thumbnailimage/jpeg1863http://www.lume.ufrgs.br/bitstream/10183/111877/3/000922033.pdf.jpg4a07fd72745058c0e8da7c07b1bcfe04MD5310183/1118772022-08-19 04:44:55.016767oai:www.lume.ufrgs.br:10183/111877Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2022-08-19T07:44:55Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Um novo método para seleção de variáveis preditivas com base em índices de importância |
dc.title.alternative.en.fl_str_mv |
A new framework for predictive variable selection based on variable importance indices |
title |
Um novo método para seleção de variáveis preditivas com base em índices de importância |
spellingShingle |
Um novo método para seleção de variáveis preditivas com base em índices de importância Zimmer, Juliano Análise multivariada Controle estatístico de processo Modelos de regressão Variable selection PLS regression Variable importance índices |
title_short |
Um novo método para seleção de variáveis preditivas com base em índices de importância |
title_full |
Um novo método para seleção de variáveis preditivas com base em índices de importância |
title_fullStr |
Um novo método para seleção de variáveis preditivas com base em índices de importância |
title_full_unstemmed |
Um novo método para seleção de variáveis preditivas com base em índices de importância |
title_sort |
Um novo método para seleção de variáveis preditivas com base em índices de importância |
author |
Zimmer, Juliano |
author_facet |
Zimmer, Juliano Anzanello, Michel José |
author_role |
author |
author2 |
Anzanello, Michel José |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Zimmer, Juliano Anzanello, Michel José |
dc.subject.por.fl_str_mv |
Análise multivariada Controle estatístico de processo Modelos de regressão |
topic |
Análise multivariada Controle estatístico de processo Modelos de regressão Variable selection PLS regression Variable importance índices |
dc.subject.eng.fl_str_mv |
Variable selection PLS regression Variable importance índices |
description |
O grande volume de variáveis coletadas em processos industriais impõe dificuldades ao controle e monitoramento de tais processos. A regressão PLS (partial least squares) vem sendo amplamente utilizada em procedimentos de seleção de variáveis por sua capacidade de operar com grande número de variáveis correlacionadas e afetadas por ruído. Este artigo propõe um método para identificar o melhor subconjunto de variáveis de processo para a predição das variáveis de resposta. Indicadores de importância das variáveis são desenvolvidos a partir de parâmetros da regressão PLS e guiam a eliminação das variáveis irrelevantes. Tais índices são então testados em termos de seu desempenho. Ao ser aplicado em cinco bancos de dados industriais, o método utilizando o índice recomendado reteve apenas 31% das variáveis originais e aumentou a acurácia de predição do conjunto de teste em 6%. O método proposto também superou a acurácia do método Stepwise, tradicionalmente utilizado em procedimentos de seleção com propósitos de predição. |
publishDate |
2014 |
dc.date.issued.fl_str_mv |
2014 |
dc.date.accessioned.fl_str_mv |
2015-03-11T02:01:16Z |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/other |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/111877 |
dc.identifier.issn.pt_BR.fl_str_mv |
0103-6513 |
dc.identifier.nrb.pt_BR.fl_str_mv |
000922033 |
identifier_str_mv |
0103-6513 000922033 |
url |
http://hdl.handle.net/10183/111877 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.ispartof.pt_BR.fl_str_mv |
Production = Produção. Porto Alegre, RS. vol. 24, n. 1 (jan./mar. 2014), p. 84-93. |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/111877/1/000922033.pdf http://www.lume.ufrgs.br/bitstream/10183/111877/2/000922033.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/111877/3/000922033.pdf.jpg |
bitstream.checksum.fl_str_mv |
25c7e4edc6972596eb80c1752ba1b9f5 2ca1d27e8719e1ee834d45d9ce6d803a 4a07fd72745058c0e8da7c07b1bcfe04 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1815447578028802048 |