Seleção de variáveis com vistas à classificação de bateladas de produção em duas classes

Detalhes bibliográficos
Autor(a) principal: Anzanello,Michel José
Data de Publicação: 2009
Tipo de documento: Artigo
Idioma: por
Título da fonte: Gestão & Produção
Texto Completo: http://old.scielo.br/scielo.php?script=sci_arttext&pid=S0104-530X2009000400003
Resumo: Bancos de dados caracterizados por elevado número de variáveis correlacionadas são usualmente encontrados em ambientes industriais, dificultando a identificação das variáveis de processo mais relevantes. A regressão por quadrados parciais mínimos (Partial Least Square - PLS) tem sido amplamente utilizada para a seleção de variáveis com propósitos de predição. No entanto, muitas aplicações práticas priorizam a correta categorização de lotes produtivos em classes, de acordo com determinada especificação do produto final. Neste artigo, a regressão PLS é integrada às ferramentas de classificação z vizinhos mais próximos (z-Nearest Neighbor) e máquina de suporte vetorial (Support Vector Machine) com visando a seleção de variáveis para fins de categorização de bateladas de produção em duas classes. Índices de Importância das Variáveis (IIV) baseados nos parâmetros da regressão PLS são desenvolvidos para o ordenamento das variáveis de processo, de acordo com sua relevância para a caracterização da variável de produto, e então integrados às ferramentas de classificação. O subconjunto de variáveis retidas é identificado através do monitoramento do perfil de acurácia gerado com a remoção sistemática das variáveis menos relevantes. Aplicada em três bancos de dados, a metodologia proposta reduziu o número de variáveis de processo necessárias para classificação de bateladas em 90,6% e elevou a acurácia média de classificação em 29,2%, quando comparada à aplicação de ferramentas de classificação na totalidade das variáveis.
id UFSCAR-3_16f7e4b87e2214a245b748d2fad49e37
oai_identifier_str oai:scielo:S0104-530X2009000400003
network_acronym_str UFSCAR-3
network_name_str Gestão & Produção
repository_id_str
spelling Seleção de variáveis com vistas à classificação de bateladas de produção em duas classesSeleção de variáveisPLSz vizinhos mais próximosMáquina de suporte vetorialBancos de dados caracterizados por elevado número de variáveis correlacionadas são usualmente encontrados em ambientes industriais, dificultando a identificação das variáveis de processo mais relevantes. A regressão por quadrados parciais mínimos (Partial Least Square - PLS) tem sido amplamente utilizada para a seleção de variáveis com propósitos de predição. No entanto, muitas aplicações práticas priorizam a correta categorização de lotes produtivos em classes, de acordo com determinada especificação do produto final. Neste artigo, a regressão PLS é integrada às ferramentas de classificação z vizinhos mais próximos (z-Nearest Neighbor) e máquina de suporte vetorial (Support Vector Machine) com visando a seleção de variáveis para fins de categorização de bateladas de produção em duas classes. Índices de Importância das Variáveis (IIV) baseados nos parâmetros da regressão PLS são desenvolvidos para o ordenamento das variáveis de processo, de acordo com sua relevância para a caracterização da variável de produto, e então integrados às ferramentas de classificação. O subconjunto de variáveis retidas é identificado através do monitoramento do perfil de acurácia gerado com a remoção sistemática das variáveis menos relevantes. Aplicada em três bancos de dados, a metodologia proposta reduziu o número de variáveis de processo necessárias para classificação de bateladas em 90,6% e elevou a acurácia média de classificação em 29,2%, quando comparada à aplicação de ferramentas de classificação na totalidade das variáveis.Universidade Federal de São Carlos2009-12-01info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersiontext/htmlhttp://old.scielo.br/scielo.php?script=sci_arttext&pid=S0104-530X2009000400003Gestão & Produção v.16 n.4 2009reponame:Gestão & Produçãoinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCAR10.1590/S0104-530X2009000400003info:eu-repo/semantics/openAccessAnzanello,Michel Josépor2010-01-19T00:00:00Zoai:scielo:S0104-530X2009000400003Revistahttps://www.gestaoeproducao.com/PUBhttps://old.scielo.br/oai/scielo-oai.phpgp@dep.ufscar.br||revistagestaoemanalise@unichristus.edu.br1806-96490104-530Xopendoar:2010-01-19T00:00Gestão & Produção - Universidade Federal de São Carlos (UFSCAR)false
dc.title.none.fl_str_mv Seleção de variáveis com vistas à classificação de bateladas de produção em duas classes
title Seleção de variáveis com vistas à classificação de bateladas de produção em duas classes
spellingShingle Seleção de variáveis com vistas à classificação de bateladas de produção em duas classes
Anzanello,Michel José
Seleção de variáveis
PLS
z vizinhos mais próximos
Máquina de suporte vetorial
title_short Seleção de variáveis com vistas à classificação de bateladas de produção em duas classes
title_full Seleção de variáveis com vistas à classificação de bateladas de produção em duas classes
title_fullStr Seleção de variáveis com vistas à classificação de bateladas de produção em duas classes
title_full_unstemmed Seleção de variáveis com vistas à classificação de bateladas de produção em duas classes
title_sort Seleção de variáveis com vistas à classificação de bateladas de produção em duas classes
author Anzanello,Michel José
author_facet Anzanello,Michel José
author_role author
dc.contributor.author.fl_str_mv Anzanello,Michel José
dc.subject.por.fl_str_mv Seleção de variáveis
PLS
z vizinhos mais próximos
Máquina de suporte vetorial
topic Seleção de variáveis
PLS
z vizinhos mais próximos
Máquina de suporte vetorial
description Bancos de dados caracterizados por elevado número de variáveis correlacionadas são usualmente encontrados em ambientes industriais, dificultando a identificação das variáveis de processo mais relevantes. A regressão por quadrados parciais mínimos (Partial Least Square - PLS) tem sido amplamente utilizada para a seleção de variáveis com propósitos de predição. No entanto, muitas aplicações práticas priorizam a correta categorização de lotes produtivos em classes, de acordo com determinada especificação do produto final. Neste artigo, a regressão PLS é integrada às ferramentas de classificação z vizinhos mais próximos (z-Nearest Neighbor) e máquina de suporte vetorial (Support Vector Machine) com visando a seleção de variáveis para fins de categorização de bateladas de produção em duas classes. Índices de Importância das Variáveis (IIV) baseados nos parâmetros da regressão PLS são desenvolvidos para o ordenamento das variáveis de processo, de acordo com sua relevância para a caracterização da variável de produto, e então integrados às ferramentas de classificação. O subconjunto de variáveis retidas é identificado através do monitoramento do perfil de acurácia gerado com a remoção sistemática das variáveis menos relevantes. Aplicada em três bancos de dados, a metodologia proposta reduziu o número de variáveis de processo necessárias para classificação de bateladas em 90,6% e elevou a acurácia média de classificação em 29,2%, quando comparada à aplicação de ferramentas de classificação na totalidade das variáveis.
publishDate 2009
dc.date.none.fl_str_mv 2009-12-01
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://old.scielo.br/scielo.php?script=sci_arttext&pid=S0104-530X2009000400003
url http://old.scielo.br/scielo.php?script=sci_arttext&pid=S0104-530X2009000400003
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 10.1590/S0104-530X2009000400003
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv text/html
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv Gestão & Produção v.16 n.4 2009
reponame:Gestão & Produção
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Gestão & Produção
collection Gestão & Produção
repository.name.fl_str_mv Gestão & Produção - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv gp@dep.ufscar.br||revistagestaoemanalise@unichristus.edu.br
_version_ 1750118203048067072