Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas

Detalhes bibliográficos
Autor(a) principal: Soares, Sófacles Figueiredo Carreiro
Data de Publicação: 2010
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFPB
Texto Completo: https://repositorio.ufpb.br/jspui/handle/tede/7184
Resumo: This study proposes a modification in the Successive Projections Algorithm (SPA), that makes models of Multiple Linear Regression (MLR) more robust in terms of interference. In SPA, subsets of variables are compared based on their root mean square errors for the validation set. By taking into account the statistical prediction error obtained for the calibration set, and dividing by the statistical prediction error obtained for the prediction set, SPA can be improved. Also taken into account is the leverage associated with each sample. Three case studies involving; simulated analytic determinations, food colorants (UV-VIS spectrometry), and ethanol in gasoline (NIR spectrometry) are discussed. The results were evaluated using the root mean square error for an independent prediction set (Root Mean Square Error of Prediction - RMSEP), graphs of the variables, and the statistical tests t and F. The MLR models obtained by the selection using the new function were called SPE-SPA-MLR. When an interferent was present in the prediction spectra, almost all of the models performed better than both SPA-MLR and PLS. The models when compared to SPA-MLR showed that the change promoted better models in all cases giving smaller RMSEPs and variable numbers. The SPE-SPA-MLR was not better in some cases, than PLS models. The variables selected by SPA-SPE-MLR when observed in the spectra were detected in regions where interference was the at its smallest, revealing great potential. The modifications presented here make a useful tool for the basic formulation of the SPA.
id UFPB_b8819119ca2a2296e6efbc8ca5ce1812
oai_identifier_str oai:repositorio.ufpb.br:tede/7184
network_acronym_str UFPB
network_name_str Biblioteca Digital de Teses e Dissertações da UFPB
repository_id_str
spelling Um novo critério para seleção de variáveis usando o Algoritmo das Projeções SucessivasRegressão linear múltiplaSeleção de variáveisAlgoritmo das projeções sucessivas e calibração multivariadaMultiple linear regressionVariable selectionSuccessive projections algorithm and multivariate calibrationCIENCIAS EXATAS E DA TERRA::QUIMICAThis study proposes a modification in the Successive Projections Algorithm (SPA), that makes models of Multiple Linear Regression (MLR) more robust in terms of interference. In SPA, subsets of variables are compared based on their root mean square errors for the validation set. By taking into account the statistical prediction error obtained for the calibration set, and dividing by the statistical prediction error obtained for the prediction set, SPA can be improved. Also taken into account is the leverage associated with each sample. Three case studies involving; simulated analytic determinations, food colorants (UV-VIS spectrometry), and ethanol in gasoline (NIR spectrometry) are discussed. The results were evaluated using the root mean square error for an independent prediction set (Root Mean Square Error of Prediction - RMSEP), graphs of the variables, and the statistical tests t and F. The MLR models obtained by the selection using the new function were called SPE-SPA-MLR. When an interferent was present in the prediction spectra, almost all of the models performed better than both SPA-MLR and PLS. The models when compared to SPA-MLR showed that the change promoted better models in all cases giving smaller RMSEPs and variable numbers. The SPE-SPA-MLR was not better in some cases, than PLS models. The variables selected by SPA-SPE-MLR when observed in the spectra were detected in regions where interference was the at its smallest, revealing great potential. The modifications presented here make a useful tool for the basic formulation of the SPA.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESEste trabalho propõe uma modificação no Algoritmo das Projeções Sucessivas (Sucessive Projection Algorithm - SPA), com objetivo de aumentar a robustez a interferentes nos modelos de Regressão Linear Múltipla (Multiple Linear Regression - MLR) construídos. Na formulação original do SPA, subconjuntos de variáveis são comparados entre si com base na raiz do erro quadrático médio obtido em um conjunto de validação. De acordo com o critério aqui proposto, a comparação é feita também levando em conta o erro estatístico de previsão (Statistical Prediction Error SPE) obtido para o conjunto de calibração dividido pelo erro estatístico de previsão obtido para o conjunto de previsão. Tal métrica leva em conta a leverage associada a cada amostra. Três estudos de caso envolvendo a determinação de analitos simulados, corantes alimentícios por espectrometria UV-VIS e álcool em gasolinas por espectrometria NIR são discutidos. Os resultados são avaliados em termos da raiz do erro quadrático médio em um conjunto de previsão independente (Root Mean Square Error of Prediction - RMSEP), dos gráficos das variáveis selecionadas e através do testes estatísticos t e F. Os modelos MLR obtidos a partir da seleção usando a nova função custo foram chamados aqui de SPA-SPE-MLR. Estes modelos foram comparados com o SPA-MLR e PLS. Os desempenhos de previsão do SPA-SPEMLR apresentados foram melhores em quase todos os modelos construídos quando algum interferente estava presente nos espectros de previsão. Estes modelos quando comparados ao SPA-MLR, revelou que a mudança promoveu melhorias em todos os casos fornecendo RMSEPs e números de variáveis menores. O SPA-SPE-MLR só não foi melhor que alguns modelos PLS. As variáveis selecionadas pelo SPA-SPE-MLR quando observadas nos espectros se mostraram em regiões onde a ação do interferente foi à menor possível revelando o grande potencial que tal mudança provocou. Desta forma a modificação aqui apresentada pode ser considerada como uma ferramenta útil para a formulação básica do SPA.Universidade Federal da Paraí­baBRQuímicaPrograma de Pós-Graduação em QuímicaUFPBAraújo, Mário César Ugulino dehttp://lattes.cnpq.br/7281739070942782Galvão, Roberto Kawakami Harrophttp://lattes.cnpq.br/2331014850737529Soares, Sófacles Figueiredo Carreiro2015-05-14T13:21:51Z2018-07-21T00:29:58Z2011-01-042018-07-21T00:29:58Z2010-09-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSOARES, Sófacles Figueiredo Carreiro. Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas. 2010. 108 f. Dissertação (Mestrado em Química) - Universidade Federal da Paraí­ba, João Pessoa, 2010.https://repositorio.ufpb.br/jspui/handle/tede/7184porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2018-09-06T02:05:18Zoai:repositorio.ufpb.br:tede/7184Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufpb.br/PUBhttp://tede.biblioteca.ufpb.br:8080/oai/requestdiretoria@ufpb.br|| diretoria@ufpb.bropendoar:2018-09-06T02:05:18Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)false
dc.title.none.fl_str_mv Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas
title Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas
spellingShingle Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas
Soares, Sófacles Figueiredo Carreiro
Regressão linear múltipla
Seleção de variáveis
Algoritmo das projeções sucessivas e calibração multivariada
Multiple linear regression
Variable selection
Successive projections algorithm and multivariate calibration
CIENCIAS EXATAS E DA TERRA::QUIMICA
title_short Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas
title_full Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas
title_fullStr Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas
title_full_unstemmed Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas
title_sort Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas
author Soares, Sófacles Figueiredo Carreiro
author_facet Soares, Sófacles Figueiredo Carreiro
author_role author
dc.contributor.none.fl_str_mv Araújo, Mário César Ugulino de
http://lattes.cnpq.br/7281739070942782
Galvão, Roberto Kawakami Harrop
http://lattes.cnpq.br/2331014850737529
dc.contributor.author.fl_str_mv Soares, Sófacles Figueiredo Carreiro
dc.subject.por.fl_str_mv Regressão linear múltipla
Seleção de variáveis
Algoritmo das projeções sucessivas e calibração multivariada
Multiple linear regression
Variable selection
Successive projections algorithm and multivariate calibration
CIENCIAS EXATAS E DA TERRA::QUIMICA
topic Regressão linear múltipla
Seleção de variáveis
Algoritmo das projeções sucessivas e calibração multivariada
Multiple linear regression
Variable selection
Successive projections algorithm and multivariate calibration
CIENCIAS EXATAS E DA TERRA::QUIMICA
description This study proposes a modification in the Successive Projections Algorithm (SPA), that makes models of Multiple Linear Regression (MLR) more robust in terms of interference. In SPA, subsets of variables are compared based on their root mean square errors for the validation set. By taking into account the statistical prediction error obtained for the calibration set, and dividing by the statistical prediction error obtained for the prediction set, SPA can be improved. Also taken into account is the leverage associated with each sample. Three case studies involving; simulated analytic determinations, food colorants (UV-VIS spectrometry), and ethanol in gasoline (NIR spectrometry) are discussed. The results were evaluated using the root mean square error for an independent prediction set (Root Mean Square Error of Prediction - RMSEP), graphs of the variables, and the statistical tests t and F. The MLR models obtained by the selection using the new function were called SPE-SPA-MLR. When an interferent was present in the prediction spectra, almost all of the models performed better than both SPA-MLR and PLS. The models when compared to SPA-MLR showed that the change promoted better models in all cases giving smaller RMSEPs and variable numbers. The SPE-SPA-MLR was not better in some cases, than PLS models. The variables selected by SPA-SPE-MLR when observed in the spectra were detected in regions where interference was the at its smallest, revealing great potential. The modifications presented here make a useful tool for the basic formulation of the SPA.
publishDate 2010
dc.date.none.fl_str_mv 2010-09-22
2011-01-04
2015-05-14T13:21:51Z
2018-07-21T00:29:58Z
2018-07-21T00:29:58Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SOARES, Sófacles Figueiredo Carreiro. Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas. 2010. 108 f. Dissertação (Mestrado em Química) - Universidade Federal da Paraí­ba, João Pessoa, 2010.
https://repositorio.ufpb.br/jspui/handle/tede/7184
identifier_str_mv SOARES, Sófacles Figueiredo Carreiro. Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas. 2010. 108 f. Dissertação (Mestrado em Química) - Universidade Federal da Paraí­ba, João Pessoa, 2010.
url https://repositorio.ufpb.br/jspui/handle/tede/7184
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal da Paraí­ba
BR
Química
Programa de Pós-Graduação em Química
UFPB
publisher.none.fl_str_mv Universidade Federal da Paraí­ba
BR
Química
Programa de Pós-Graduação em Química
UFPB
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFPB
instname:Universidade Federal da Paraíba (UFPB)
instacron:UFPB
instname_str Universidade Federal da Paraíba (UFPB)
instacron_str UFPB
institution UFPB
reponame_str Biblioteca Digital de Teses e Dissertações da UFPB
collection Biblioteca Digital de Teses e Dissertações da UFPB
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)
repository.mail.fl_str_mv diretoria@ufpb.br|| diretoria@ufpb.br
_version_ 1801842920859369472