New Features of Ordered Predictors Selection for Multivariate Regression and Classification
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Tese |
Idioma: | eng |
Título da fonte: | LOCUS Repositório Institucional da UFV |
Texto Completo: | https://locus.ufv.br//handle/123456789/29234 |
Resumo: | Neste trabalho foram desenvolvidos novos métodos de seleção de variáveis para regressão multivariada e classificação baseados na seleção dos preditores ordenados (OPS). Inicialmente, novas estratégias do OPS para regressão foram desenvolvidas e aplicadas nos seis conjuntos de dados usados no artigo original do OPS. Em seguida, doze novos conjuntos de dados foram usados para testar e comparar as novas abordagens do OPS para regressão com outros métodos de seleção de variáveis, como o algoritmo genético (GA), o algoritmo de projeções sucessivas em intervalos para quadrados mínimos parciais (iSPA) e quadrados mínimos parciais ponderados recursivos (rPLS). Conjuntos de dados simulados foram usados para avaliar o desempenho computacional de métodos de seleção de variáveis, sendo eles as novas abordagens OPS para regressão, GA, iSPA e rPLS. Esta análise foi realizada usando um planejamento composto central variando as dimensões dos dados simulados e o número de variáveis latentes. Para classificação, foram desenvolvidos novos métodos OPS para análise discriminante (OPSDA). Diferentes métodos de classificação foram usados para construir modelos. Os métodos OPSDA foram aplicados em três conjuntos de dados com diferentes números de classes. As novas abordagens do OPS para regressão selecionaram variáveis que proporcionaram a construção de modelos mais preditivos que a primeira versão OPS e que os outros métodos de seleção de variáveis. Os resultados mostraram que, além de maior capacidade preditiva, a exatidão na seleção das variáveis interpretativas foi superior com os novos métodos OPS para regressão. O desempenho computacional desses métodos foi influenciado principalmente pelo número de colunas da matriz de dados, bem como para o GA. Por outro lado, o iSPA e rPLS foram influenciados principalmente pelo número de linhas. Os métodos OPSDA forneceram o melhor conjunto de variáveis selecionadas para construir modelos mais preditivos usando diferentes métodos de classificação, independentemente do número de classes. No geral, os novos métodos OPS forneceram o melhor conjunto de variáveis selecionadas para construir modelos de regressão e classificação mais preditivos e interpretativos, provando serem eficientes para seleção de variáveis em diferentes tipos de conjuntos de dados. Palavras-chave: Seleção de variáveis, Regressão multivariada, Reconhecimento de padrões supervisionado. |
id |
UFV_52127c5910451e651bdf29c1f9bd577e |
---|---|
oai_identifier_str |
oai:locus.ufv.br:123456789/29234 |
network_acronym_str |
UFV |
network_name_str |
LOCUS Repositório Institucional da UFV |
repository_id_str |
2145 |
spelling |
Peternelli, Luiz AlexandreRoque, Jussara Valentejussara valente roqueTeófilo, Reinaldo Francisco2022-06-23T13:56:45Z2022-06-23T13:56:45Z2019-08-02ROQUE, Jussara Valente. New Features of Ordered Predictors Selection for Multivariate Regression and Classification. 2019. 109 f. Tese (Doutorado em Agroquímica) - Universidade Federal de Viçosa, Viçosa. 2019.https://locus.ufv.br//handle/123456789/29234Neste trabalho foram desenvolvidos novos métodos de seleção de variáveis para regressão multivariada e classificação baseados na seleção dos preditores ordenados (OPS). Inicialmente, novas estratégias do OPS para regressão foram desenvolvidas e aplicadas nos seis conjuntos de dados usados no artigo original do OPS. Em seguida, doze novos conjuntos de dados foram usados para testar e comparar as novas abordagens do OPS para regressão com outros métodos de seleção de variáveis, como o algoritmo genético (GA), o algoritmo de projeções sucessivas em intervalos para quadrados mínimos parciais (iSPA) e quadrados mínimos parciais ponderados recursivos (rPLS). Conjuntos de dados simulados foram usados para avaliar o desempenho computacional de métodos de seleção de variáveis, sendo eles as novas abordagens OPS para regressão, GA, iSPA e rPLS. Esta análise foi realizada usando um planejamento composto central variando as dimensões dos dados simulados e o número de variáveis latentes. Para classificação, foram desenvolvidos novos métodos OPS para análise discriminante (OPSDA). Diferentes métodos de classificação foram usados para construir modelos. Os métodos OPSDA foram aplicados em três conjuntos de dados com diferentes números de classes. As novas abordagens do OPS para regressão selecionaram variáveis que proporcionaram a construção de modelos mais preditivos que a primeira versão OPS e que os outros métodos de seleção de variáveis. Os resultados mostraram que, além de maior capacidade preditiva, a exatidão na seleção das variáveis interpretativas foi superior com os novos métodos OPS para regressão. O desempenho computacional desses métodos foi influenciado principalmente pelo número de colunas da matriz de dados, bem como para o GA. Por outro lado, o iSPA e rPLS foram influenciados principalmente pelo número de linhas. Os métodos OPSDA forneceram o melhor conjunto de variáveis selecionadas para construir modelos mais preditivos usando diferentes métodos de classificação, independentemente do número de classes. No geral, os novos métodos OPS forneceram o melhor conjunto de variáveis selecionadas para construir modelos de regressão e classificação mais preditivos e interpretativos, provando serem eficientes para seleção de variáveis em diferentes tipos de conjuntos de dados. Palavras-chave: Seleção de variáveis, Regressão multivariada, Reconhecimento de padrões supervisionado.New variable selection methods for multivariate regression and classification based on ordered predictors selection (OPS) were developed in this work. Initially, the new OPS strategies for regression were developed and applied to the six datasets used in the original OPS paper to compare their prediction performances. After that, twelve new datasets were used to test and compare the new OPS approaches for regression with other variable selection methods, genetic algorithm (GA), the interval successive projections algorithm for partial least squares (iSPA), and recursive weighted partial least squares (rPLS). Simulated datasets were used to evaluate the computational performance of variable selection methods, being then the new OPS approaches for regression, GA, iSPA, and rPLS. All methods were evaluated by using a central composite design varying the matrix dimensions of simulated datasets and the number of latent variables. For classification, OPS methods for feature selection in the discriminant analysis (OPSDA) were developed. OPSDA methods were applied to three datasets with different numbers of classes, and classification models were built using different classification methods. The new OPS approaches for regression outperformed the first OPS version and the other variable selection methods. Results showed that in addition to higher predictive capacity, the accuracy in the selection of expected variables is highly superior with the new OPS approaches for regression. The computational performance of OPS approaches was mainly influenced by the number columns of the data matrix, as well as the GA. On the other hand, iSPA and rPLS were mainly influenced by the number of rows. In classification, the OPSDA methods provided the best set of selected variables to build more predictive models using different classification methods. Besides, they could be applied to classification problems, independent of the number of classes. Overall, the new OPS methods provided the best set of selected variables to build more predictive and interpretative regression and classification models. The new OPS methods proved to be efficient for variable selection in different types of datasets. Keywords: Variable Selection, Multivariate Regression, Supervised Pattern Recognition.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorCNPQ Conselho Nacional de Desenvolvimento Científico e TecnológicoengUniversidade Federal de ViçosaVariáveis (Matemática)Sistema de reconhecimento de padrõesCalibraçãoMínimos quadradosAnálise discriminatóriaQuímica AnalíticaNew Features of Ordered Predictors Selection for Multivariate Regression and ClassificationNovas abordagens da seleção dos preditores ordenados para regressão multivariada e classificaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal de ViçosaDepartamento de QuímicaDoutor em AgroquímicaViçosa - MG2019-08-02Doutoradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf4097995https://locus.ufv.br//bitstream/123456789/29234/1/texto%20completo.pdf65bc42276e8b1bd0cd9dadd1ef159d05MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/29234/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/292342022-06-28 13:35:21.637oai:locus.ufv.br:123456789/29234Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452022-06-28T16:35:21LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false |
dc.title.en.fl_str_mv |
New Features of Ordered Predictors Selection for Multivariate Regression and Classification |
dc.title.pt-BR.fl_str_mv |
Novas abordagens da seleção dos preditores ordenados para regressão multivariada e classificação |
title |
New Features of Ordered Predictors Selection for Multivariate Regression and Classification |
spellingShingle |
New Features of Ordered Predictors Selection for Multivariate Regression and Classification Roque, Jussara Valente Variáveis (Matemática) Sistema de reconhecimento de padrões Calibração Mínimos quadrados Análise discriminatória Química Analítica |
title_short |
New Features of Ordered Predictors Selection for Multivariate Regression and Classification |
title_full |
New Features of Ordered Predictors Selection for Multivariate Regression and Classification |
title_fullStr |
New Features of Ordered Predictors Selection for Multivariate Regression and Classification |
title_full_unstemmed |
New Features of Ordered Predictors Selection for Multivariate Regression and Classification |
title_sort |
New Features of Ordered Predictors Selection for Multivariate Regression and Classification |
author |
Roque, Jussara Valente |
author_facet |
Roque, Jussara Valente |
author_role |
author |
dc.contributor.authorLattes.pt-BR.fl_str_mv |
jussara valente roque |
dc.contributor.none.fl_str_mv |
Peternelli, Luiz Alexandre |
dc.contributor.author.fl_str_mv |
Roque, Jussara Valente |
dc.contributor.advisor1.fl_str_mv |
Teófilo, Reinaldo Francisco |
contributor_str_mv |
Teófilo, Reinaldo Francisco |
dc.subject.pt-BR.fl_str_mv |
Variáveis (Matemática) Sistema de reconhecimento de padrões Calibração Mínimos quadrados Análise discriminatória |
topic |
Variáveis (Matemática) Sistema de reconhecimento de padrões Calibração Mínimos quadrados Análise discriminatória Química Analítica |
dc.subject.cnpq.fl_str_mv |
Química Analítica |
description |
Neste trabalho foram desenvolvidos novos métodos de seleção de variáveis para regressão multivariada e classificação baseados na seleção dos preditores ordenados (OPS). Inicialmente, novas estratégias do OPS para regressão foram desenvolvidas e aplicadas nos seis conjuntos de dados usados no artigo original do OPS. Em seguida, doze novos conjuntos de dados foram usados para testar e comparar as novas abordagens do OPS para regressão com outros métodos de seleção de variáveis, como o algoritmo genético (GA), o algoritmo de projeções sucessivas em intervalos para quadrados mínimos parciais (iSPA) e quadrados mínimos parciais ponderados recursivos (rPLS). Conjuntos de dados simulados foram usados para avaliar o desempenho computacional de métodos de seleção de variáveis, sendo eles as novas abordagens OPS para regressão, GA, iSPA e rPLS. Esta análise foi realizada usando um planejamento composto central variando as dimensões dos dados simulados e o número de variáveis latentes. Para classificação, foram desenvolvidos novos métodos OPS para análise discriminante (OPSDA). Diferentes métodos de classificação foram usados para construir modelos. Os métodos OPSDA foram aplicados em três conjuntos de dados com diferentes números de classes. As novas abordagens do OPS para regressão selecionaram variáveis que proporcionaram a construção de modelos mais preditivos que a primeira versão OPS e que os outros métodos de seleção de variáveis. Os resultados mostraram que, além de maior capacidade preditiva, a exatidão na seleção das variáveis interpretativas foi superior com os novos métodos OPS para regressão. O desempenho computacional desses métodos foi influenciado principalmente pelo número de colunas da matriz de dados, bem como para o GA. Por outro lado, o iSPA e rPLS foram influenciados principalmente pelo número de linhas. Os métodos OPSDA forneceram o melhor conjunto de variáveis selecionadas para construir modelos mais preditivos usando diferentes métodos de classificação, independentemente do número de classes. No geral, os novos métodos OPS forneceram o melhor conjunto de variáveis selecionadas para construir modelos de regressão e classificação mais preditivos e interpretativos, provando serem eficientes para seleção de variáveis em diferentes tipos de conjuntos de dados. Palavras-chave: Seleção de variáveis, Regressão multivariada, Reconhecimento de padrões supervisionado. |
publishDate |
2019 |
dc.date.issued.fl_str_mv |
2019-08-02 |
dc.date.accessioned.fl_str_mv |
2022-06-23T13:56:45Z |
dc.date.available.fl_str_mv |
2022-06-23T13:56:45Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ROQUE, Jussara Valente. New Features of Ordered Predictors Selection for Multivariate Regression and Classification. 2019. 109 f. Tese (Doutorado em Agroquímica) - Universidade Federal de Viçosa, Viçosa. 2019. |
dc.identifier.uri.fl_str_mv |
https://locus.ufv.br//handle/123456789/29234 |
identifier_str_mv |
ROQUE, Jussara Valente. New Features of Ordered Predictors Selection for Multivariate Regression and Classification. 2019. 109 f. Tese (Doutorado em Agroquímica) - Universidade Federal de Viçosa, Viçosa. 2019. |
url |
https://locus.ufv.br//handle/123456789/29234 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.source.none.fl_str_mv |
reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV |
instname_str |
Universidade Federal de Viçosa (UFV) |
instacron_str |
UFV |
institution |
UFV |
reponame_str |
LOCUS Repositório Institucional da UFV |
collection |
LOCUS Repositório Institucional da UFV |
bitstream.url.fl_str_mv |
https://locus.ufv.br//bitstream/123456789/29234/1/texto%20completo.pdf https://locus.ufv.br//bitstream/123456789/29234/2/license.txt |
bitstream.checksum.fl_str_mv |
65bc42276e8b1bd0cd9dadd1ef159d05 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV) |
repository.mail.fl_str_mv |
fabiojreis@ufv.br |
_version_ |
1801213064927772672 |