Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/223535 |
Resumo: | A seleção de variáveis é uma etapa importante para a análise de dados, visto que identifica os subconjuntos de variáveis mais informativas para a construção de modelos precisos de classificação e predição. Além disso, a seleção de variáveis facilita a interpretação e análise dos modelos obtidos, potencialmente reduzindo o tempo computacional de geração dos modelos e o custo/tempo para obtenção das amostras. Neste contexto, a presente tese apresenta proposições inovadoras de abordagens com vistas à seleção de variáveis para classificação e predição de propriedades de amostras de produtos diversos. Tais abordagens são abordadas em três artigos apresentados nesta tese, com intuito de melhorar a precisão dos modelos de classificação e predição em diferentes áreas. No primeiro artigo, integram-se índices de importância de variáveis a sistemáticas de classificação hierárquica para categorizar amostras de espumantes de acordo com seu país de origem. No segundo artigo, para selecionar as variáveis mais informativas para a predição de amostras via PLS, propõe-se um índice de importância de variáveis baseado na Lei de Lambert-Beer combinado a um processo iterativo de seleção do tipo forward. Por fim, o terceiro artigo utilizou cluster de variáveis espectrais e índice de importância para selecionar as variáveis que produzem modelos de predição mais consistentes. Em todos os artigos dessa tese, os resultados obtidos pelos métodos propostos foram superiores quando comparados a outros métodos tradicionais da literatura voltados à identificação das variáveis mais informativas. |
id |
URGS_d686b204e56c7097dd3b3f589f0d1915 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/223535 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Yamashita, Gabrielli HarumiAnzanello, Michel José2021-07-10T04:51:29Z2021http://hdl.handle.net/10183/223535001126653A seleção de variáveis é uma etapa importante para a análise de dados, visto que identifica os subconjuntos de variáveis mais informativas para a construção de modelos precisos de classificação e predição. Além disso, a seleção de variáveis facilita a interpretação e análise dos modelos obtidos, potencialmente reduzindo o tempo computacional de geração dos modelos e o custo/tempo para obtenção das amostras. Neste contexto, a presente tese apresenta proposições inovadoras de abordagens com vistas à seleção de variáveis para classificação e predição de propriedades de amostras de produtos diversos. Tais abordagens são abordadas em três artigos apresentados nesta tese, com intuito de melhorar a precisão dos modelos de classificação e predição em diferentes áreas. No primeiro artigo, integram-se índices de importância de variáveis a sistemáticas de classificação hierárquica para categorizar amostras de espumantes de acordo com seu país de origem. No segundo artigo, para selecionar as variáveis mais informativas para a predição de amostras via PLS, propõe-se um índice de importância de variáveis baseado na Lei de Lambert-Beer combinado a um processo iterativo de seleção do tipo forward. Por fim, o terceiro artigo utilizou cluster de variáveis espectrais e índice de importância para selecionar as variáveis que produzem modelos de predição mais consistentes. Em todos os artigos dessa tese, os resultados obtidos pelos métodos propostos foram superiores quando comparados a outros métodos tradicionais da literatura voltados à identificação das variáveis mais informativas.Variable selection is an important step in data analysis, since it identifies the most informative subsets of variables for build accurate classification and prediction models. In addition, variable selection improves the interpretation and analysis of obtained models, reduces the computational time to build models and reduces the obtained samples costs. In this context, this thesis presents propositions for a variable selection method aiming to classifying and predicting sample properties. Such methods are presented in three papers in this thesis, in order to improve the classification and prediction accuracy in different areas. In first paper, we applied variable importance index coupled with a hierarchical classification technique to identify the country of origin of sparkling wines. In second paper, to select the most informative variables for prediction, a variable improtance index was built based on Lambert-Beer law and an iterative forward process was performed. Finally, in third paper was used clustering of variables and variable importance index to select the variables that produce more consistent prediction models. In all papers of this thesis, when conpared to other traditional methods, our proposition obtained better results.application/pdfporSeleção de variáveisControle de qualidadeVariable selectionClassificationPredictionRefiefFVariable importance indexClustering of variableNIRAbordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostrasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia de Produção e TransportesPorto Alegre, BR-RS2021doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001126653.pdf.txt001126653.pdf.txtExtracted Texttext/plain54215http://www.lume.ufrgs.br/bitstream/10183/223535/2/001126653.pdf.txt68995eae87ec44a1ae4dc8601a997f48MD52ORIGINAL001126653.pdfTexto parcialapplication/pdf694955http://www.lume.ufrgs.br/bitstream/10183/223535/1/001126653.pdfabd84894d436e42daefe34685af1fe51MD5110183/2235352021-08-18 04:29:51.150362oai:www.lume.ufrgs.br:10183/223535Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-08-18T07:29:51Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras |
title |
Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras |
spellingShingle |
Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras Yamashita, Gabrielli Harumi Seleção de variáveis Controle de qualidade Variable selection Classification Prediction RefiefF Variable importance index Clustering of variable NIR |
title_short |
Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras |
title_full |
Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras |
title_fullStr |
Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras |
title_full_unstemmed |
Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras |
title_sort |
Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras |
author |
Yamashita, Gabrielli Harumi |
author_facet |
Yamashita, Gabrielli Harumi |
author_role |
author |
dc.contributor.author.fl_str_mv |
Yamashita, Gabrielli Harumi |
dc.contributor.advisor1.fl_str_mv |
Anzanello, Michel José |
contributor_str_mv |
Anzanello, Michel José |
dc.subject.por.fl_str_mv |
Seleção de variáveis Controle de qualidade |
topic |
Seleção de variáveis Controle de qualidade Variable selection Classification Prediction RefiefF Variable importance index Clustering of variable NIR |
dc.subject.eng.fl_str_mv |
Variable selection Classification Prediction RefiefF Variable importance index Clustering of variable NIR |
description |
A seleção de variáveis é uma etapa importante para a análise de dados, visto que identifica os subconjuntos de variáveis mais informativas para a construção de modelos precisos de classificação e predição. Além disso, a seleção de variáveis facilita a interpretação e análise dos modelos obtidos, potencialmente reduzindo o tempo computacional de geração dos modelos e o custo/tempo para obtenção das amostras. Neste contexto, a presente tese apresenta proposições inovadoras de abordagens com vistas à seleção de variáveis para classificação e predição de propriedades de amostras de produtos diversos. Tais abordagens são abordadas em três artigos apresentados nesta tese, com intuito de melhorar a precisão dos modelos de classificação e predição em diferentes áreas. No primeiro artigo, integram-se índices de importância de variáveis a sistemáticas de classificação hierárquica para categorizar amostras de espumantes de acordo com seu país de origem. No segundo artigo, para selecionar as variáveis mais informativas para a predição de amostras via PLS, propõe-se um índice de importância de variáveis baseado na Lei de Lambert-Beer combinado a um processo iterativo de seleção do tipo forward. Por fim, o terceiro artigo utilizou cluster de variáveis espectrais e índice de importância para selecionar as variáveis que produzem modelos de predição mais consistentes. Em todos os artigos dessa tese, os resultados obtidos pelos métodos propostos foram superiores quando comparados a outros métodos tradicionais da literatura voltados à identificação das variáveis mais informativas. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-07-10T04:51:29Z |
dc.date.issued.fl_str_mv |
2021 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/223535 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001126653 |
url |
http://hdl.handle.net/10183/223535 |
identifier_str_mv |
001126653 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/223535/2/001126653.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/223535/1/001126653.pdf |
bitstream.checksum.fl_str_mv |
68995eae87ec44a1ae4dc8601a997f48 abd84894d436e42daefe34685af1fe51 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085558056124416 |