Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras

Detalhes bibliográficos
Autor(a) principal: Yamashita, Gabrielli Harumi
Data de Publicação: 2021
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/223535
Resumo: A seleção de variáveis é uma etapa importante para a análise de dados, visto que identifica os subconjuntos de variáveis mais informativas para a construção de modelos precisos de classificação e predição. Além disso, a seleção de variáveis facilita a interpretação e análise dos modelos obtidos, potencialmente reduzindo o tempo computacional de geração dos modelos e o custo/tempo para obtenção das amostras. Neste contexto, a presente tese apresenta proposições inovadoras de abordagens com vistas à seleção de variáveis para classificação e predição de propriedades de amostras de produtos diversos. Tais abordagens são abordadas em três artigos apresentados nesta tese, com intuito de melhorar a precisão dos modelos de classificação e predição em diferentes áreas. No primeiro artigo, integram-se índices de importância de variáveis a sistemáticas de classificação hierárquica para categorizar amostras de espumantes de acordo com seu país de origem. No segundo artigo, para selecionar as variáveis mais informativas para a predição de amostras via PLS, propõe-se um índice de importância de variáveis baseado na Lei de Lambert-Beer combinado a um processo iterativo de seleção do tipo forward. Por fim, o terceiro artigo utilizou cluster de variáveis espectrais e índice de importância para selecionar as variáveis que produzem modelos de predição mais consistentes. Em todos os artigos dessa tese, os resultados obtidos pelos métodos propostos foram superiores quando comparados a outros métodos tradicionais da literatura voltados à identificação das variáveis mais informativas.
id URGS_d686b204e56c7097dd3b3f589f0d1915
oai_identifier_str oai:www.lume.ufrgs.br:10183/223535
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Yamashita, Gabrielli HarumiAnzanello, Michel José2021-07-10T04:51:29Z2021http://hdl.handle.net/10183/223535001126653A seleção de variáveis é uma etapa importante para a análise de dados, visto que identifica os subconjuntos de variáveis mais informativas para a construção de modelos precisos de classificação e predição. Além disso, a seleção de variáveis facilita a interpretação e análise dos modelos obtidos, potencialmente reduzindo o tempo computacional de geração dos modelos e o custo/tempo para obtenção das amostras. Neste contexto, a presente tese apresenta proposições inovadoras de abordagens com vistas à seleção de variáveis para classificação e predição de propriedades de amostras de produtos diversos. Tais abordagens são abordadas em três artigos apresentados nesta tese, com intuito de melhorar a precisão dos modelos de classificação e predição em diferentes áreas. No primeiro artigo, integram-se índices de importância de variáveis a sistemáticas de classificação hierárquica para categorizar amostras de espumantes de acordo com seu país de origem. No segundo artigo, para selecionar as variáveis mais informativas para a predição de amostras via PLS, propõe-se um índice de importância de variáveis baseado na Lei de Lambert-Beer combinado a um processo iterativo de seleção do tipo forward. Por fim, o terceiro artigo utilizou cluster de variáveis espectrais e índice de importância para selecionar as variáveis que produzem modelos de predição mais consistentes. Em todos os artigos dessa tese, os resultados obtidos pelos métodos propostos foram superiores quando comparados a outros métodos tradicionais da literatura voltados à identificação das variáveis mais informativas.Variable selection is an important step in data analysis, since it identifies the most informative subsets of variables for build accurate classification and prediction models. In addition, variable selection improves the interpretation and analysis of obtained models, reduces the computational time to build models and reduces the obtained samples costs. In this context, this thesis presents propositions for a variable selection method aiming to classifying and predicting sample properties. Such methods are presented in three papers in this thesis, in order to improve the classification and prediction accuracy in different areas. In first paper, we applied variable importance index coupled with a hierarchical classification technique to identify the country of origin of sparkling wines. In second paper, to select the most informative variables for prediction, a variable improtance index was built based on Lambert-Beer law and an iterative forward process was performed. Finally, in third paper was used clustering of variables and variable importance index to select the variables that produce more consistent prediction models. In all papers of this thesis, when conpared to other traditional methods, our proposition obtained better results.application/pdfporSeleção de variáveisControle de qualidadeVariable selectionClassificationPredictionRefiefFVariable importance indexClustering of variableNIRAbordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostrasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia de Produção e TransportesPorto Alegre, BR-RS2021doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001126653.pdf.txt001126653.pdf.txtExtracted Texttext/plain54215http://www.lume.ufrgs.br/bitstream/10183/223535/2/001126653.pdf.txt68995eae87ec44a1ae4dc8601a997f48MD52ORIGINAL001126653.pdfTexto parcialapplication/pdf694955http://www.lume.ufrgs.br/bitstream/10183/223535/1/001126653.pdfabd84894d436e42daefe34685af1fe51MD5110183/2235352021-08-18 04:29:51.150362oai:www.lume.ufrgs.br:10183/223535Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-08-18T07:29:51Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras
title Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras
spellingShingle Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras
Yamashita, Gabrielli Harumi
Seleção de variáveis
Controle de qualidade
Variable selection
Classification
Prediction
RefiefF
Variable importance index
Clustering of variable
NIR
title_short Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras
title_full Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras
title_fullStr Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras
title_full_unstemmed Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras
title_sort Abordagens multivariadas para seleção de variáveis com vistas à classificação e predição de propriedades de amostras
author Yamashita, Gabrielli Harumi
author_facet Yamashita, Gabrielli Harumi
author_role author
dc.contributor.author.fl_str_mv Yamashita, Gabrielli Harumi
dc.contributor.advisor1.fl_str_mv Anzanello, Michel José
contributor_str_mv Anzanello, Michel José
dc.subject.por.fl_str_mv Seleção de variáveis
Controle de qualidade
topic Seleção de variáveis
Controle de qualidade
Variable selection
Classification
Prediction
RefiefF
Variable importance index
Clustering of variable
NIR
dc.subject.eng.fl_str_mv Variable selection
Classification
Prediction
RefiefF
Variable importance index
Clustering of variable
NIR
description A seleção de variáveis é uma etapa importante para a análise de dados, visto que identifica os subconjuntos de variáveis mais informativas para a construção de modelos precisos de classificação e predição. Além disso, a seleção de variáveis facilita a interpretação e análise dos modelos obtidos, potencialmente reduzindo o tempo computacional de geração dos modelos e o custo/tempo para obtenção das amostras. Neste contexto, a presente tese apresenta proposições inovadoras de abordagens com vistas à seleção de variáveis para classificação e predição de propriedades de amostras de produtos diversos. Tais abordagens são abordadas em três artigos apresentados nesta tese, com intuito de melhorar a precisão dos modelos de classificação e predição em diferentes áreas. No primeiro artigo, integram-se índices de importância de variáveis a sistemáticas de classificação hierárquica para categorizar amostras de espumantes de acordo com seu país de origem. No segundo artigo, para selecionar as variáveis mais informativas para a predição de amostras via PLS, propõe-se um índice de importância de variáveis baseado na Lei de Lambert-Beer combinado a um processo iterativo de seleção do tipo forward. Por fim, o terceiro artigo utilizou cluster de variáveis espectrais e índice de importância para selecionar as variáveis que produzem modelos de predição mais consistentes. Em todos os artigos dessa tese, os resultados obtidos pelos métodos propostos foram superiores quando comparados a outros métodos tradicionais da literatura voltados à identificação das variáveis mais informativas.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-07-10T04:51:29Z
dc.date.issued.fl_str_mv 2021
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/223535
dc.identifier.nrb.pt_BR.fl_str_mv 001126653
url http://hdl.handle.net/10183/223535
identifier_str_mv 001126653
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/223535/2/001126653.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/223535/1/001126653.pdf
bitstream.checksum.fl_str_mv 68995eae87ec44a1ae4dc8601a997f48
abd84894d436e42daefe34685af1fe51
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1800309181828300800