Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear

Detalhes bibliográficos
Autor(a) principal: Pontes, Aline Santos de
Data de Publicação: 2020
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFPB
Texto Completo: https://repositorio.ufpb.br/jspui/handle/123456789/23443
Resumo: In this work the use of a new biophysical optimization strategy in Ants' Colony for selection of variables in classification problems via Linear Discriminant Analysis (LDA) is presented. The proposed algorithm, called ACO-LDA, was implemented in MatLab environment (as well as all other chemometric calculations) and evaluated in two databases already studied and a database developed. In the first study, UV-VIS spectrometry was used to classify four types of edible vegetable oils (corn, soybean, canola and sunflower). In the second case, NIR spectrometry is used to discriminate samples of teas with respect to their varieties (black and green) and geographical origins (Argentinean, Brazilian, and Sri Lankan). In the third case, NIR spectrometry data were used in beans seeds according to the type of cultivar: (perola, pontal and transgenic). The results obtained were compared to other methods of selection of variables good established in the literature as Genetic Algorithm (GA), the Algorithm of Successive Projections (SPA), both associated to LDA modeling and the Discriminante Analysis by Partial Least Squares (PLS-DA). In the first two applications, a correct prediction classification rate was: 100%, 95.7% and 100% of the ACO-LDA, GA-LDA and PLS-DA models respectively for classifying the properties of vegetable plants (UV-Vis). While for the classification of teas (NIR), a correct classification rate was 92%, 84% and 100% of the ACO-LDA, GA-LDA and PLS-DA models respectively. In the third application, a correct classification rate was 100% for the four models (ACO-LDA, GA-LDA, SPA-LDA and PLS-DA) in the classification of debts. Thus, the results indicated that ACO-LDA is promising to classify from NIR and UV-Vis spectrometric data, making it possible to provide results compatible with those chosen by powerful and versatile chemometric tools.
id UFPB_a1a50ce5da487af1a74c79256acbcfd2
oai_identifier_str oai:repositorio.ufpb.br:123456789/23443
network_acronym_str UFPB
network_name_str Biblioteca Digital de Teses e Dissertações da UFPB
repository_id_str
spelling Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linearSeleção de variáveisColônia de formigasAnálise discriminante linearVariable selectionAnt colonyLinear discriminant analysisCNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICAIn this work the use of a new biophysical optimization strategy in Ants' Colony for selection of variables in classification problems via Linear Discriminant Analysis (LDA) is presented. The proposed algorithm, called ACO-LDA, was implemented in MatLab environment (as well as all other chemometric calculations) and evaluated in two databases already studied and a database developed. In the first study, UV-VIS spectrometry was used to classify four types of edible vegetable oils (corn, soybean, canola and sunflower). In the second case, NIR spectrometry is used to discriminate samples of teas with respect to their varieties (black and green) and geographical origins (Argentinean, Brazilian, and Sri Lankan). In the third case, NIR spectrometry data were used in beans seeds according to the type of cultivar: (perola, pontal and transgenic). The results obtained were compared to other methods of selection of variables good established in the literature as Genetic Algorithm (GA), the Algorithm of Successive Projections (SPA), both associated to LDA modeling and the Discriminante Analysis by Partial Least Squares (PLS-DA). In the first two applications, a correct prediction classification rate was: 100%, 95.7% and 100% of the ACO-LDA, GA-LDA and PLS-DA models respectively for classifying the properties of vegetable plants (UV-Vis). While for the classification of teas (NIR), a correct classification rate was 92%, 84% and 100% of the ACO-LDA, GA-LDA and PLS-DA models respectively. In the third application, a correct classification rate was 100% for the four models (ACO-LDA, GA-LDA, SPA-LDA and PLS-DA) in the classification of debts. Thus, the results indicated that ACO-LDA is promising to classify from NIR and UV-Vis spectrometric data, making it possible to provide results compatible with those chosen by powerful and versatile chemometric tools.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESNeste trabalho é apresentado o uso de uma nova estratégia de otimização bioinspirada em Colônia de Formigas para seleção de variáveis em problemas de classificação via Analise Discriminante Linear (LDA). O algoritmo proposto, denominado ACO-LDA, foi implementado em ambiente MatLab (como também todos os demais cálculos quimiométricos) buscando minimizar uma função de custo associada ao risco médio de erro de classificação Gcost. O ACO-LDA O BA-LDA foi avaliado usando dados espectrométricos de infravermelho próximo (NIR) e de ultravioleta visível (UV-Vis). No primeiro estudo, a espectrometria UV-VIS é adotada para classificar quatro tipos de óleos vegetais comestíveis (milho, soja, canola e girassol). No segundo caso, a espectrometria NIR é usada para discriminar amostras de chás com respeito as suas variedades (preto e verde) e origens geográficas (argentino, brasileiro e srilanquense). No terceiro caso, é empregado dados de espectrometria NIR em sementes de feijões segundo o tipo de cultivar: (perola, pontal e transgênico). Os resultados obtidos foram comparados a outros métodos de seleção de variáveis bem estabelecidos na literatura como Algoritmo genético (GA), o Algoritmo das Projeções Sucessivas (SPA), ambos associados às modelagens LDA e por Análise discriminante por mínimos quadrados parciais (PLS-DA). Nas duas primeiras aplicações, a taxa de classificação correta de previsão foram: 100%, 95,7% e 100% dos modelos ACO-LDA, GA-LDA e PLS-DA respectivamente para classificação das amostras de óleos vegetais (UV-Vis). Enquanto para classificação das amostras de chás (NIR), a taxa de classificação correta foram de 92%, 84% e 100% dos modelos ACO-LDA, GA-LDA e PLS-DA respectivamente. Já na terceira aplicação, a taxa de classificação correta foi de 100% para os quatros modelos (ACO-LDA, GA-LDA, SPA-LDA e PLS-DA) na classificação das amostras de feijões. Dessa forma, os resultados indicam que o ACO-LDA é promissor para classificação de amostras a partir de dados espectrométricos NIR e UV-Vis, possibilitando fornecer resultados compatíveis com aqueles obtidos por ferramentas quimiométricas poderosas e versáteis.Universidade Federal da ParaíbaBrasilQuímicaPrograma de Pós-Graduação em QuímicaUFPBSilva, Edvan Cirino dahttp://lattes.cnpq.br/1777102714370218Pontes, Aline Santos de2022-07-14T19:43:13Z2021-08-042022-07-14T19:43:13Z2020-12-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttps://repositorio.ufpb.br/jspui/handle/123456789/23443porAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2022-08-09T12:38:14Zoai:repositorio.ufpb.br:123456789/23443Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufpb.br/PUBhttp://tede.biblioteca.ufpb.br:8080/oai/requestdiretoria@ufpb.br|| diretoria@ufpb.bropendoar:2022-08-09T12:38:14Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)false
dc.title.none.fl_str_mv Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear
title Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear
spellingShingle Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear
Pontes, Aline Santos de
Seleção de variáveis
Colônia de formigas
Análise discriminante linear
Variable selection
Ant colony
Linear discriminant analysis
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
title_short Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear
title_full Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear
title_fullStr Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear
title_full_unstemmed Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear
title_sort Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear
author Pontes, Aline Santos de
author_facet Pontes, Aline Santos de
author_role author
dc.contributor.none.fl_str_mv Silva, Edvan Cirino da
http://lattes.cnpq.br/1777102714370218
dc.contributor.author.fl_str_mv Pontes, Aline Santos de
dc.subject.por.fl_str_mv Seleção de variáveis
Colônia de formigas
Análise discriminante linear
Variable selection
Ant colony
Linear discriminant analysis
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
topic Seleção de variáveis
Colônia de formigas
Análise discriminante linear
Variable selection
Ant colony
Linear discriminant analysis
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
description In this work the use of a new biophysical optimization strategy in Ants' Colony for selection of variables in classification problems via Linear Discriminant Analysis (LDA) is presented. The proposed algorithm, called ACO-LDA, was implemented in MatLab environment (as well as all other chemometric calculations) and evaluated in two databases already studied and a database developed. In the first study, UV-VIS spectrometry was used to classify four types of edible vegetable oils (corn, soybean, canola and sunflower). In the second case, NIR spectrometry is used to discriminate samples of teas with respect to their varieties (black and green) and geographical origins (Argentinean, Brazilian, and Sri Lankan). In the third case, NIR spectrometry data were used in beans seeds according to the type of cultivar: (perola, pontal and transgenic). The results obtained were compared to other methods of selection of variables good established in the literature as Genetic Algorithm (GA), the Algorithm of Successive Projections (SPA), both associated to LDA modeling and the Discriminante Analysis by Partial Least Squares (PLS-DA). In the first two applications, a correct prediction classification rate was: 100%, 95.7% and 100% of the ACO-LDA, GA-LDA and PLS-DA models respectively for classifying the properties of vegetable plants (UV-Vis). While for the classification of teas (NIR), a correct classification rate was 92%, 84% and 100% of the ACO-LDA, GA-LDA and PLS-DA models respectively. In the third application, a correct classification rate was 100% for the four models (ACO-LDA, GA-LDA, SPA-LDA and PLS-DA) in the classification of debts. Thus, the results indicated that ACO-LDA is promising to classify from NIR and UV-Vis spectrometric data, making it possible to provide results compatible with those chosen by powerful and versatile chemometric tools.
publishDate 2020
dc.date.none.fl_str_mv 2020-12-14
2021-08-04
2022-07-14T19:43:13Z
2022-07-14T19:43:13Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpb.br/jspui/handle/123456789/23443
url https://repositorio.ufpb.br/jspui/handle/123456789/23443
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Química
Programa de Pós-Graduação em Química
UFPB
publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Química
Programa de Pós-Graduação em Química
UFPB
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFPB
instname:Universidade Federal da Paraíba (UFPB)
instacron:UFPB
instname_str Universidade Federal da Paraíba (UFPB)
instacron_str UFPB
institution UFPB
reponame_str Biblioteca Digital de Teses e Dissertações da UFPB
collection Biblioteca Digital de Teses e Dissertações da UFPB
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)
repository.mail.fl_str_mv diretoria@ufpb.br|| diretoria@ufpb.br
_version_ 1801842995965722624