Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFPB |
Texto Completo: | https://repositorio.ufpb.br/jspui/handle/123456789/23443 |
Resumo: | In this work the use of a new biophysical optimization strategy in Ants' Colony for selection of variables in classification problems via Linear Discriminant Analysis (LDA) is presented. The proposed algorithm, called ACO-LDA, was implemented in MatLab environment (as well as all other chemometric calculations) and evaluated in two databases already studied and a database developed. In the first study, UV-VIS spectrometry was used to classify four types of edible vegetable oils (corn, soybean, canola and sunflower). In the second case, NIR spectrometry is used to discriminate samples of teas with respect to their varieties (black and green) and geographical origins (Argentinean, Brazilian, and Sri Lankan). In the third case, NIR spectrometry data were used in beans seeds according to the type of cultivar: (perola, pontal and transgenic). The results obtained were compared to other methods of selection of variables good established in the literature as Genetic Algorithm (GA), the Algorithm of Successive Projections (SPA), both associated to LDA modeling and the Discriminante Analysis by Partial Least Squares (PLS-DA). In the first two applications, a correct prediction classification rate was: 100%, 95.7% and 100% of the ACO-LDA, GA-LDA and PLS-DA models respectively for classifying the properties of vegetable plants (UV-Vis). While for the classification of teas (NIR), a correct classification rate was 92%, 84% and 100% of the ACO-LDA, GA-LDA and PLS-DA models respectively. In the third application, a correct classification rate was 100% for the four models (ACO-LDA, GA-LDA, SPA-LDA and PLS-DA) in the classification of debts. Thus, the results indicated that ACO-LDA is promising to classify from NIR and UV-Vis spectrometric data, making it possible to provide results compatible with those chosen by powerful and versatile chemometric tools. |
id |
UFPB_a1a50ce5da487af1a74c79256acbcfd2 |
---|---|
oai_identifier_str |
oai:repositorio.ufpb.br:123456789/23443 |
network_acronym_str |
UFPB |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFPB |
repository_id_str |
|
spelling |
Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linearSeleção de variáveisColônia de formigasAnálise discriminante linearVariable selectionAnt colonyLinear discriminant analysisCNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICAIn this work the use of a new biophysical optimization strategy in Ants' Colony for selection of variables in classification problems via Linear Discriminant Analysis (LDA) is presented. The proposed algorithm, called ACO-LDA, was implemented in MatLab environment (as well as all other chemometric calculations) and evaluated in two databases already studied and a database developed. In the first study, UV-VIS spectrometry was used to classify four types of edible vegetable oils (corn, soybean, canola and sunflower). In the second case, NIR spectrometry is used to discriminate samples of teas with respect to their varieties (black and green) and geographical origins (Argentinean, Brazilian, and Sri Lankan). In the third case, NIR spectrometry data were used in beans seeds according to the type of cultivar: (perola, pontal and transgenic). The results obtained were compared to other methods of selection of variables good established in the literature as Genetic Algorithm (GA), the Algorithm of Successive Projections (SPA), both associated to LDA modeling and the Discriminante Analysis by Partial Least Squares (PLS-DA). In the first two applications, a correct prediction classification rate was: 100%, 95.7% and 100% of the ACO-LDA, GA-LDA and PLS-DA models respectively for classifying the properties of vegetable plants (UV-Vis). While for the classification of teas (NIR), a correct classification rate was 92%, 84% and 100% of the ACO-LDA, GA-LDA and PLS-DA models respectively. In the third application, a correct classification rate was 100% for the four models (ACO-LDA, GA-LDA, SPA-LDA and PLS-DA) in the classification of debts. Thus, the results indicated that ACO-LDA is promising to classify from NIR and UV-Vis spectrometric data, making it possible to provide results compatible with those chosen by powerful and versatile chemometric tools.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESNeste trabalho é apresentado o uso de uma nova estratégia de otimização bioinspirada em Colônia de Formigas para seleção de variáveis em problemas de classificação via Analise Discriminante Linear (LDA). O algoritmo proposto, denominado ACO-LDA, foi implementado em ambiente MatLab (como também todos os demais cálculos quimiométricos) buscando minimizar uma função de custo associada ao risco médio de erro de classificação Gcost. O ACO-LDA O BA-LDA foi avaliado usando dados espectrométricos de infravermelho próximo (NIR) e de ultravioleta visível (UV-Vis). No primeiro estudo, a espectrometria UV-VIS é adotada para classificar quatro tipos de óleos vegetais comestíveis (milho, soja, canola e girassol). No segundo caso, a espectrometria NIR é usada para discriminar amostras de chás com respeito as suas variedades (preto e verde) e origens geográficas (argentino, brasileiro e srilanquense). No terceiro caso, é empregado dados de espectrometria NIR em sementes de feijões segundo o tipo de cultivar: (perola, pontal e transgênico). Os resultados obtidos foram comparados a outros métodos de seleção de variáveis bem estabelecidos na literatura como Algoritmo genético (GA), o Algoritmo das Projeções Sucessivas (SPA), ambos associados às modelagens LDA e por Análise discriminante por mínimos quadrados parciais (PLS-DA). Nas duas primeiras aplicações, a taxa de classificação correta de previsão foram: 100%, 95,7% e 100% dos modelos ACO-LDA, GA-LDA e PLS-DA respectivamente para classificação das amostras de óleos vegetais (UV-Vis). Enquanto para classificação das amostras de chás (NIR), a taxa de classificação correta foram de 92%, 84% e 100% dos modelos ACO-LDA, GA-LDA e PLS-DA respectivamente. Já na terceira aplicação, a taxa de classificação correta foi de 100% para os quatros modelos (ACO-LDA, GA-LDA, SPA-LDA e PLS-DA) na classificação das amostras de feijões. Dessa forma, os resultados indicam que o ACO-LDA é promissor para classificação de amostras a partir de dados espectrométricos NIR e UV-Vis, possibilitando fornecer resultados compatíveis com aqueles obtidos por ferramentas quimiométricas poderosas e versáteis.Universidade Federal da ParaíbaBrasilQuímicaPrograma de Pós-Graduação em QuímicaUFPBSilva, Edvan Cirino dahttp://lattes.cnpq.br/1777102714370218Pontes, Aline Santos de2022-07-14T19:43:13Z2021-08-042022-07-14T19:43:13Z2020-12-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttps://repositorio.ufpb.br/jspui/handle/123456789/23443porAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2022-08-09T12:38:14Zoai:repositorio.ufpb.br:123456789/23443Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufpb.br/PUBhttp://tede.biblioteca.ufpb.br:8080/oai/requestdiretoria@ufpb.br|| diretoria@ufpb.bropendoar:2022-08-09T12:38:14Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)false |
dc.title.none.fl_str_mv |
Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear |
title |
Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear |
spellingShingle |
Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear Pontes, Aline Santos de Seleção de variáveis Colônia de formigas Análise discriminante linear Variable selection Ant colony Linear discriminant analysis CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA |
title_short |
Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear |
title_full |
Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear |
title_fullStr |
Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear |
title_full_unstemmed |
Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear |
title_sort |
Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear |
author |
Pontes, Aline Santos de |
author_facet |
Pontes, Aline Santos de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Silva, Edvan Cirino da http://lattes.cnpq.br/1777102714370218 |
dc.contributor.author.fl_str_mv |
Pontes, Aline Santos de |
dc.subject.por.fl_str_mv |
Seleção de variáveis Colônia de formigas Análise discriminante linear Variable selection Ant colony Linear discriminant analysis CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA |
topic |
Seleção de variáveis Colônia de formigas Análise discriminante linear Variable selection Ant colony Linear discriminant analysis CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA |
description |
In this work the use of a new biophysical optimization strategy in Ants' Colony for selection of variables in classification problems via Linear Discriminant Analysis (LDA) is presented. The proposed algorithm, called ACO-LDA, was implemented in MatLab environment (as well as all other chemometric calculations) and evaluated in two databases already studied and a database developed. In the first study, UV-VIS spectrometry was used to classify four types of edible vegetable oils (corn, soybean, canola and sunflower). In the second case, NIR spectrometry is used to discriminate samples of teas with respect to their varieties (black and green) and geographical origins (Argentinean, Brazilian, and Sri Lankan). In the third case, NIR spectrometry data were used in beans seeds according to the type of cultivar: (perola, pontal and transgenic). The results obtained were compared to other methods of selection of variables good established in the literature as Genetic Algorithm (GA), the Algorithm of Successive Projections (SPA), both associated to LDA modeling and the Discriminante Analysis by Partial Least Squares (PLS-DA). In the first two applications, a correct prediction classification rate was: 100%, 95.7% and 100% of the ACO-LDA, GA-LDA and PLS-DA models respectively for classifying the properties of vegetable plants (UV-Vis). While for the classification of teas (NIR), a correct classification rate was 92%, 84% and 100% of the ACO-LDA, GA-LDA and PLS-DA models respectively. In the third application, a correct classification rate was 100% for the four models (ACO-LDA, GA-LDA, SPA-LDA and PLS-DA) in the classification of debts. Thus, the results indicated that ACO-LDA is promising to classify from NIR and UV-Vis spectrometric data, making it possible to provide results compatible with those chosen by powerful and versatile chemometric tools. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-12-14 2021-08-04 2022-07-14T19:43:13Z 2022-07-14T19:43:13Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpb.br/jspui/handle/123456789/23443 |
url |
https://repositorio.ufpb.br/jspui/handle/123456789/23443 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal da Paraíba Brasil Química Programa de Pós-Graduação em Química UFPB |
publisher.none.fl_str_mv |
Universidade Federal da Paraíba Brasil Química Programa de Pós-Graduação em Química UFPB |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFPB instname:Universidade Federal da Paraíba (UFPB) instacron:UFPB |
instname_str |
Universidade Federal da Paraíba (UFPB) |
instacron_str |
UFPB |
institution |
UFPB |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFPB |
collection |
Biblioteca Digital de Teses e Dissertações da UFPB |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB) |
repository.mail.fl_str_mv |
diretoria@ufpb.br|| diretoria@ufpb.br |
_version_ |
1801842995965722624 |