Análise discriminante linear em duas dimensões para classificação de dados químicos de segunda ordem

Detalhes bibliográficos
Autor(a) principal: Silva, Adenilton Camilo da
Data de Publicação: 2017
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFPB
Texto Completo: https://repositorio.ufpb.br/jspui/handle/123456789/11849
Resumo: With advances in analytical instrumentation has been increasingly common to obtain second order data by using primarily hyphenated techniques. Despite the advantages obtained by increasing the number of detectors used in sample measurement, the direct data interpretation can be a challenge given the complexity of some matrices. Thus it is important that new chemometric strategies are proposed to support in the interpretation of the data type, such as the twodimensional discriminant linear analysis algorithm (2D-LDA). 2D-LDA was originally proposed in the image processing context for extraction of characteristic vectors with high discriminant power. Despite its promising performance in image processing, the 2D-LDA algorithm has not used in applications involving chemical data. This work investigates the use of 2D-LDA in classification problems involving second order chemical data. Four datasets were used: 2 simulated datasets of excitation / emission matrix fluorescence spectrometry; Auto fluorescence Spectrometry of Parma Ham, Total Synchronous Spectrometry of Edible Vegetable Oil. The results were compared with following algorithms: no feature extraction (NFE); U-PLS-DA (Partial least squares discriminant analysis in unfolded data) and LDA by using TUCKER-3 or PARAFAC scores. In the first simulated data set all models achieved a correct classification rate of 100%. However, in the second simulated data set only NFE model presented classification errors (30%). The Parma ham and vegetable oils data sets obtained the best classification rates by using 2D-LDA and TUCKER-3-LDA (86% and 100%) compared to the models without extraction of characteristics (76% and 77% ), U-PLS-DA (81% and 92%) and PARAFAC-LDA (86% and 92%). In general, the 2D-LDA presented comparable results to the other algorithms and could be considered as a promising strategy in the classification of second order chemical data.
id UFPB_471395b2efbdfb68c32be37e244664f1
oai_identifier_str oai:repositorio.ufpb.br:123456789/11849
network_acronym_str UFPB
network_name_str Biblioteca Digital de Teses e Dissertações da UFPB
repository_id_str
spelling Análise discriminante linear em duas dimensões para classificação de dados químicos de segunda ordem2D-LDASegunda ordemClassificaçãoPARAFACTUCKERU-PLS-DA2D-LDASecond orderClassificationPARAFACTUCKERU-PLS-DACNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICAWith advances in analytical instrumentation has been increasingly common to obtain second order data by using primarily hyphenated techniques. Despite the advantages obtained by increasing the number of detectors used in sample measurement, the direct data interpretation can be a challenge given the complexity of some matrices. Thus it is important that new chemometric strategies are proposed to support in the interpretation of the data type, such as the twodimensional discriminant linear analysis algorithm (2D-LDA). 2D-LDA was originally proposed in the image processing context for extraction of characteristic vectors with high discriminant power. Despite its promising performance in image processing, the 2D-LDA algorithm has not used in applications involving chemical data. This work investigates the use of 2D-LDA in classification problems involving second order chemical data. Four datasets were used: 2 simulated datasets of excitation / emission matrix fluorescence spectrometry; Auto fluorescence Spectrometry of Parma Ham, Total Synchronous Spectrometry of Edible Vegetable Oil. The results were compared with following algorithms: no feature extraction (NFE); U-PLS-DA (Partial least squares discriminant analysis in unfolded data) and LDA by using TUCKER-3 or PARAFAC scores. In the first simulated data set all models achieved a correct classification rate of 100%. However, in the second simulated data set only NFE model presented classification errors (30%). The Parma ham and vegetable oils data sets obtained the best classification rates by using 2D-LDA and TUCKER-3-LDA (86% and 100%) compared to the models without extraction of characteristics (76% and 77% ), U-PLS-DA (81% and 92%) and PARAFAC-LDA (86% and 92%). In general, the 2D-LDA presented comparable results to the other algorithms and could be considered as a promising strategy in the classification of second order chemical data.Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPqCom os avanços na instrumentação analítica tem sido cada vez mais comum a obtenção de dados de segunda ordem, principalmente pelo uso de técnicas hifenadas. Apesar das vantagens obtidas com o aumento do número informações sobre a amostra, a partir de detectores, a interpretação direta dos dados pode ser um desafio dada a complexidade de algumas matrizes. Diante disso, é importante que novas estratégias quimiométricas sejam propostas a fim de auxiliar na interpretação desse tipo de dado, como é o caso do algoritmo de análise linear discriminante em duas dimensões (2D-LDA). O 2D-LDA foi originalmente proposto no contexto do processamento de imagens de face para a extração de vetores características com alto poder discriminante. Apesar do seu desempenho promissor em tratamento de imagens, o algoritmo 2DLDA ainda não foi utilizado em aplicações que envolvem dados químicos. Neste trabalho foi investigado o uso de 2D-LDA em problemas de classificação envolvendo dados químicos de segunda ordem. Quatro conjuntos de dados foram utilizados:dois conjuntos de dados simulados de espectrometria de fluorescência de matriz de excitação/emissão; um conjunto de espectros de autofluorescência de presunto de Parma e outro conjunto de espectro de fluorescência sincrônica total de óleo vegetais comestíveis. Os resultados foram comparados com aqueles obtidos utilizando: Classificação sem extração de características (NFE); U-PLS-DA (Análise discriminante por mínimos quadrados parciais em dados desdobrados) e LDA usando escores de TUCKER-3 ou PARAFAC. No primeiro conjunto de dados simulados, todos os modelos alcançaram uma taxa de classificação correta de 100%. Contudo, no segundo conjunto de dados simulado apenas o modelo NFE apresentou erros de classificação (30%). Os conjuntos de dados do presunto de Parma e dos óleos vegetais obtiveram maior taxa de classificação utilizando 2DLDA (86%) e TUCKER-3-LDA (100%), em comparação com os modelos sem extração de características (76% e 77%), U-PLS -DA (81% e 92%) e PARAFAC-LDA (86% e 92%). Em geral, o 2D-LDA apresentou resultados comparáveis aos demais algoritmos avaliados, podendo ser considerado como uma estratégia promissora na classificação de dados químicos de segunda ordem.Universidade Federal da ParaíbaBrasilQuímicaPrograma de Pós-Graduação em QuímicaUFPBAraújo, Mário Cesar Ugulino dehttp://lattes.cnpq.br/7281739070942782Silva, Adenilton Camilo da2018-10-02T18:27:25Z2018-10-022018-10-02T18:27:25Z2017-08-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttps://repositorio.ufpb.br/jspui/handle/123456789/11849porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2018-10-03T06:00:57Zoai:repositorio.ufpb.br:123456789/11849Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufpb.br/PUBhttp://tede.biblioteca.ufpb.br:8080/oai/requestdiretoria@ufpb.br|| diretoria@ufpb.bropendoar:2018-10-03T06:00:57Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)false
dc.title.none.fl_str_mv Análise discriminante linear em duas dimensões para classificação de dados químicos de segunda ordem
title Análise discriminante linear em duas dimensões para classificação de dados químicos de segunda ordem
spellingShingle Análise discriminante linear em duas dimensões para classificação de dados químicos de segunda ordem
Silva, Adenilton Camilo da
2D-LDA
Segunda ordem
Classificação
PARAFAC
TUCKER
U-PLS-DA
2D-LDA
Second order
Classification
PARAFAC
TUCKER
U-PLS-DA
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
title_short Análise discriminante linear em duas dimensões para classificação de dados químicos de segunda ordem
title_full Análise discriminante linear em duas dimensões para classificação de dados químicos de segunda ordem
title_fullStr Análise discriminante linear em duas dimensões para classificação de dados químicos de segunda ordem
title_full_unstemmed Análise discriminante linear em duas dimensões para classificação de dados químicos de segunda ordem
title_sort Análise discriminante linear em duas dimensões para classificação de dados químicos de segunda ordem
author Silva, Adenilton Camilo da
author_facet Silva, Adenilton Camilo da
author_role author
dc.contributor.none.fl_str_mv Araújo, Mário Cesar Ugulino de
http://lattes.cnpq.br/7281739070942782
dc.contributor.author.fl_str_mv Silva, Adenilton Camilo da
dc.subject.por.fl_str_mv 2D-LDA
Segunda ordem
Classificação
PARAFAC
TUCKER
U-PLS-DA
2D-LDA
Second order
Classification
PARAFAC
TUCKER
U-PLS-DA
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
topic 2D-LDA
Segunda ordem
Classificação
PARAFAC
TUCKER
U-PLS-DA
2D-LDA
Second order
Classification
PARAFAC
TUCKER
U-PLS-DA
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
description With advances in analytical instrumentation has been increasingly common to obtain second order data by using primarily hyphenated techniques. Despite the advantages obtained by increasing the number of detectors used in sample measurement, the direct data interpretation can be a challenge given the complexity of some matrices. Thus it is important that new chemometric strategies are proposed to support in the interpretation of the data type, such as the twodimensional discriminant linear analysis algorithm (2D-LDA). 2D-LDA was originally proposed in the image processing context for extraction of characteristic vectors with high discriminant power. Despite its promising performance in image processing, the 2D-LDA algorithm has not used in applications involving chemical data. This work investigates the use of 2D-LDA in classification problems involving second order chemical data. Four datasets were used: 2 simulated datasets of excitation / emission matrix fluorescence spectrometry; Auto fluorescence Spectrometry of Parma Ham, Total Synchronous Spectrometry of Edible Vegetable Oil. The results were compared with following algorithms: no feature extraction (NFE); U-PLS-DA (Partial least squares discriminant analysis in unfolded data) and LDA by using TUCKER-3 or PARAFAC scores. In the first simulated data set all models achieved a correct classification rate of 100%. However, in the second simulated data set only NFE model presented classification errors (30%). The Parma ham and vegetable oils data sets obtained the best classification rates by using 2D-LDA and TUCKER-3-LDA (86% and 100%) compared to the models without extraction of characteristics (76% and 77% ), U-PLS-DA (81% and 92%) and PARAFAC-LDA (86% and 92%). In general, the 2D-LDA presented comparable results to the other algorithms and could be considered as a promising strategy in the classification of second order chemical data.
publishDate 2017
dc.date.none.fl_str_mv 2017-08-21
2018-10-02T18:27:25Z
2018-10-02
2018-10-02T18:27:25Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpb.br/jspui/handle/123456789/11849
url https://repositorio.ufpb.br/jspui/handle/123456789/11849
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Química
Programa de Pós-Graduação em Química
UFPB
publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Química
Programa de Pós-Graduação em Química
UFPB
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFPB
instname:Universidade Federal da Paraíba (UFPB)
instacron:UFPB
instname_str Universidade Federal da Paraíba (UFPB)
instacron_str UFPB
institution UFPB
reponame_str Biblioteca Digital de Teses e Dissertações da UFPB
collection Biblioteca Digital de Teses e Dissertações da UFPB
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)
repository.mail.fl_str_mv diretoria@ufpb.br|| diretoria@ufpb.br
_version_ 1801842934208790528