Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques

Detalhes bibliográficos
Autor(a) principal: Gonçalves, Diogo Barros
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/1822/65324
Resumo: Dissertação de mestrado em Chemical Analysis and Characterisation Techniques Chemical Sciences
id RCAP_3fb8a65379a30fbc5a3d17610ef91c8a
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/65324
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniquesChemometricsChromatographyFood chemistryMachine learningQuality controlControlo de qualidadeCromatografiaMachine learningQuimiometriaCiências Naturais::Outras Ciências NaturaisDissertação de mestrado em Chemical Analysis and Characterisation Techniques Chemical SciencesScientific and technological advances allowed the extraction of a growing quantity of knowledge from the analysed samples by means of analytical techniques. Over the last few years, the dimensionality of data that the most recent analytical techniques produce is so high, that its analysis is now called megavariate analysis. Recently, the usage of machine learning tools in chemical data analysis have allowed the extraction of relevant information from samples at a level which, until then, would just not be possible. The objective of this work consists in classifying manufacturing conditions of printed circuit boards based on data acquired by SLE-HPLC-ESI-MS. As such, this dissertation is divided in two parts: the first synthesizes the work taken to assure the analytical method produces data with adequate quality in such a way the second part shows the development of predictive model using the previous acquired data. At the same time, a data augmentation technique which, to the best of our knowledge, constitutes the first time a data augmentation technique for classification problems using chromatographic data, has been developed. Best models’ results show precisions above 94% for all manufacturing conditions prediction. Moreover, the developed data augmentation technique reports superior performances when compared to three other data augmentation techniques. In summary, the results show that, besides distinguishing classes with different chemical compositions, it is possible to obtain information about which are the chemical compounds that differentiate the classes. This information might be of significant importance for areas such as quality control, food chemistry, botany and pharmaceutical industry.O constante avanço científico-tecnológico permitiu que, ao longo do último século, as técnicas de análise química extraíssem cada vez mais conhecimento das amostras analisadas. Nos últimos anos, a quantidade de dados que as mais recentes técnicas analíticas produzem possui uma dimensão tão elevada que a sua análise é denominada de análise megavariacional. Recentemente, a aplicação de ferramentas de machine learning em análises de dados químicos tem permitido extrair informação relevante das amostras analisadas que até recentemente não era possível. Com isto em mente, o objetivo deste trabalho consiste em classificar condições de manufatura de placas de circuito impresso tendo por base dados provenientes de análise por cromatografia líquida acoplada a espetrometria de massa com extração sólido-líquido. Desta forma, esta dissertação está dividida em duas partes: a primeira sintetiza o trabalho efetuado para garantir que o método de análise produz dados com qualidade adequada para que na segunda parte esses dados sejam usados para construir modelos preditivos. Paralelamente, foi desenvolvida uma técnica de aumento de dados que, até onde o nosso conhecimento vai, constitui a primeira técnica de aumento de dados desenvolvida para problemas de classificação com dados provenientes de análises cromatográficas. Os resultados dos melhores modelos mostram precisões superiores a 94% para a previsão de todas as condições de manufatura. Adicionalmente, a técnica de aumento de dados desenvolvida mostra desempenhos superiores comparativamente a outras técnicas de aumento de dados. Em síntese, os resultados obtidos indicam que, para além de distinguir classes com composições químicas diferentes, é possível adquirir informação sobre quais são os compostos químicos que distinguem as classes em estudo. Esta informação pode vir a ter uma importância significativa em áreas como controlo de qualidade, química alimentar e indústria fito-farmacêutica.Fundação para a Ciência e Tecnologia através do projeto POCI-01-0145-FEDER-029147 - PTDC/FIS-PAR/29147/2017 financiado por: OE/FCT, Lisboa 2020, Compete 2020 POCI, Portugal 2020 FEDERParpot, PierCastro, Nuno FilipeUniversidade do MinhoGonçalves, Diogo Barros20192019-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/65324eng202472019info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:27:48Zoai:repositorium.sdum.uminho.pt:1822/65324Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:22:31.565848Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques
title Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques
spellingShingle Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques
Gonçalves, Diogo Barros
Chemometrics
Chromatography
Food chemistry
Machine learning
Quality control
Controlo de qualidade
Cromatografia
Machine learning
Quimiometria
Ciências Naturais::Outras Ciências Naturais
title_short Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques
title_full Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques
title_fullStr Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques
title_full_unstemmed Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques
title_sort Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques
author Gonçalves, Diogo Barros
author_facet Gonçalves, Diogo Barros
author_role author
dc.contributor.none.fl_str_mv Parpot, Pier
Castro, Nuno Filipe
Universidade do Minho
dc.contributor.author.fl_str_mv Gonçalves, Diogo Barros
dc.subject.por.fl_str_mv Chemometrics
Chromatography
Food chemistry
Machine learning
Quality control
Controlo de qualidade
Cromatografia
Machine learning
Quimiometria
Ciências Naturais::Outras Ciências Naturais
topic Chemometrics
Chromatography
Food chemistry
Machine learning
Quality control
Controlo de qualidade
Cromatografia
Machine learning
Quimiometria
Ciências Naturais::Outras Ciências Naturais
description Dissertação de mestrado em Chemical Analysis and Characterisation Techniques Chemical Sciences
publishDate 2019
dc.date.none.fl_str_mv 2019
2019-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/65324
url http://hdl.handle.net/1822/65324
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 202472019
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132695930863617