Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/1822/65324 |
Resumo: | Dissertação de mestrado em Chemical Analysis and Characterisation Techniques Chemical Sciences |
id |
RCAP_3fb8a65379a30fbc5a3d17610ef91c8a |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/65324 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniquesChemometricsChromatographyFood chemistryMachine learningQuality controlControlo de qualidadeCromatografiaMachine learningQuimiometriaCiências Naturais::Outras Ciências NaturaisDissertação de mestrado em Chemical Analysis and Characterisation Techniques Chemical SciencesScientific and technological advances allowed the extraction of a growing quantity of knowledge from the analysed samples by means of analytical techniques. Over the last few years, the dimensionality of data that the most recent analytical techniques produce is so high, that its analysis is now called megavariate analysis. Recently, the usage of machine learning tools in chemical data analysis have allowed the extraction of relevant information from samples at a level which, until then, would just not be possible. The objective of this work consists in classifying manufacturing conditions of printed circuit boards based on data acquired by SLE-HPLC-ESI-MS. As such, this dissertation is divided in two parts: the first synthesizes the work taken to assure the analytical method produces data with adequate quality in such a way the second part shows the development of predictive model using the previous acquired data. At the same time, a data augmentation technique which, to the best of our knowledge, constitutes the first time a data augmentation technique for classification problems using chromatographic data, has been developed. Best models’ results show precisions above 94% for all manufacturing conditions prediction. Moreover, the developed data augmentation technique reports superior performances when compared to three other data augmentation techniques. In summary, the results show that, besides distinguishing classes with different chemical compositions, it is possible to obtain information about which are the chemical compounds that differentiate the classes. This information might be of significant importance for areas such as quality control, food chemistry, botany and pharmaceutical industry.O constante avanço científico-tecnológico permitiu que, ao longo do último século, as técnicas de análise química extraíssem cada vez mais conhecimento das amostras analisadas. Nos últimos anos, a quantidade de dados que as mais recentes técnicas analíticas produzem possui uma dimensão tão elevada que a sua análise é denominada de análise megavariacional. Recentemente, a aplicação de ferramentas de machine learning em análises de dados químicos tem permitido extrair informação relevante das amostras analisadas que até recentemente não era possível. Com isto em mente, o objetivo deste trabalho consiste em classificar condições de manufatura de placas de circuito impresso tendo por base dados provenientes de análise por cromatografia líquida acoplada a espetrometria de massa com extração sólido-líquido. Desta forma, esta dissertação está dividida em duas partes: a primeira sintetiza o trabalho efetuado para garantir que o método de análise produz dados com qualidade adequada para que na segunda parte esses dados sejam usados para construir modelos preditivos. Paralelamente, foi desenvolvida uma técnica de aumento de dados que, até onde o nosso conhecimento vai, constitui a primeira técnica de aumento de dados desenvolvida para problemas de classificação com dados provenientes de análises cromatográficas. Os resultados dos melhores modelos mostram precisões superiores a 94% para a previsão de todas as condições de manufatura. Adicionalmente, a técnica de aumento de dados desenvolvida mostra desempenhos superiores comparativamente a outras técnicas de aumento de dados. Em síntese, os resultados obtidos indicam que, para além de distinguir classes com composições químicas diferentes, é possível adquirir informação sobre quais são os compostos químicos que distinguem as classes em estudo. Esta informação pode vir a ter uma importância significativa em áreas como controlo de qualidade, química alimentar e indústria fito-farmacêutica.Fundação para a Ciência e Tecnologia através do projeto POCI-01-0145-FEDER-029147 - PTDC/FIS-PAR/29147/2017 financiado por: OE/FCT, Lisboa 2020, Compete 2020 POCI, Portugal 2020 FEDERParpot, PierCastro, Nuno FilipeUniversidade do MinhoGonçalves, Diogo Barros20192019-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/65324eng202472019info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:27:48Zoai:repositorium.sdum.uminho.pt:1822/65324Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:22:31.565848Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques |
title |
Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques |
spellingShingle |
Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques Gonçalves, Diogo Barros Chemometrics Chromatography Food chemistry Machine learning Quality control Controlo de qualidade Cromatografia Machine learning Quimiometria Ciências Naturais::Outras Ciências Naturais |
title_short |
Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques |
title_full |
Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques |
title_fullStr |
Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques |
title_full_unstemmed |
Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques |
title_sort |
Machine learning in analytical chemistry: applying innovative data analysis methods using chromatographic techniques |
author |
Gonçalves, Diogo Barros |
author_facet |
Gonçalves, Diogo Barros |
author_role |
author |
dc.contributor.none.fl_str_mv |
Parpot, Pier Castro, Nuno Filipe Universidade do Minho |
dc.contributor.author.fl_str_mv |
Gonçalves, Diogo Barros |
dc.subject.por.fl_str_mv |
Chemometrics Chromatography Food chemistry Machine learning Quality control Controlo de qualidade Cromatografia Machine learning Quimiometria Ciências Naturais::Outras Ciências Naturais |
topic |
Chemometrics Chromatography Food chemistry Machine learning Quality control Controlo de qualidade Cromatografia Machine learning Quimiometria Ciências Naturais::Outras Ciências Naturais |
description |
Dissertação de mestrado em Chemical Analysis and Characterisation Techniques Chemical Sciences |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019 2019-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1822/65324 |
url |
http://hdl.handle.net/1822/65324 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
202472019 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799132695930863617 |