Aplicação da espectroscopia de infravermelho próximo associada a métodos quimiométricos para predição de blends de Coffea arabica e Coffea canephora em grãos crus de café
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UEL |
Texto Completo: | https://repositorio.uel.br/handle/123456789/17328 |
Resumo: | O café é um dos produtos mais apreciados pela população mundial, tendo sido consumidas em 2020 e 2021, 163 milhões de sacas no mundo. Esta commodity é relevante para o Brasil, levando em conta que o País, é seu maior produtor e exportador. Das 130 espécies da planta conhecidas, apenas duas possuem relevância comercial - Coffea arabica Lineu (café arábica) e Coffea canephora Pierre (café canéfora). Essas espécies diferem entre si, nas características físicas, químicas, sensoriais e em seu valor comercial. Embora sejam distintas, sua classificação manual é demorada. Tendo em vista que a matéria-prima define a qualidade do produto, justifica-se determinar sua identidade. Portanto, este trabalho objetivou desenvolver um método rápido utilizando a espectroscopia no infravermelho próximo (NIRS), para discriminar as espécies arábica e canéfora, e criar um modelo preditivo para determinar suas proporções nos blends a partir dos grãos crus. Os espectros NIRS foram obtidos diretamente de 50 g de café beneficiado grão cru, sem passar em peneira e nem triturar, dispostos no porta amostra, e lidos em 30 s na faixa de 750 a 2500 nm. Um banco de dados foi constituído pelas análises de 66 amostras da safra 2021/22 representativas de diferentes procedências nacionais, com espectros de 38 cafés arábica (MG, SP, PR, BA) e 28 cafés canéfora (RO e ES), submetidos aos pré-processamentos de correção multiplicativa de espalhamento (MSV). Empregando-se a análise de componentes principais (PCA), as componentes PC-1 e PC-2 foram capazes de juntas explicarem 96% da variância dos dados. A análise de agrupamento hierárquico (HCA) permitiu a separação em dois grandes grupos das 2 espécies, arábica e canéfora. Os blends de 50 g foram preparados a partir de 2 amostras, classificadas com número reduzido de defeitos, nas proporções de 5, 10, 20, 30, 40 e 50% (m/m) de café canéfora em arábica. Os gráficos de scores da PCA para os blends foram capazes de explicar 98% da variância dos dados. Para criar o modelo preditivo de distinção das misturas, utilizou-se a regressão por componentes principais (PCR) e a regressão por mínimos quadrados parciais (PLSR), com validação por meio do método leave-one-out (LOO). Embora os erros quadráticos médios (RMSE) foram elevados, os coeficientes de determinação foram adequados e os modelos preditivos PCR e PLSR foram capazes de estimar os valores das proporções de canéfora em arábica em relação ao referencial nas proporções acima de 40%. O método desenvolvido mostrou-se como alternativa verde e rápida de classificação das espécies de cafés, com potencial de predição de suas proporções em misturas, que tende a uma maior robustez com o acréscimo da variabilidade amostral. |
id |
UEL_59eecb8436ac5fc83d22d4187fea4ab8 |
---|---|
oai_identifier_str |
oai:repositorio.uel.br:123456789/17328 |
network_acronym_str |
UEL |
network_name_str |
Repositório Institucional da UEL |
repository_id_str |
|
spelling |
Aplicação da espectroscopia de infravermelho próximo associada a métodos quimiométricos para predição de blends de Coffea arabica e Coffea canephora em grãos crus de caféApplication of near infrared spectroscopy associated with chemometric methods to discriminate green coffee beans from C. arabica and C. canephora speciesGrãos de caféNIRSQuimiometriaAnálise de componentes principaisMétodo verdeModelos preditivosQuímicaCaféCiências Exatas e da Terra - QuímicaCoffee beansNIRSChemometricsPrincipal component analysisGreen methodPredictive modelsChemicalCoffeeO café é um dos produtos mais apreciados pela população mundial, tendo sido consumidas em 2020 e 2021, 163 milhões de sacas no mundo. Esta commodity é relevante para o Brasil, levando em conta que o País, é seu maior produtor e exportador. Das 130 espécies da planta conhecidas, apenas duas possuem relevância comercial - Coffea arabica Lineu (café arábica) e Coffea canephora Pierre (café canéfora). Essas espécies diferem entre si, nas características físicas, químicas, sensoriais e em seu valor comercial. Embora sejam distintas, sua classificação manual é demorada. Tendo em vista que a matéria-prima define a qualidade do produto, justifica-se determinar sua identidade. Portanto, este trabalho objetivou desenvolver um método rápido utilizando a espectroscopia no infravermelho próximo (NIRS), para discriminar as espécies arábica e canéfora, e criar um modelo preditivo para determinar suas proporções nos blends a partir dos grãos crus. Os espectros NIRS foram obtidos diretamente de 50 g de café beneficiado grão cru, sem passar em peneira e nem triturar, dispostos no porta amostra, e lidos em 30 s na faixa de 750 a 2500 nm. Um banco de dados foi constituído pelas análises de 66 amostras da safra 2021/22 representativas de diferentes procedências nacionais, com espectros de 38 cafés arábica (MG, SP, PR, BA) e 28 cafés canéfora (RO e ES), submetidos aos pré-processamentos de correção multiplicativa de espalhamento (MSV). Empregando-se a análise de componentes principais (PCA), as componentes PC-1 e PC-2 foram capazes de juntas explicarem 96% da variância dos dados. A análise de agrupamento hierárquico (HCA) permitiu a separação em dois grandes grupos das 2 espécies, arábica e canéfora. Os blends de 50 g foram preparados a partir de 2 amostras, classificadas com número reduzido de defeitos, nas proporções de 5, 10, 20, 30, 40 e 50% (m/m) de café canéfora em arábica. Os gráficos de scores da PCA para os blends foram capazes de explicar 98% da variância dos dados. Para criar o modelo preditivo de distinção das misturas, utilizou-se a regressão por componentes principais (PCR) e a regressão por mínimos quadrados parciais (PLSR), com validação por meio do método leave-one-out (LOO). Embora os erros quadráticos médios (RMSE) foram elevados, os coeficientes de determinação foram adequados e os modelos preditivos PCR e PLSR foram capazes de estimar os valores das proporções de canéfora em arábica em relação ao referencial nas proporções acima de 40%. O método desenvolvido mostrou-se como alternativa verde e rápida de classificação das espécies de cafés, com potencial de predição de suas proporções em misturas, que tende a uma maior robustez com o acréscimo da variabilidade amostral.Coffee is one of the most appreciated products by the world’s population, with 163 million bags consumed in the world in 2020 and 2021. This commodity is relevant to Brazil, considering that the country is the largest producer and exporter. Out of the 130 known species of the plant, only two have commercial relevance - Coffea arabica Lineu (arabica coffee) and Coffea canephora Pierre (canephora coffee). These species differ from each other in physical, chemical, sensory, and commercial characteristics. Although distinct, their manual classification is time-consuming and particularly challenging when blends are made for commercialization. Considering that the raw material defines the product quality, it is justified to determine its identity. Therefore, this study aimed to develop a rapid method using near-infrared spectroscopy (NIRS) to discriminate arabica from canephora species and create a predictive model to determine their proportions in blends based on raw beans. NIRS spectra were obtained directly from 50 g of raw processed coffee beans, without sieving or grinding, placed in the sample holder, and read within 30 s in the range of 750 to 2500 nm. A database was constituted by analyzing 66 samples from the 2021/22 harvest, representative of different national origins, with spectra of 38 arabica coffee (MG, SP, PR, BA) and 28 canephora coffee (RO and ES), subjected to the pre-processing of multiplicative scatter correction (MSC). Using principal component analysis (PCA), the PC-1 and PC-2 components were able to explain 96% of the data variance. Hierarchical cluster analysis (HCA) allowed the separation into two major groups of the two species, arabica and canephora. The 50 g blends were prepared from two samples, classified with a reduced number of defects, in proportions of 5, 10, 20, 30, 40, and 50% (m/m) of canephora coffee in arabica. The PCA score plots for the blends were able to explain 98% of the data variance. To create the predictive model for species distinction, Principal Component Regression (PCR) and Partial Least Squares Regression (PLSR) were valuated, validated using the leave-one-out (LOO) method. Although the mean squared errors (RMSE) were high, the coefficients of determination were adequate and the predictive models PCR and PLSR were able to estimate the values of the proportions of canephora in arabica in relation to the reference above 40%. The developed method proved to be a green and a fast alternative for classifying coffee species, with potential for predicting their proportions in mixtures, which tends to greater robustness with the increase in sample variability.Nixdorf, Suzana LucyFerreira, Ednaldo JoséSousa, Diana Nara Ribeiro DeAlvarenga, Vanessa de2024-08-28T19:08:29Z2024-08-28T19:08:29Z2023-03-27info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfhttps://repositorio.uel.br/handle/123456789/17328porCCE - Departamento de QuímicaPrograma de Pós-Graduação em QuímicaUniversidade Estadual de Londrina - UELLondrina84 p.reponame:Repositório Institucional da UELinstname:Universidade Estadual de Londrina (UEL)instacron:UELinfo:eu-repo/semantics/openAccess2024-08-29T06:01:40Zoai:repositorio.uel.br:123456789/17328Biblioteca Digital de Teses e Dissertaçõeshttp://www.bibliotecadigital.uel.br/PUBhttp://www.bibliotecadigital.uel.br/OAI/oai2.phpbcuel@uel.br||opendoar:2024-08-29T06:01:40Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)false |
dc.title.none.fl_str_mv |
Aplicação da espectroscopia de infravermelho próximo associada a métodos quimiométricos para predição de blends de Coffea arabica e Coffea canephora em grãos crus de café Application of near infrared spectroscopy associated with chemometric methods to discriminate green coffee beans from C. arabica and C. canephora species |
title |
Aplicação da espectroscopia de infravermelho próximo associada a métodos quimiométricos para predição de blends de Coffea arabica e Coffea canephora em grãos crus de café |
spellingShingle |
Aplicação da espectroscopia de infravermelho próximo associada a métodos quimiométricos para predição de blends de Coffea arabica e Coffea canephora em grãos crus de café Alvarenga, Vanessa de Grãos de café NIRS Quimiometria Análise de componentes principais Método verde Modelos preditivos Química Café Ciências Exatas e da Terra - Química Coffee beans NIRS Chemometrics Principal component analysis Green method Predictive models Chemical Coffee |
title_short |
Aplicação da espectroscopia de infravermelho próximo associada a métodos quimiométricos para predição de blends de Coffea arabica e Coffea canephora em grãos crus de café |
title_full |
Aplicação da espectroscopia de infravermelho próximo associada a métodos quimiométricos para predição de blends de Coffea arabica e Coffea canephora em grãos crus de café |
title_fullStr |
Aplicação da espectroscopia de infravermelho próximo associada a métodos quimiométricos para predição de blends de Coffea arabica e Coffea canephora em grãos crus de café |
title_full_unstemmed |
Aplicação da espectroscopia de infravermelho próximo associada a métodos quimiométricos para predição de blends de Coffea arabica e Coffea canephora em grãos crus de café |
title_sort |
Aplicação da espectroscopia de infravermelho próximo associada a métodos quimiométricos para predição de blends de Coffea arabica e Coffea canephora em grãos crus de café |
author |
Alvarenga, Vanessa de |
author_facet |
Alvarenga, Vanessa de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Nixdorf, Suzana Lucy Ferreira, Ednaldo José Sousa, Diana Nara Ribeiro De |
dc.contributor.author.fl_str_mv |
Alvarenga, Vanessa de |
dc.subject.por.fl_str_mv |
Grãos de café NIRS Quimiometria Análise de componentes principais Método verde Modelos preditivos Química Café Ciências Exatas e da Terra - Química Coffee beans NIRS Chemometrics Principal component analysis Green method Predictive models Chemical Coffee |
topic |
Grãos de café NIRS Quimiometria Análise de componentes principais Método verde Modelos preditivos Química Café Ciências Exatas e da Terra - Química Coffee beans NIRS Chemometrics Principal component analysis Green method Predictive models Chemical Coffee |
description |
O café é um dos produtos mais apreciados pela população mundial, tendo sido consumidas em 2020 e 2021, 163 milhões de sacas no mundo. Esta commodity é relevante para o Brasil, levando em conta que o País, é seu maior produtor e exportador. Das 130 espécies da planta conhecidas, apenas duas possuem relevância comercial - Coffea arabica Lineu (café arábica) e Coffea canephora Pierre (café canéfora). Essas espécies diferem entre si, nas características físicas, químicas, sensoriais e em seu valor comercial. Embora sejam distintas, sua classificação manual é demorada. Tendo em vista que a matéria-prima define a qualidade do produto, justifica-se determinar sua identidade. Portanto, este trabalho objetivou desenvolver um método rápido utilizando a espectroscopia no infravermelho próximo (NIRS), para discriminar as espécies arábica e canéfora, e criar um modelo preditivo para determinar suas proporções nos blends a partir dos grãos crus. Os espectros NIRS foram obtidos diretamente de 50 g de café beneficiado grão cru, sem passar em peneira e nem triturar, dispostos no porta amostra, e lidos em 30 s na faixa de 750 a 2500 nm. Um banco de dados foi constituído pelas análises de 66 amostras da safra 2021/22 representativas de diferentes procedências nacionais, com espectros de 38 cafés arábica (MG, SP, PR, BA) e 28 cafés canéfora (RO e ES), submetidos aos pré-processamentos de correção multiplicativa de espalhamento (MSV). Empregando-se a análise de componentes principais (PCA), as componentes PC-1 e PC-2 foram capazes de juntas explicarem 96% da variância dos dados. A análise de agrupamento hierárquico (HCA) permitiu a separação em dois grandes grupos das 2 espécies, arábica e canéfora. Os blends de 50 g foram preparados a partir de 2 amostras, classificadas com número reduzido de defeitos, nas proporções de 5, 10, 20, 30, 40 e 50% (m/m) de café canéfora em arábica. Os gráficos de scores da PCA para os blends foram capazes de explicar 98% da variância dos dados. Para criar o modelo preditivo de distinção das misturas, utilizou-se a regressão por componentes principais (PCR) e a regressão por mínimos quadrados parciais (PLSR), com validação por meio do método leave-one-out (LOO). Embora os erros quadráticos médios (RMSE) foram elevados, os coeficientes de determinação foram adequados e os modelos preditivos PCR e PLSR foram capazes de estimar os valores das proporções de canéfora em arábica em relação ao referencial nas proporções acima de 40%. O método desenvolvido mostrou-se como alternativa verde e rápida de classificação das espécies de cafés, com potencial de predição de suas proporções em misturas, que tende a uma maior robustez com o acréscimo da variabilidade amostral. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-03-27 2024-08-28T19:08:29Z 2024-08-28T19:08:29Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.uel.br/handle/123456789/17328 |
url |
https://repositorio.uel.br/handle/123456789/17328 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
CCE - Departamento de Química Programa de Pós-Graduação em Química Universidade Estadual de Londrina - UEL |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf application/pdf |
dc.coverage.none.fl_str_mv |
Londrina 84 p. |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UEL instname:Universidade Estadual de Londrina (UEL) instacron:UEL |
instname_str |
Universidade Estadual de Londrina (UEL) |
instacron_str |
UEL |
institution |
UEL |
reponame_str |
Repositório Institucional da UEL |
collection |
Repositório Institucional da UEL |
repository.name.fl_str_mv |
Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL) |
repository.mail.fl_str_mv |
bcuel@uel.br|| |
_version_ |
1809823246175961088 |