Qualidade da fibra de diferentes cultivares brasileiras de algodão e sua relação com as condições meteorológicas

Detalhes bibliográficos
Autor(a) principal: Martins, Isabella Theresa de Almeida
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/11/11152/tde-13102020-095751/
Resumo: O algodoeiro (Gossypium hirsutum L. raça latifolium Hutch) é produzido por mais de 60 países e, apesar da qualidade e multiplicidade de uso de suas sementes, é cultivado essencialmente para a produção de fibras. A qualidade da fibra pode diferir entre os diferentes ambientes de produção, sendo fator chave para determinação do preço e qualidade do algodão destinado aos produtos têxteis. Essas diferenças de qualidade estão associadas principalmente às cultivares e às condições meteorológicas, as quais influenciam os parâmetros indicativos de qualidade de fibra. O conhecimento dos fatores que condicionam a qualidade da fibra de algodão é importante para a definição das regiões com potencial para produção de fibras de qualidade superior. Dessa forma, como maneira de subsidiar a produção de fibras de algodão de melhor qualidade, os objetivos do presente estudo foram identificar e ordenar os fatores que afetam a qualidade da fibra de algodão, de acordo com sua importância, bem como o desenvolvimento de modelos matemáticos de estimação para os índices de qualidade da fibra de algodão por meio de técnicas de mineração de dados (MD). Para tanto, dados das variáveis meteorológicas e de índices de qualidade da fibra de algodão de 32 cultivares brasileiras foram submetidos à análises de correlação de Pearson (para uma abordagem geral); à análise de agrupamento (\"clusterização\"); e à três técnicas de MD (Random Forest; XGBoosting; e Support Vector Machine). Para a MD, os dados foram separados em duas partes, sendo uma para o treinamento dos algoritmos e geração dos modelos (70%) e outra para a etapa de teste dos modelos gerados (30% dos dados restantes). A análise de desempenho dos modelos foi efetuada pela comparação entre os índices de qualidade da fibra estimados pelos modelos e os índices de qualidade observados por meio da análise de regressão. O desempenho dos modelos foi avaliado considerando os seguintes índices estatísticos: coeficiente de correlação (R); coeficiente de determinação (R2); índice de Willmott (D); índice de confiança de Camargo (C); erro absoluto médio (EAM); e raiz quadrada do erro médio (RMSE). Por fim, comparou-se os resultados obtidos pelos modelos gerados com as técnicas de mineração de dados com os obtidos pelas análises de correlação e agrupamento. De modo geral, os modelos gerados por meio do emprego de técnicas de MD tiveram desempenho melhor do que as análises de correlação feitas a nível de abordagem geral e a nível de agrupamento e o melhor desempenho dos modelos foi para a elongação e o pior para o comprimento da fibra de algodão, sendo que o modelo XGB se apresentou ligeiramente melhor que o RF e o SVM foi o pior para todas as variáveis. As variáveis preditoras que foram comuns às três técnicas para os índices de qualidade da fibra avaliados variaram da seguinte foram: para o micronaire as variáveis de mais importância foram a radiação solar (Qg), o número de dias com temperatura maior ou igual a 32°C (Tmax32) e o número de dias com temperatura mínima menores ou iguais a 20°C (Tmin20); para o comprimento foram Qg, Tmin20 e velocidade do vento (U2); para a resistência foram Qg, Tmax32, Tmin 20 e temperatura mínima (Tmin); para a uniformidade foram U2, excedente hídrico (∑EXC), déficit hídrico (∑DEF)(mm), Tmin20 e precipitação pluvial (P); para a elongação foram Qg, número de dias com excedente hídrico maior do que zero (EXC0); temperatura máxima (Tmax), número de dias com temperatura menor ou igual a 18°C (Tmin18) e P; e para o índice de fibras curtas (SFI) foram umidade relativa do ar (UR); Tmax; e P.
id USP_3cca37adbbc66f37b93970d6feb415f0
oai_identifier_str oai:teses.usp.br:tde-13102020-095751
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Qualidade da fibra de diferentes cultivares brasileiras de algodão e sua relação com as condições meteorológicasFiber quality of different Brazilian cotton cultivars and their relationship with weather conditionsGossypium hirsutum L. raça latifolium HutchGossypium hirsutum L. race latifolium HutchMicronaireMicronaireRandom forestRandom forestSupport vector machineSupport vector machineXGBoostingXGBoostingO algodoeiro (Gossypium hirsutum L. raça latifolium Hutch) é produzido por mais de 60 países e, apesar da qualidade e multiplicidade de uso de suas sementes, é cultivado essencialmente para a produção de fibras. A qualidade da fibra pode diferir entre os diferentes ambientes de produção, sendo fator chave para determinação do preço e qualidade do algodão destinado aos produtos têxteis. Essas diferenças de qualidade estão associadas principalmente às cultivares e às condições meteorológicas, as quais influenciam os parâmetros indicativos de qualidade de fibra. O conhecimento dos fatores que condicionam a qualidade da fibra de algodão é importante para a definição das regiões com potencial para produção de fibras de qualidade superior. Dessa forma, como maneira de subsidiar a produção de fibras de algodão de melhor qualidade, os objetivos do presente estudo foram identificar e ordenar os fatores que afetam a qualidade da fibra de algodão, de acordo com sua importância, bem como o desenvolvimento de modelos matemáticos de estimação para os índices de qualidade da fibra de algodão por meio de técnicas de mineração de dados (MD). Para tanto, dados das variáveis meteorológicas e de índices de qualidade da fibra de algodão de 32 cultivares brasileiras foram submetidos à análises de correlação de Pearson (para uma abordagem geral); à análise de agrupamento (\"clusterização\"); e à três técnicas de MD (Random Forest; XGBoosting; e Support Vector Machine). Para a MD, os dados foram separados em duas partes, sendo uma para o treinamento dos algoritmos e geração dos modelos (70%) e outra para a etapa de teste dos modelos gerados (30% dos dados restantes). A análise de desempenho dos modelos foi efetuada pela comparação entre os índices de qualidade da fibra estimados pelos modelos e os índices de qualidade observados por meio da análise de regressão. O desempenho dos modelos foi avaliado considerando os seguintes índices estatísticos: coeficiente de correlação (R); coeficiente de determinação (R2); índice de Willmott (D); índice de confiança de Camargo (C); erro absoluto médio (EAM); e raiz quadrada do erro médio (RMSE). Por fim, comparou-se os resultados obtidos pelos modelos gerados com as técnicas de mineração de dados com os obtidos pelas análises de correlação e agrupamento. De modo geral, os modelos gerados por meio do emprego de técnicas de MD tiveram desempenho melhor do que as análises de correlação feitas a nível de abordagem geral e a nível de agrupamento e o melhor desempenho dos modelos foi para a elongação e o pior para o comprimento da fibra de algodão, sendo que o modelo XGB se apresentou ligeiramente melhor que o RF e o SVM foi o pior para todas as variáveis. As variáveis preditoras que foram comuns às três técnicas para os índices de qualidade da fibra avaliados variaram da seguinte foram: para o micronaire as variáveis de mais importância foram a radiação solar (Qg), o número de dias com temperatura maior ou igual a 32°C (Tmax32) e o número de dias com temperatura mínima menores ou iguais a 20°C (Tmin20); para o comprimento foram Qg, Tmin20 e velocidade do vento (U2); para a resistência foram Qg, Tmax32, Tmin 20 e temperatura mínima (Tmin); para a uniformidade foram U2, excedente hídrico (∑EXC), déficit hídrico (∑DEF)(mm), Tmin20 e precipitação pluvial (P); para a elongação foram Qg, número de dias com excedente hídrico maior do que zero (EXC0); temperatura máxima (Tmax), número de dias com temperatura menor ou igual a 18°C (Tmin18) e P; e para o índice de fibras curtas (SFI) foram umidade relativa do ar (UR); Tmax; e P.Cotton (Gossypium hirsutum L. race latifolium Hutch) is produced by more than 60 countries and despite the quality and multiplicity of use of its seeds, it is grown mainly to produce fibers. The quality of the fiber can differ between different production environments, being a key factor in determining the price and quality of cotton destined for textile products. These differences in quality are mainly associated with cultivars and weather conditions, which influence the indicating parameters of fiber quality. The knowledge of the factors that affect the quality of the cotton fiber is important for the definition of the regions with potential to produce that with superior quality. Thus, as a way to subsidize the production of better quality cotton fibers, the objectives of the present study were to identify and classify the factors that affect the quality of the cotton fiber, according to its importance, as well as the development of mathematical models for estimating the indices of cotton fiber quality using data mining (DM) techniques. To accomplish this, data of meteorological variables, and indices of cotton fiber quality from 32 Brazilian cultivars, were submitted to Pearson\'s correlation analysis (for a general approach); cluster analysis (\"clustering\"); and three DM techniques (Random Forest; XGBoosting; and Support Vector Machine). For DM, the data were separated in two parts, one for training the algorithms and generating the models (70%), and the other for testing the generated models (30% of the remaining data). The performance analysis of the models was achieved by comparing the fiber quality indices estimated using the models with the quality indices observed through the regression analysis. The performance of the models was evaluated considering the following statistical indices: correlation coefficient (R); determination coefficient (R2); Willmott index (D); Camargo confidence index (C); mean absolute error (MAE); and root mean square error (RMSE). Finally, the results obtained by the models generated with data mining techniques were compared with those obtained by correlation and cluster analysis. In general, the models generated using DM performed better than the correlation analyzes made using both the general approach and the grouping. The best performance of the models was for elongation and the worst for the length of the cotton fiber. In addition, the XGB model showed slightly better results than the RF model, and the SVM model presented the worst results for all indices. The predictor variables that were common to the three DM techniques for the evaluated indices of fiber quality varied as follows: for micronaire, the most important variables were solar radiation (Qg), the number of days with temperature greater than or equal to 32°C (Tmax32), and the number of days with minimum temperature less than or equal to 20°C (Tmin20); for the length of the fibers, the variables with the greatest influence were Qg, Tmin20 and wind speed (U2); for fibers resistance the most important variables were Qg, Tmax32, Tmin 20, and minimum temperature (Tmin); for uniformity of the fibers these variables were U2, water surplus (∑EXC), water deficit (∑DEF), Tmin20, and rainfall (P); for fibers elongation these variables were Qg, number of days with water surplus greater than zero (EXC0), maximum temperature (Tmax), number of days with a temperature less than or equal to 18°C (Tmin18), and P; and for short fiber index (SFI) the most influencing variables were relative humidity (UR), Tmax, and P.Biblioteca Digitais de Teses e Dissertações da USPSentelhas, Paulo CesarMartins, Isabella Theresa de Almeida2020-07-07info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/11/11152/tde-13102020-095751/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-10-13T20:46:02Zoai:teses.usp.br:tde-13102020-095751Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-10-13T20:46:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Qualidade da fibra de diferentes cultivares brasileiras de algodão e sua relação com as condições meteorológicas
Fiber quality of different Brazilian cotton cultivars and their relationship with weather conditions
title Qualidade da fibra de diferentes cultivares brasileiras de algodão e sua relação com as condições meteorológicas
spellingShingle Qualidade da fibra de diferentes cultivares brasileiras de algodão e sua relação com as condições meteorológicas
Martins, Isabella Theresa de Almeida
Gossypium hirsutum L. raça latifolium Hutch
Gossypium hirsutum L. race latifolium Hutch
Micronaire
Micronaire
Random forest
Random forest
Support vector machine
Support vector machine
XGBoosting
XGBoosting
title_short Qualidade da fibra de diferentes cultivares brasileiras de algodão e sua relação com as condições meteorológicas
title_full Qualidade da fibra de diferentes cultivares brasileiras de algodão e sua relação com as condições meteorológicas
title_fullStr Qualidade da fibra de diferentes cultivares brasileiras de algodão e sua relação com as condições meteorológicas
title_full_unstemmed Qualidade da fibra de diferentes cultivares brasileiras de algodão e sua relação com as condições meteorológicas
title_sort Qualidade da fibra de diferentes cultivares brasileiras de algodão e sua relação com as condições meteorológicas
author Martins, Isabella Theresa de Almeida
author_facet Martins, Isabella Theresa de Almeida
author_role author
dc.contributor.none.fl_str_mv Sentelhas, Paulo Cesar
dc.contributor.author.fl_str_mv Martins, Isabella Theresa de Almeida
dc.subject.por.fl_str_mv Gossypium hirsutum L. raça latifolium Hutch
Gossypium hirsutum L. race latifolium Hutch
Micronaire
Micronaire
Random forest
Random forest
Support vector machine
Support vector machine
XGBoosting
XGBoosting
topic Gossypium hirsutum L. raça latifolium Hutch
Gossypium hirsutum L. race latifolium Hutch
Micronaire
Micronaire
Random forest
Random forest
Support vector machine
Support vector machine
XGBoosting
XGBoosting
description O algodoeiro (Gossypium hirsutum L. raça latifolium Hutch) é produzido por mais de 60 países e, apesar da qualidade e multiplicidade de uso de suas sementes, é cultivado essencialmente para a produção de fibras. A qualidade da fibra pode diferir entre os diferentes ambientes de produção, sendo fator chave para determinação do preço e qualidade do algodão destinado aos produtos têxteis. Essas diferenças de qualidade estão associadas principalmente às cultivares e às condições meteorológicas, as quais influenciam os parâmetros indicativos de qualidade de fibra. O conhecimento dos fatores que condicionam a qualidade da fibra de algodão é importante para a definição das regiões com potencial para produção de fibras de qualidade superior. Dessa forma, como maneira de subsidiar a produção de fibras de algodão de melhor qualidade, os objetivos do presente estudo foram identificar e ordenar os fatores que afetam a qualidade da fibra de algodão, de acordo com sua importância, bem como o desenvolvimento de modelos matemáticos de estimação para os índices de qualidade da fibra de algodão por meio de técnicas de mineração de dados (MD). Para tanto, dados das variáveis meteorológicas e de índices de qualidade da fibra de algodão de 32 cultivares brasileiras foram submetidos à análises de correlação de Pearson (para uma abordagem geral); à análise de agrupamento (\"clusterização\"); e à três técnicas de MD (Random Forest; XGBoosting; e Support Vector Machine). Para a MD, os dados foram separados em duas partes, sendo uma para o treinamento dos algoritmos e geração dos modelos (70%) e outra para a etapa de teste dos modelos gerados (30% dos dados restantes). A análise de desempenho dos modelos foi efetuada pela comparação entre os índices de qualidade da fibra estimados pelos modelos e os índices de qualidade observados por meio da análise de regressão. O desempenho dos modelos foi avaliado considerando os seguintes índices estatísticos: coeficiente de correlação (R); coeficiente de determinação (R2); índice de Willmott (D); índice de confiança de Camargo (C); erro absoluto médio (EAM); e raiz quadrada do erro médio (RMSE). Por fim, comparou-se os resultados obtidos pelos modelos gerados com as técnicas de mineração de dados com os obtidos pelas análises de correlação e agrupamento. De modo geral, os modelos gerados por meio do emprego de técnicas de MD tiveram desempenho melhor do que as análises de correlação feitas a nível de abordagem geral e a nível de agrupamento e o melhor desempenho dos modelos foi para a elongação e o pior para o comprimento da fibra de algodão, sendo que o modelo XGB se apresentou ligeiramente melhor que o RF e o SVM foi o pior para todas as variáveis. As variáveis preditoras que foram comuns às três técnicas para os índices de qualidade da fibra avaliados variaram da seguinte foram: para o micronaire as variáveis de mais importância foram a radiação solar (Qg), o número de dias com temperatura maior ou igual a 32°C (Tmax32) e o número de dias com temperatura mínima menores ou iguais a 20°C (Tmin20); para o comprimento foram Qg, Tmin20 e velocidade do vento (U2); para a resistência foram Qg, Tmax32, Tmin 20 e temperatura mínima (Tmin); para a uniformidade foram U2, excedente hídrico (∑EXC), déficit hídrico (∑DEF)(mm), Tmin20 e precipitação pluvial (P); para a elongação foram Qg, número de dias com excedente hídrico maior do que zero (EXC0); temperatura máxima (Tmax), número de dias com temperatura menor ou igual a 18°C (Tmin18) e P; e para o índice de fibras curtas (SFI) foram umidade relativa do ar (UR); Tmax; e P.
publishDate 2020
dc.date.none.fl_str_mv 2020-07-07
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/11/11152/tde-13102020-095751/
url https://www.teses.usp.br/teses/disponiveis/11/11152/tde-13102020-095751/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090691922395136