Classificação baseada em regras para estudo da produtividade do algodão no estado do Mato Grosso

Detalhes bibliográficos
Autor(a) principal: Silva, Alexandra Virginia Valente da
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: http://www.teses.usp.br/teses/disponiveis/55/55137/tde-23082019-165350/
Resumo: O Brasil tem grande experiência no desenvolvimento de tecnologias para a cadeia produtiva do algodão, sendo um player mundial importante nesse segmento atualmente. O avanço da cotonicultura no Cerrado brasileiro impulsionou e viabilizou uma produção altamente tecnificada, eficiente e lucrativa, elevando o país da condição de importador de fibra de algodão na década de 70 a um dos principais exportadores atualmente. Embora a cadeia do algodão tenha atingido um alto nível tecnológico, há ainda muitos desafios e problemas a serem vencidos, uma vez que nos últimos anos tem-se verificado uma estagnação na produtividade, apesar do aporte cada vez maior de tecnologias como cultivares transgênicas, máquinas, insumos e gestão de dados mais eficientes. Nesse contexto as técnicas de mineração de dados oferecem excelente oportunidade de se avaliar esse problema, uma vez os dados desse setor são bem organizados, como é o caso do Banco de Dados organizado pelo Instituto Matogrossense do Algodão (IMAmt) e que foi disponibilizado para esse estudo. Problema: O problema alvo desse trabalho é entender as causas da estagnação da produtividade do algodoeiro, os seja, dos fatores que estão influenciando negativamente na produção de algodão no cerrado no estado de Mato Grosso. Solução: A solução proposta é se utilizar técnicas de mineração de dados em um BD complexo, contendo informações da produtividade e fatores do sistema de produção que influenciam na produção, para a extração de conhecimento e geração de recomendações para os cotonicultores do Estado. Objetivo: Aplicar técnicas de Mineração de Dados, mais especificamente classificação baseada em regras em um BD de produção de algodão no estado de Mato Grosso para identificar os principais fatores, como as práticas de manejo, as variáveis do solo e a incidência de doenças, que estão afetando a produtividade do algodão e consequentemente limitando o aumento da produtividade. Estado-da-arte e Método proposto: Diferentemente de outros trabalhos baseados em classificação de regras de associação que tem foco no resultado preditivo (acurácia), nesse trabalho a ênfase é da extração de regras de associação que tenham relevância prática e que possam auxiliar o agricultor na tomada de decisão. Na etapa de pré-processamento realizou-se a seleção e transformação de atributos e identificação de outliers. Os atributos numéricos foram discretizados utilizando 4 métodos, sendo 3 automáticos (técnica de Kononenko, Better Encoding e a combinação das duas) e um manual. Na etapa de modelagem de classificação, os algoritmos de regras utilizados foram o PART e o JRip e a conversão binária de atributos foi também avaliada. O desempenho foi avaliado pela precisão, revocação, custo e a combinação delas no índice IFC (100*F/Log2 custo). Resultados: A avaliação das métricas indicou o melhor desempenho para o classificador PART, com a discretização pela técnica de Kononenko combinada com Better Encoding, seguida pela conversão binária. A análise das regras, com auxílio de especialistas da área, possibilitou a seleção daquelas mais relevantes e dos atributos que mais impactam na produtividade. Dentre esses atributos, destacam-se: a cultivar de algodão, o tempo da abertura e de início do cultivo de algodão na área, o sistema de plantio e de preparo do solo. Os principais atributos físico-químicos do solo foram os micronutrientes zinco, ferro e boro e os macronutrientes cálcio e magnésio e a resistência do solo à penetração. A ausência do fungo fusarium impactou positivamente na produtividade. Em geral, os atributos relacionados ao Manejo do algodoeiro apresentaram maior relevância na composição das regras de classificação, seguidos dos atributos Químicos e Físicos do Solo e dos atributos relacionados à doenças.
id USP_6ea49754472b63031fa8ef34ec168a6a
oai_identifier_str oai:teses.usp.br:tde-23082019-165350
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Classificação baseada em regras para estudo da produtividade do algodão no estado do Mato GrossoClassification based on rules for the study of cotton productivity in the Mato Grosso StateClassificação baseada em regrasClassification based on rulesCotton productivityData miningMineração de dadosProdutividade do algodãoO Brasil tem grande experiência no desenvolvimento de tecnologias para a cadeia produtiva do algodão, sendo um player mundial importante nesse segmento atualmente. O avanço da cotonicultura no Cerrado brasileiro impulsionou e viabilizou uma produção altamente tecnificada, eficiente e lucrativa, elevando o país da condição de importador de fibra de algodão na década de 70 a um dos principais exportadores atualmente. Embora a cadeia do algodão tenha atingido um alto nível tecnológico, há ainda muitos desafios e problemas a serem vencidos, uma vez que nos últimos anos tem-se verificado uma estagnação na produtividade, apesar do aporte cada vez maior de tecnologias como cultivares transgênicas, máquinas, insumos e gestão de dados mais eficientes. Nesse contexto as técnicas de mineração de dados oferecem excelente oportunidade de se avaliar esse problema, uma vez os dados desse setor são bem organizados, como é o caso do Banco de Dados organizado pelo Instituto Matogrossense do Algodão (IMAmt) e que foi disponibilizado para esse estudo. Problema: O problema alvo desse trabalho é entender as causas da estagnação da produtividade do algodoeiro, os seja, dos fatores que estão influenciando negativamente na produção de algodão no cerrado no estado de Mato Grosso. Solução: A solução proposta é se utilizar técnicas de mineração de dados em um BD complexo, contendo informações da produtividade e fatores do sistema de produção que influenciam na produção, para a extração de conhecimento e geração de recomendações para os cotonicultores do Estado. Objetivo: Aplicar técnicas de Mineração de Dados, mais especificamente classificação baseada em regras em um BD de produção de algodão no estado de Mato Grosso para identificar os principais fatores, como as práticas de manejo, as variáveis do solo e a incidência de doenças, que estão afetando a produtividade do algodão e consequentemente limitando o aumento da produtividade. Estado-da-arte e Método proposto: Diferentemente de outros trabalhos baseados em classificação de regras de associação que tem foco no resultado preditivo (acurácia), nesse trabalho a ênfase é da extração de regras de associação que tenham relevância prática e que possam auxiliar o agricultor na tomada de decisão. Na etapa de pré-processamento realizou-se a seleção e transformação de atributos e identificação de outliers. Os atributos numéricos foram discretizados utilizando 4 métodos, sendo 3 automáticos (técnica de Kononenko, Better Encoding e a combinação das duas) e um manual. Na etapa de modelagem de classificação, os algoritmos de regras utilizados foram o PART e o JRip e a conversão binária de atributos foi também avaliada. O desempenho foi avaliado pela precisão, revocação, custo e a combinação delas no índice IFC (100*F/Log2 custo). Resultados: A avaliação das métricas indicou o melhor desempenho para o classificador PART, com a discretização pela técnica de Kononenko combinada com Better Encoding, seguida pela conversão binária. A análise das regras, com auxílio de especialistas da área, possibilitou a seleção daquelas mais relevantes e dos atributos que mais impactam na produtividade. Dentre esses atributos, destacam-se: a cultivar de algodão, o tempo da abertura e de início do cultivo de algodão na área, o sistema de plantio e de preparo do solo. Os principais atributos físico-químicos do solo foram os micronutrientes zinco, ferro e boro e os macronutrientes cálcio e magnésio e a resistência do solo à penetração. A ausência do fungo fusarium impactou positivamente na produtividade. Em geral, os atributos relacionados ao Manejo do algodoeiro apresentaram maior relevância na composição das regras de classificação, seguidos dos atributos Químicos e Físicos do Solo e dos atributos relacionados à doenças.Brazil has great experience in developing technologies for the cotton sector, becoming an important world player presently. The cotton production has spread in the Brazilian cerrado stimulating and making viable a highly technical, efficient and profitable production, and leading the country from a condition of importer to a major exporter, currently. Although the cotton productive chain has reached a high technological level, there are many challenges and problems to be overcome, since the productivity is stagnant despite the use of more efficient transgenic cultivars, machines, agrochemicals and data management. In this context data mining offers excellent opportunities to evaluate this problem, since data in this sector is very well organized, as is the case of the Data Base (DB) of the Mato Grosso Cotton Institute, which is available for this study. Problem: The target problem of this study is to understand the causes of such productivity stagnation, that is, the factors influencing negatively the Mato Grosso cerrado cotton production. Solution: The proposed solution is to apply data mining to a complex DB, having productivity information and the factors that influences production, for extracting knowledge and generate recommendations for the cotton farmers in the State. Purpose: Apply data mining technique, more specifically the classification based on rules, in a DB of cotton production in the State of Mato Grosso to identify the main factors, as management practices, soil variables and diseases that are affecting cotton productivity and limiting the productivity increasing. State-of-Art and Proposed Method: Unlike other works based in classification based on rules with focus in prediction (accuracy) this work has emphasis in association rules with practical relevance to help farmers in decision-making. In the pre-processing step, it was performed selection, transformation and outliers identification. Numerical attributes were discretized using 4 methods, 3 automatic (techniques of Kononenko, Better Encoding and the combination of both) and one manual. In the classification step, the rule algorithms used were PART and JRip and binary split was also evaluated. The performance was evaluated by precision, recall, cost and the combination of them in an index called IFC (100*F/Log2 cost). Results: The evaluation of these metrics has indicated the best performance for the classifier PART, with discretization by the technique of Kononenko combined wit Better Encoding, and using binary split. The rules were analyzed with the aid of specialists for the selection of the most relevant ones and select the attributes that mostly impact the productivity. Among these attributes are: the cotton cultivar, time of opening the area and beginning of cotton cultivation, soil and growing system used. The main soil physico-chemical attributes were the micronutrients zinc, iron, bore, the macronutrients calcium and magnesium, and soil penetration resistance. The absence of the fungi fusarium has impacted positively in productivity. In general, attributes related to cotton management were more relevant in the classification rules composition, followed by soil Chemical and Physical attributes and lastly the ones related to diseases.Biblioteca Digitais de Teses e Dissertações da USPVaz, Carlos Manoel PedroSilva, Alexandra Virginia Valente da2019-04-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/55/55137/tde-23082019-165350/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2019-11-08T23:48:36Zoai:teses.usp.br:tde-23082019-165350Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212019-11-08T23:48:36Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Classificação baseada em regras para estudo da produtividade do algodão no estado do Mato Grosso
Classification based on rules for the study of cotton productivity in the Mato Grosso State
title Classificação baseada em regras para estudo da produtividade do algodão no estado do Mato Grosso
spellingShingle Classificação baseada em regras para estudo da produtividade do algodão no estado do Mato Grosso
Silva, Alexandra Virginia Valente da
Classificação baseada em regras
Classification based on rules
Cotton productivity
Data mining
Mineração de dados
Produtividade do algodão
title_short Classificação baseada em regras para estudo da produtividade do algodão no estado do Mato Grosso
title_full Classificação baseada em regras para estudo da produtividade do algodão no estado do Mato Grosso
title_fullStr Classificação baseada em regras para estudo da produtividade do algodão no estado do Mato Grosso
title_full_unstemmed Classificação baseada em regras para estudo da produtividade do algodão no estado do Mato Grosso
title_sort Classificação baseada em regras para estudo da produtividade do algodão no estado do Mato Grosso
author Silva, Alexandra Virginia Valente da
author_facet Silva, Alexandra Virginia Valente da
author_role author
dc.contributor.none.fl_str_mv Vaz, Carlos Manoel Pedro
dc.contributor.author.fl_str_mv Silva, Alexandra Virginia Valente da
dc.subject.por.fl_str_mv Classificação baseada em regras
Classification based on rules
Cotton productivity
Data mining
Mineração de dados
Produtividade do algodão
topic Classificação baseada em regras
Classification based on rules
Cotton productivity
Data mining
Mineração de dados
Produtividade do algodão
description O Brasil tem grande experiência no desenvolvimento de tecnologias para a cadeia produtiva do algodão, sendo um player mundial importante nesse segmento atualmente. O avanço da cotonicultura no Cerrado brasileiro impulsionou e viabilizou uma produção altamente tecnificada, eficiente e lucrativa, elevando o país da condição de importador de fibra de algodão na década de 70 a um dos principais exportadores atualmente. Embora a cadeia do algodão tenha atingido um alto nível tecnológico, há ainda muitos desafios e problemas a serem vencidos, uma vez que nos últimos anos tem-se verificado uma estagnação na produtividade, apesar do aporte cada vez maior de tecnologias como cultivares transgênicas, máquinas, insumos e gestão de dados mais eficientes. Nesse contexto as técnicas de mineração de dados oferecem excelente oportunidade de se avaliar esse problema, uma vez os dados desse setor são bem organizados, como é o caso do Banco de Dados organizado pelo Instituto Matogrossense do Algodão (IMAmt) e que foi disponibilizado para esse estudo. Problema: O problema alvo desse trabalho é entender as causas da estagnação da produtividade do algodoeiro, os seja, dos fatores que estão influenciando negativamente na produção de algodão no cerrado no estado de Mato Grosso. Solução: A solução proposta é se utilizar técnicas de mineração de dados em um BD complexo, contendo informações da produtividade e fatores do sistema de produção que influenciam na produção, para a extração de conhecimento e geração de recomendações para os cotonicultores do Estado. Objetivo: Aplicar técnicas de Mineração de Dados, mais especificamente classificação baseada em regras em um BD de produção de algodão no estado de Mato Grosso para identificar os principais fatores, como as práticas de manejo, as variáveis do solo e a incidência de doenças, que estão afetando a produtividade do algodão e consequentemente limitando o aumento da produtividade. Estado-da-arte e Método proposto: Diferentemente de outros trabalhos baseados em classificação de regras de associação que tem foco no resultado preditivo (acurácia), nesse trabalho a ênfase é da extração de regras de associação que tenham relevância prática e que possam auxiliar o agricultor na tomada de decisão. Na etapa de pré-processamento realizou-se a seleção e transformação de atributos e identificação de outliers. Os atributos numéricos foram discretizados utilizando 4 métodos, sendo 3 automáticos (técnica de Kononenko, Better Encoding e a combinação das duas) e um manual. Na etapa de modelagem de classificação, os algoritmos de regras utilizados foram o PART e o JRip e a conversão binária de atributos foi também avaliada. O desempenho foi avaliado pela precisão, revocação, custo e a combinação delas no índice IFC (100*F/Log2 custo). Resultados: A avaliação das métricas indicou o melhor desempenho para o classificador PART, com a discretização pela técnica de Kononenko combinada com Better Encoding, seguida pela conversão binária. A análise das regras, com auxílio de especialistas da área, possibilitou a seleção daquelas mais relevantes e dos atributos que mais impactam na produtividade. Dentre esses atributos, destacam-se: a cultivar de algodão, o tempo da abertura e de início do cultivo de algodão na área, o sistema de plantio e de preparo do solo. Os principais atributos físico-químicos do solo foram os micronutrientes zinco, ferro e boro e os macronutrientes cálcio e magnésio e a resistência do solo à penetração. A ausência do fungo fusarium impactou positivamente na produtividade. Em geral, os atributos relacionados ao Manejo do algodoeiro apresentaram maior relevância na composição das regras de classificação, seguidos dos atributos Químicos e Físicos do Solo e dos atributos relacionados à doenças.
publishDate 2019
dc.date.none.fl_str_mv 2019-04-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/55/55137/tde-23082019-165350/
url http://www.teses.usp.br/teses/disponiveis/55/55137/tde-23082019-165350/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809091021069352960