Modelagem da produtividade de cana-de-açúcar a partir de algoritmos de aprendizado de máquina
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UNESP |
Texto Completo: | http://hdl.handle.net/11449/250534 |
Resumo: | A cana-de-açúcar é uma das culturas de maior interesse do mercado agrícola brasileiro. Algoritmos de aprendizado de máquina têm sido cada vez mais empregados para modelagens agronômicas e podem fornecer informações que contribuam para melhorar o planejamento, gestão e, consequentemente, aumentar a produção agrícola. Dessa forma, o objetivo foi criar modelos estatísticos por meio de técnicas de aprendizado de máquina, incluindo as estratégias de aplicação, para a previsão da produção da cana-de-açúcar em toneladas de cana por hectare (TCH) no Estado de São Paulo. Os dados experimentais foram coletados nos anos de 2016, 2017 e 2018, sendo provenientes de duas unidades produtivas, localizadas nas intermediações dos municípios de Potirendaba e Catanduva, SP. Foram utilizadas 20, 12 e 10 mil observações para os anos de 2016, 2017 e 2018, respectivamente. Os dados foram padronizados com o objetivo de identificar os atributos do solo e manejos específicos, que são variáveis independentes e, que melhor explicam a variabilidade espaço temporal do rendimento da cana-de-açúcar em toneladas de cana por hectare (TCH). As modelagens foram realizadas por meio do modelo de árvores de decisão e Random forest. O algoritmo Random forest apresentou melhor desempenho preditivo para a cultura de cana-de-açúcar quando comparado ao modelo de árvore de decisão. Em termos numéricos, para o Random forest, obteve-se R2 superior à 56% e RMSE inferior a 18,2 t ha-1, enquanto que para a árvore de decisão, o R2 obtido foi superior à 43% e RMSE inferior à 23,4 t ha-1. As variáveis foram avaliadas quanto ao nível de importância entre elas na produção de cana-de-açúcar. A variável corte apresentou maior nível de importância na predição da cultura, no mínimo 3,5 vezes superior, em relação às outras variáveis de manejo subsequentes como variedade, idade e mês. Além disso, o açúcar total recuperável (ATR), bem como os níveis de potássio (K+), fósforo disponível (P) e matéria orgânica do solo (MOS), também se apresentaram inferiores à nível de importância para a predição em relação às demais variáveis. |
id |
UNSP_061be2136ad4945fdf9c0956b150f7bc |
---|---|
oai_identifier_str |
oai:repositorio.unesp.br:11449/250534 |
network_acronym_str |
UNSP |
network_name_str |
Repositório Institucional da UNESP |
repository_id_str |
2946 |
spelling |
Modelagem da produtividade de cana-de-açúcar a partir de algoritmos de aprendizado de máquinaModeling sugarcane productivity using machine learningCana-de-açúcarMétodo da árvore de decisãoInteligência artificialA cana-de-açúcar é uma das culturas de maior interesse do mercado agrícola brasileiro. Algoritmos de aprendizado de máquina têm sido cada vez mais empregados para modelagens agronômicas e podem fornecer informações que contribuam para melhorar o planejamento, gestão e, consequentemente, aumentar a produção agrícola. Dessa forma, o objetivo foi criar modelos estatísticos por meio de técnicas de aprendizado de máquina, incluindo as estratégias de aplicação, para a previsão da produção da cana-de-açúcar em toneladas de cana por hectare (TCH) no Estado de São Paulo. Os dados experimentais foram coletados nos anos de 2016, 2017 e 2018, sendo provenientes de duas unidades produtivas, localizadas nas intermediações dos municípios de Potirendaba e Catanduva, SP. Foram utilizadas 20, 12 e 10 mil observações para os anos de 2016, 2017 e 2018, respectivamente. Os dados foram padronizados com o objetivo de identificar os atributos do solo e manejos específicos, que são variáveis independentes e, que melhor explicam a variabilidade espaço temporal do rendimento da cana-de-açúcar em toneladas de cana por hectare (TCH). As modelagens foram realizadas por meio do modelo de árvores de decisão e Random forest. O algoritmo Random forest apresentou melhor desempenho preditivo para a cultura de cana-de-açúcar quando comparado ao modelo de árvore de decisão. Em termos numéricos, para o Random forest, obteve-se R2 superior à 56% e RMSE inferior a 18,2 t ha-1, enquanto que para a árvore de decisão, o R2 obtido foi superior à 43% e RMSE inferior à 23,4 t ha-1. As variáveis foram avaliadas quanto ao nível de importância entre elas na produção de cana-de-açúcar. A variável corte apresentou maior nível de importância na predição da cultura, no mínimo 3,5 vezes superior, em relação às outras variáveis de manejo subsequentes como variedade, idade e mês. Além disso, o açúcar total recuperável (ATR), bem como os níveis de potássio (K+), fósforo disponível (P) e matéria orgânica do solo (MOS), também se apresentaram inferiores à nível de importância para a predição em relação às demais variáveis.Sugarcane is one of the crops of most interest to the Brazilian agricultural market. Machine learning algorithms have been increasingly used for agronomic modeling and can provide information to help improve planning and management and, consequently, increase agricultural production. Therefore, the objective was to create statistical models using machine learning techniques, including application strategies, to estimate sugarcane production in tons of cane per hectare (TCH) in the state of São Paulo. The experimental data was collected in 2016, 2017 and 2018 from two production units located in the middle of the municipalities of Potirendaba and Catanduva, SP. The study used 20,000, 12,000 and 10,000 observations for 2016, 2017 and 2018, respectively. The data was standardized in order to identify the soil attributes and specific managements that are independent variables and that best explain the spatiotemporal variability of sugarcane yields in tons of cane per hectare (TCH). The modeling was conducted using decision trees and Random forest. The Random forest algorithm showed better predictive performance for the sugarcane crop when compared to the decision tree model. In numerical terms, the Random forest obtained an R2 of more than 56% and an RMSE of less than 18.2 t ha-1, while the decision tree obtained an R2 of more than 43% and an RMSE of less than 23.4 t ha-1. The variables were evaluated according to their level of importance in sugarcane production. The variable cut showed the highest level of importance in predicting the crop, at least 3.5 times higher than the other subsequent management variables such as variety, age and month. In addition, the total recoverable sugar (ATR), as well as the levels of potassium (K+), available phosphorus (P) and soil organic matter (MOS), were also lower in terms of importance for prediction than the other variables.Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)CNPq: 2516Universidade Estadual Paulista (Unesp)Panosso, Alan RodrigoUniversidade Estadual Paulista (Unesp)Gonçalves, Lucas de Oliveira2023-08-30T17:56:48Z2023-08-30T17:56:48Z2023-08-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://hdl.handle.net/11449/250534porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-01-26T06:29:05Zoai:repositorio.unesp.br:11449/250534Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-06T00:00:26.844759Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false |
dc.title.none.fl_str_mv |
Modelagem da produtividade de cana-de-açúcar a partir de algoritmos de aprendizado de máquina Modeling sugarcane productivity using machine learning |
title |
Modelagem da produtividade de cana-de-açúcar a partir de algoritmos de aprendizado de máquina |
spellingShingle |
Modelagem da produtividade de cana-de-açúcar a partir de algoritmos de aprendizado de máquina Gonçalves, Lucas de Oliveira Cana-de-açúcar Método da árvore de decisão Inteligência artificial |
title_short |
Modelagem da produtividade de cana-de-açúcar a partir de algoritmos de aprendizado de máquina |
title_full |
Modelagem da produtividade de cana-de-açúcar a partir de algoritmos de aprendizado de máquina |
title_fullStr |
Modelagem da produtividade de cana-de-açúcar a partir de algoritmos de aprendizado de máquina |
title_full_unstemmed |
Modelagem da produtividade de cana-de-açúcar a partir de algoritmos de aprendizado de máquina |
title_sort |
Modelagem da produtividade de cana-de-açúcar a partir de algoritmos de aprendizado de máquina |
author |
Gonçalves, Lucas de Oliveira |
author_facet |
Gonçalves, Lucas de Oliveira |
author_role |
author |
dc.contributor.none.fl_str_mv |
Panosso, Alan Rodrigo Universidade Estadual Paulista (Unesp) |
dc.contributor.author.fl_str_mv |
Gonçalves, Lucas de Oliveira |
dc.subject.por.fl_str_mv |
Cana-de-açúcar Método da árvore de decisão Inteligência artificial |
topic |
Cana-de-açúcar Método da árvore de decisão Inteligência artificial |
description |
A cana-de-açúcar é uma das culturas de maior interesse do mercado agrícola brasileiro. Algoritmos de aprendizado de máquina têm sido cada vez mais empregados para modelagens agronômicas e podem fornecer informações que contribuam para melhorar o planejamento, gestão e, consequentemente, aumentar a produção agrícola. Dessa forma, o objetivo foi criar modelos estatísticos por meio de técnicas de aprendizado de máquina, incluindo as estratégias de aplicação, para a previsão da produção da cana-de-açúcar em toneladas de cana por hectare (TCH) no Estado de São Paulo. Os dados experimentais foram coletados nos anos de 2016, 2017 e 2018, sendo provenientes de duas unidades produtivas, localizadas nas intermediações dos municípios de Potirendaba e Catanduva, SP. Foram utilizadas 20, 12 e 10 mil observações para os anos de 2016, 2017 e 2018, respectivamente. Os dados foram padronizados com o objetivo de identificar os atributos do solo e manejos específicos, que são variáveis independentes e, que melhor explicam a variabilidade espaço temporal do rendimento da cana-de-açúcar em toneladas de cana por hectare (TCH). As modelagens foram realizadas por meio do modelo de árvores de decisão e Random forest. O algoritmo Random forest apresentou melhor desempenho preditivo para a cultura de cana-de-açúcar quando comparado ao modelo de árvore de decisão. Em termos numéricos, para o Random forest, obteve-se R2 superior à 56% e RMSE inferior a 18,2 t ha-1, enquanto que para a árvore de decisão, o R2 obtido foi superior à 43% e RMSE inferior à 23,4 t ha-1. As variáveis foram avaliadas quanto ao nível de importância entre elas na produção de cana-de-açúcar. A variável corte apresentou maior nível de importância na predição da cultura, no mínimo 3,5 vezes superior, em relação às outras variáveis de manejo subsequentes como variedade, idade e mês. Além disso, o açúcar total recuperável (ATR), bem como os níveis de potássio (K+), fósforo disponível (P) e matéria orgânica do solo (MOS), também se apresentaram inferiores à nível de importância para a predição em relação às demais variáveis. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-08-30T17:56:48Z 2023-08-30T17:56:48Z 2023-08-03 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11449/250534 |
url |
http://hdl.handle.net/11449/250534 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista (UNESP) instacron:UNESP |
instname_str |
Universidade Estadual Paulista (UNESP) |
instacron_str |
UNESP |
institution |
UNESP |
reponame_str |
Repositório Institucional da UNESP |
collection |
Repositório Institucional da UNESP |
repository.name.fl_str_mv |
Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP) |
repository.mail.fl_str_mv |
|
_version_ |
1808129571583688704 |