Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo

Detalhes bibliográficos
Autor(a) principal: Carvalho, Mônica Canaan
Data de Publicação: 2022
Outros Autores: Gomide, Lucas Rezende, Scolforo, José Roberto Soares, Páscoa, Kalill José Viana da, Araújo, Laís Almeida, Lopes, Isáira Leite e
Tipo de documento: Artigo
Idioma: eng
Título da fonte: Pesquisa Agropecuária Brasileira (Online)
Texto Completo: https://seer.sct.embrapa.br/index.php/pab/article/view/27172
Resumo: O objetivo deste trabalho foi aplicar o algoritmo “random forest” (RF) à modelagem do estoque de carbono acima do solo (CAS) de uma floresta tropical, por meio da testagem de três procedimentos de seleção de variáveis: remoção recursiva e algoritmos genéticos (AGs) uniobjetivo e multiobjetivo. Os dados utilizados abrangeram 1.007 parcelas amostradas na bacia hidrográfica do Rio Grande, no estado de Minas Gerais, Brasil, e 114 variáveis ambientais (climáticas, edáficas, geográficas, de terreno e espectrais). A melhor estratégia de seleção de variáveis – a RF com AG multiobjetivo – chega ao menor erro quadrático de 17,75 Mg ha-1 com apenas quatro variáveis espectrais – índice de umidade por diferença normalizada, textura de correlação do índice de queimada por razão normalizada 2, cobertura arbórea e fluxo de calor latente –, o que representa redução de 96,5% no tamanho do banco de dados. As estratégias de seleção de variáveis ajudam a obter melhor desempenho da RF, ao melhorar a acurácia e reduzir o volume dos dados. Embora a remoção recursiva e o AG multiobjetivo mostrem desempenho semelhante como estratégias de seleção de variáveis, esta último apresenta menor subconjunto de variáveis, com maior precisão. As descobertas deste trabalho destacam a importância do uso de infravermelho próximo, comprimentos de onda curtos e índices de vegetação derivados para a estimativa de CAS baseada em sensoriamento remoto. Os produtos MODIS mostram relação significativa com o estoque de CAS e precisam ser melhor explorados pela comunidade científica para a modelagem deste estoque.
id EMBRAPA-4_426b0149bc663959ba379b0a255eff21
oai_identifier_str oai:ojs.seer.sct.embrapa.br:article/27172
network_acronym_str EMBRAPA-4
network_name_str Pesquisa Agropecuária Brasileira (Online)
repository_id_str
spelling Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do soloData mining applied to feature selection methods for aboveground carbon stock modellingmanejo florestal; algoritmo genético; floresta aleatóriaforest management; genetic algorithm; random forestO objetivo deste trabalho foi aplicar o algoritmo “random forest” (RF) à modelagem do estoque de carbono acima do solo (CAS) de uma floresta tropical, por meio da testagem de três procedimentos de seleção de variáveis: remoção recursiva e algoritmos genéticos (AGs) uniobjetivo e multiobjetivo. Os dados utilizados abrangeram 1.007 parcelas amostradas na bacia hidrográfica do Rio Grande, no estado de Minas Gerais, Brasil, e 114 variáveis ambientais (climáticas, edáficas, geográficas, de terreno e espectrais). A melhor estratégia de seleção de variáveis – a RF com AG multiobjetivo – chega ao menor erro quadrático de 17,75 Mg ha-1 com apenas quatro variáveis espectrais – índice de umidade por diferença normalizada, textura de correlação do índice de queimada por razão normalizada 2, cobertura arbórea e fluxo de calor latente –, o que representa redução de 96,5% no tamanho do banco de dados. As estratégias de seleção de variáveis ajudam a obter melhor desempenho da RF, ao melhorar a acurácia e reduzir o volume dos dados. Embora a remoção recursiva e o AG multiobjetivo mostrem desempenho semelhante como estratégias de seleção de variáveis, esta último apresenta menor subconjunto de variáveis, com maior precisão. As descobertas deste trabalho destacam a importância do uso de infravermelho próximo, comprimentos de onda curtos e índices de vegetação derivados para a estimativa de CAS baseada em sensoriamento remoto. Os produtos MODIS mostram relação significativa com o estoque de CAS e precisam ser melhor explorados pela comunidade científica para a modelagem deste estoque.The objective of this work was to apply the random forest (RF) algorithm to the modelling of the aboveground carbon (AGC) stock of a tropical forest by testing three feature selection procedures – recursive removal and the uniobjective and multiobjective genetic algorithms (GAs). The used database covered 1,007 plots sampled in the Rio Grande watershed, in the state of Minas Gerais state, Brazil, and 114 environmental variables (climatic, edaphic, geographic, terrain, and spectral). The best feature selection strategy – RF with multiobjective GA – reaches the minor root-square error of 17.75 Mg ha-1 with only four spectral variables – normalized difference moisture index, normalized burn ratio 2 correlation texture, treecover, and latent heat flux –, which represents a reduction of 96.5% in the size of the database. Feature selection strategies assist in obtaining a better RF performance, by improving the accuracy and reducing the volume of the data. Although the recursive removal and multiobjective GA showed a similar performance as feature selection strategies, the latter presents the smallest subset of variables, with the highest accuracy. The findings of this study highlight the importance of using near infrared, short wavelengths, and derived vegetation indices for the remote-sense-based estimation of AGC. The MODIS products show a significant relationship with the AGC stock and should be further explored by the scientific community for the modelling of this stock.Pesquisa Agropecuaria BrasileiraPesquisa Agropecuária BrasileiraCompanhia Energética de Minas Gerais (Cemig, Projeto Cemig GT-456)Universidade Federal de Lavras (UFLA)Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes, Código 001)Companhia Energética de Minas Gerais (CEMIG, Project CEMIG GT-456)Universidade Federal de Lavras (UFLA)Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES, Code 001)Carvalho, Mônica CanaanGomide, Lucas RezendeScolforo, José Roberto SoaresPáscoa, Kalill José Viana daAraújo, Laís AlmeidaLopes, Isáira Leite e2022-12-05info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://seer.sct.embrapa.br/index.php/pab/article/view/27172Pesquisa Agropecuaria Brasileira; V.57, Jan./Dec., 2022: Publicação contínua em volume anual; e03015Pesquisa Agropecuária Brasileira; V.57, Jan./Dec., 2022: Publicação contínua em volume anual; e030151678-39210100-104xreponame:Pesquisa Agropecuária Brasileira (Online)instname:Empresa Brasileira de Pesquisa Agropecuária (Embrapa)instacron:EMBRAPAenghttps://seer.sct.embrapa.br/index.php/pab/article/view/27172/15121Direitos autorais 2022 Pesquisa Agropecuária Brasileirainfo:eu-repo/semantics/openAccess2023-01-23T13:40:22Zoai:ojs.seer.sct.embrapa.br:article/27172Revistahttp://seer.sct.embrapa.br/index.php/pabPRIhttps://old.scielo.br/oai/scielo-oai.phppab@sct.embrapa.br || sct.pab@embrapa.br1678-39210100-204Xopendoar:2023-01-23T13:40:22Pesquisa Agropecuária Brasileira (Online) - Empresa Brasileira de Pesquisa Agropecuária (Embrapa)false
dc.title.none.fl_str_mv Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo
Data mining applied to feature selection methods for aboveground carbon stock modelling
title Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo
spellingShingle Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo
Carvalho, Mônica Canaan
manejo florestal; algoritmo genético; floresta aleatória
forest management; genetic algorithm; random forest
title_short Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo
title_full Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo
title_fullStr Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo
title_full_unstemmed Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo
title_sort Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo
author Carvalho, Mônica Canaan
author_facet Carvalho, Mônica Canaan
Gomide, Lucas Rezende
Scolforo, José Roberto Soares
Páscoa, Kalill José Viana da
Araújo, Laís Almeida
Lopes, Isáira Leite e
author_role author
author2 Gomide, Lucas Rezende
Scolforo, José Roberto Soares
Páscoa, Kalill José Viana da
Araújo, Laís Almeida
Lopes, Isáira Leite e
author2_role author
author
author
author
author
dc.contributor.none.fl_str_mv Companhia Energética de Minas Gerais (Cemig, Projeto Cemig GT-456)
Universidade Federal de Lavras (UFLA)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes, Código 001)
Companhia Energética de Minas Gerais (CEMIG, Project CEMIG GT-456)
Universidade Federal de Lavras (UFLA)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES, Code 001)
dc.contributor.author.fl_str_mv Carvalho, Mônica Canaan
Gomide, Lucas Rezende
Scolforo, José Roberto Soares
Páscoa, Kalill José Viana da
Araújo, Laís Almeida
Lopes, Isáira Leite e
dc.subject.por.fl_str_mv manejo florestal; algoritmo genético; floresta aleatória
forest management; genetic algorithm; random forest
topic manejo florestal; algoritmo genético; floresta aleatória
forest management; genetic algorithm; random forest
description O objetivo deste trabalho foi aplicar o algoritmo “random forest” (RF) à modelagem do estoque de carbono acima do solo (CAS) de uma floresta tropical, por meio da testagem de três procedimentos de seleção de variáveis: remoção recursiva e algoritmos genéticos (AGs) uniobjetivo e multiobjetivo. Os dados utilizados abrangeram 1.007 parcelas amostradas na bacia hidrográfica do Rio Grande, no estado de Minas Gerais, Brasil, e 114 variáveis ambientais (climáticas, edáficas, geográficas, de terreno e espectrais). A melhor estratégia de seleção de variáveis – a RF com AG multiobjetivo – chega ao menor erro quadrático de 17,75 Mg ha-1 com apenas quatro variáveis espectrais – índice de umidade por diferença normalizada, textura de correlação do índice de queimada por razão normalizada 2, cobertura arbórea e fluxo de calor latente –, o que representa redução de 96,5% no tamanho do banco de dados. As estratégias de seleção de variáveis ajudam a obter melhor desempenho da RF, ao melhorar a acurácia e reduzir o volume dos dados. Embora a remoção recursiva e o AG multiobjetivo mostrem desempenho semelhante como estratégias de seleção de variáveis, esta último apresenta menor subconjunto de variáveis, com maior precisão. As descobertas deste trabalho destacam a importância do uso de infravermelho próximo, comprimentos de onda curtos e índices de vegetação derivados para a estimativa de CAS baseada em sensoriamento remoto. Os produtos MODIS mostram relação significativa com o estoque de CAS e precisam ser melhor explorados pela comunidade científica para a modelagem deste estoque.
publishDate 2022
dc.date.none.fl_str_mv 2022-12-05
dc.type.none.fl_str_mv
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://seer.sct.embrapa.br/index.php/pab/article/view/27172
url https://seer.sct.embrapa.br/index.php/pab/article/view/27172
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv https://seer.sct.embrapa.br/index.php/pab/article/view/27172/15121
dc.rights.driver.fl_str_mv Direitos autorais 2022 Pesquisa Agropecuária Brasileira
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Direitos autorais 2022 Pesquisa Agropecuária Brasileira
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pesquisa Agropecuaria Brasileira
Pesquisa Agropecuária Brasileira
publisher.none.fl_str_mv Pesquisa Agropecuaria Brasileira
Pesquisa Agropecuária Brasileira
dc.source.none.fl_str_mv Pesquisa Agropecuaria Brasileira; V.57, Jan./Dec., 2022: Publicação contínua em volume anual; e03015
Pesquisa Agropecuária Brasileira; V.57, Jan./Dec., 2022: Publicação contínua em volume anual; e03015
1678-3921
0100-104x
reponame:Pesquisa Agropecuária Brasileira (Online)
instname:Empresa Brasileira de Pesquisa Agropecuária (Embrapa)
instacron:EMBRAPA
instname_str Empresa Brasileira de Pesquisa Agropecuária (Embrapa)
instacron_str EMBRAPA
institution EMBRAPA
reponame_str Pesquisa Agropecuária Brasileira (Online)
collection Pesquisa Agropecuária Brasileira (Online)
repository.name.fl_str_mv Pesquisa Agropecuária Brasileira (Online) - Empresa Brasileira de Pesquisa Agropecuária (Embrapa)
repository.mail.fl_str_mv pab@sct.embrapa.br || sct.pab@embrapa.br
_version_ 1793416662964240384