Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Outros Autores: | , , , , |
Tipo de documento: | Artigo |
Idioma: | eng |
Título da fonte: | Pesquisa Agropecuária Brasileira (Online) |
Texto Completo: | https://seer.sct.embrapa.br/index.php/pab/article/view/27172 |
Resumo: | O objetivo deste trabalho foi aplicar o algoritmo “random forest” (RF) à modelagem do estoque de carbono acima do solo (CAS) de uma floresta tropical, por meio da testagem de três procedimentos de seleção de variáveis: remoção recursiva e algoritmos genéticos (AGs) uniobjetivo e multiobjetivo. Os dados utilizados abrangeram 1.007 parcelas amostradas na bacia hidrográfica do Rio Grande, no estado de Minas Gerais, Brasil, e 114 variáveis ambientais (climáticas, edáficas, geográficas, de terreno e espectrais). A melhor estratégia de seleção de variáveis – a RF com AG multiobjetivo – chega ao menor erro quadrático de 17,75 Mg ha-1 com apenas quatro variáveis espectrais – índice de umidade por diferença normalizada, textura de correlação do índice de queimada por razão normalizada 2, cobertura arbórea e fluxo de calor latente –, o que representa redução de 96,5% no tamanho do banco de dados. As estratégias de seleção de variáveis ajudam a obter melhor desempenho da RF, ao melhorar a acurácia e reduzir o volume dos dados. Embora a remoção recursiva e o AG multiobjetivo mostrem desempenho semelhante como estratégias de seleção de variáveis, esta último apresenta menor subconjunto de variáveis, com maior precisão. As descobertas deste trabalho destacam a importância do uso de infravermelho próximo, comprimentos de onda curtos e índices de vegetação derivados para a estimativa de CAS baseada em sensoriamento remoto. Os produtos MODIS mostram relação significativa com o estoque de CAS e precisam ser melhor explorados pela comunidade científica para a modelagem deste estoque. |
id |
EMBRAPA-4_426b0149bc663959ba379b0a255eff21 |
---|---|
oai_identifier_str |
oai:ojs.seer.sct.embrapa.br:article/27172 |
network_acronym_str |
EMBRAPA-4 |
network_name_str |
Pesquisa Agropecuária Brasileira (Online) |
repository_id_str |
|
spelling |
Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do soloData mining applied to feature selection methods for aboveground carbon stock modellingmanejo florestal; algoritmo genético; floresta aleatóriaforest management; genetic algorithm; random forestO objetivo deste trabalho foi aplicar o algoritmo “random forest” (RF) à modelagem do estoque de carbono acima do solo (CAS) de uma floresta tropical, por meio da testagem de três procedimentos de seleção de variáveis: remoção recursiva e algoritmos genéticos (AGs) uniobjetivo e multiobjetivo. Os dados utilizados abrangeram 1.007 parcelas amostradas na bacia hidrográfica do Rio Grande, no estado de Minas Gerais, Brasil, e 114 variáveis ambientais (climáticas, edáficas, geográficas, de terreno e espectrais). A melhor estratégia de seleção de variáveis – a RF com AG multiobjetivo – chega ao menor erro quadrático de 17,75 Mg ha-1 com apenas quatro variáveis espectrais – índice de umidade por diferença normalizada, textura de correlação do índice de queimada por razão normalizada 2, cobertura arbórea e fluxo de calor latente –, o que representa redução de 96,5% no tamanho do banco de dados. As estratégias de seleção de variáveis ajudam a obter melhor desempenho da RF, ao melhorar a acurácia e reduzir o volume dos dados. Embora a remoção recursiva e o AG multiobjetivo mostrem desempenho semelhante como estratégias de seleção de variáveis, esta último apresenta menor subconjunto de variáveis, com maior precisão. As descobertas deste trabalho destacam a importância do uso de infravermelho próximo, comprimentos de onda curtos e índices de vegetação derivados para a estimativa de CAS baseada em sensoriamento remoto. Os produtos MODIS mostram relação significativa com o estoque de CAS e precisam ser melhor explorados pela comunidade científica para a modelagem deste estoque.The objective of this work was to apply the random forest (RF) algorithm to the modelling of the aboveground carbon (AGC) stock of a tropical forest by testing three feature selection procedures – recursive removal and the uniobjective and multiobjective genetic algorithms (GAs). The used database covered 1,007 plots sampled in the Rio Grande watershed, in the state of Minas Gerais state, Brazil, and 114 environmental variables (climatic, edaphic, geographic, terrain, and spectral). The best feature selection strategy – RF with multiobjective GA – reaches the minor root-square error of 17.75 Mg ha-1 with only four spectral variables – normalized difference moisture index, normalized burn ratio 2 correlation texture, treecover, and latent heat flux –, which represents a reduction of 96.5% in the size of the database. Feature selection strategies assist in obtaining a better RF performance, by improving the accuracy and reducing the volume of the data. Although the recursive removal and multiobjective GA showed a similar performance as feature selection strategies, the latter presents the smallest subset of variables, with the highest accuracy. The findings of this study highlight the importance of using near infrared, short wavelengths, and derived vegetation indices for the remote-sense-based estimation of AGC. The MODIS products show a significant relationship with the AGC stock and should be further explored by the scientific community for the modelling of this stock.Pesquisa Agropecuaria BrasileiraPesquisa Agropecuária BrasileiraCompanhia Energética de Minas Gerais (Cemig, Projeto Cemig GT-456)Universidade Federal de Lavras (UFLA)Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes, Código 001)Companhia Energética de Minas Gerais (CEMIG, Project CEMIG GT-456)Universidade Federal de Lavras (UFLA)Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES, Code 001)Carvalho, Mônica CanaanGomide, Lucas RezendeScolforo, José Roberto SoaresPáscoa, Kalill José Viana daAraújo, Laís AlmeidaLopes, Isáira Leite e2022-12-05info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://seer.sct.embrapa.br/index.php/pab/article/view/27172Pesquisa Agropecuaria Brasileira; V.57, Jan./Dec., 2022: Publicação contínua em volume anual; e03015Pesquisa Agropecuária Brasileira; V.57, Jan./Dec., 2022: Publicação contínua em volume anual; e030151678-39210100-104xreponame:Pesquisa Agropecuária Brasileira (Online)instname:Empresa Brasileira de Pesquisa Agropecuária (Embrapa)instacron:EMBRAPAenghttps://seer.sct.embrapa.br/index.php/pab/article/view/27172/15121Direitos autorais 2022 Pesquisa Agropecuária Brasileirainfo:eu-repo/semantics/openAccess2023-01-23T13:40:22Zoai:ojs.seer.sct.embrapa.br:article/27172Revistahttp://seer.sct.embrapa.br/index.php/pabPRIhttps://old.scielo.br/oai/scielo-oai.phppab@sct.embrapa.br || sct.pab@embrapa.br1678-39210100-204Xopendoar:2023-01-23T13:40:22Pesquisa Agropecuária Brasileira (Online) - Empresa Brasileira de Pesquisa Agropecuária (Embrapa)false |
dc.title.none.fl_str_mv |
Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo Data mining applied to feature selection methods for aboveground carbon stock modelling |
title |
Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo |
spellingShingle |
Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo Carvalho, Mônica Canaan manejo florestal; algoritmo genético; floresta aleatória forest management; genetic algorithm; random forest |
title_short |
Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo |
title_full |
Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo |
title_fullStr |
Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo |
title_full_unstemmed |
Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo |
title_sort |
Mineração de dados aplicada a métodos de seleção de variáveis para a modelagem de estoque de carbono acima do solo |
author |
Carvalho, Mônica Canaan |
author_facet |
Carvalho, Mônica Canaan Gomide, Lucas Rezende Scolforo, José Roberto Soares Páscoa, Kalill José Viana da Araújo, Laís Almeida Lopes, Isáira Leite e |
author_role |
author |
author2 |
Gomide, Lucas Rezende Scolforo, José Roberto Soares Páscoa, Kalill José Viana da Araújo, Laís Almeida Lopes, Isáira Leite e |
author2_role |
author author author author author |
dc.contributor.none.fl_str_mv |
Companhia Energética de Minas Gerais (Cemig, Projeto Cemig GT-456) Universidade Federal de Lavras (UFLA) Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes, Código 001) Companhia Energética de Minas Gerais (CEMIG, Project CEMIG GT-456) Universidade Federal de Lavras (UFLA) Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES, Code 001) |
dc.contributor.author.fl_str_mv |
Carvalho, Mônica Canaan Gomide, Lucas Rezende Scolforo, José Roberto Soares Páscoa, Kalill José Viana da Araújo, Laís Almeida Lopes, Isáira Leite e |
dc.subject.por.fl_str_mv |
manejo florestal; algoritmo genético; floresta aleatória forest management; genetic algorithm; random forest |
topic |
manejo florestal; algoritmo genético; floresta aleatória forest management; genetic algorithm; random forest |
description |
O objetivo deste trabalho foi aplicar o algoritmo “random forest” (RF) à modelagem do estoque de carbono acima do solo (CAS) de uma floresta tropical, por meio da testagem de três procedimentos de seleção de variáveis: remoção recursiva e algoritmos genéticos (AGs) uniobjetivo e multiobjetivo. Os dados utilizados abrangeram 1.007 parcelas amostradas na bacia hidrográfica do Rio Grande, no estado de Minas Gerais, Brasil, e 114 variáveis ambientais (climáticas, edáficas, geográficas, de terreno e espectrais). A melhor estratégia de seleção de variáveis – a RF com AG multiobjetivo – chega ao menor erro quadrático de 17,75 Mg ha-1 com apenas quatro variáveis espectrais – índice de umidade por diferença normalizada, textura de correlação do índice de queimada por razão normalizada 2, cobertura arbórea e fluxo de calor latente –, o que representa redução de 96,5% no tamanho do banco de dados. As estratégias de seleção de variáveis ajudam a obter melhor desempenho da RF, ao melhorar a acurácia e reduzir o volume dos dados. Embora a remoção recursiva e o AG multiobjetivo mostrem desempenho semelhante como estratégias de seleção de variáveis, esta último apresenta menor subconjunto de variáveis, com maior precisão. As descobertas deste trabalho destacam a importância do uso de infravermelho próximo, comprimentos de onda curtos e índices de vegetação derivados para a estimativa de CAS baseada em sensoriamento remoto. Os produtos MODIS mostram relação significativa com o estoque de CAS e precisam ser melhor explorados pela comunidade científica para a modelagem deste estoque. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-12-05 |
dc.type.none.fl_str_mv |
|
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://seer.sct.embrapa.br/index.php/pab/article/view/27172 |
url |
https://seer.sct.embrapa.br/index.php/pab/article/view/27172 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
https://seer.sct.embrapa.br/index.php/pab/article/view/27172/15121 |
dc.rights.driver.fl_str_mv |
Direitos autorais 2022 Pesquisa Agropecuária Brasileira info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Direitos autorais 2022 Pesquisa Agropecuária Brasileira |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pesquisa Agropecuaria Brasileira Pesquisa Agropecuária Brasileira |
publisher.none.fl_str_mv |
Pesquisa Agropecuaria Brasileira Pesquisa Agropecuária Brasileira |
dc.source.none.fl_str_mv |
Pesquisa Agropecuaria Brasileira; V.57, Jan./Dec., 2022: Publicação contínua em volume anual; e03015 Pesquisa Agropecuária Brasileira; V.57, Jan./Dec., 2022: Publicação contínua em volume anual; e03015 1678-3921 0100-104x reponame:Pesquisa Agropecuária Brasileira (Online) instname:Empresa Brasileira de Pesquisa Agropecuária (Embrapa) instacron:EMBRAPA |
instname_str |
Empresa Brasileira de Pesquisa Agropecuária (Embrapa) |
instacron_str |
EMBRAPA |
institution |
EMBRAPA |
reponame_str |
Pesquisa Agropecuária Brasileira (Online) |
collection |
Pesquisa Agropecuária Brasileira (Online) |
repository.name.fl_str_mv |
Pesquisa Agropecuária Brasileira (Online) - Empresa Brasileira de Pesquisa Agropecuária (Embrapa) |
repository.mail.fl_str_mv |
pab@sct.embrapa.br || sct.pab@embrapa.br |
_version_ |
1793416662964240384 |