Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Outros Autores: | , , , , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Pesquisa Agropecuária Brasileira (Online) |
Texto Completo: | https://seer.sct.embrapa.br/index.php/pab/article/view/22491 |
Resumo: | O objetivo deste trabalho foi avaliar diferentes estratégias para a predição da distribuição de classes de solo em mapas pedológicos digitais de áreas sem dados de referência, na bacia sedimentar do São Francisco, no Norte de Minas Gerais. As estratégias incluíram: o detalhamento da legenda, o treinamento por observações em campo, a ampliação do conjunto de treinamento e o uso de diferentes algoritmos de mineração de dados. Foram elaboradas quatro matrizes, diferenciadas pelo volume de dados, para o aprendizado dos algoritmos, e pelo nível taxonômico das classes de solo a serem preditas. Avaliou-se o desempenho dos algoritmos de aprendizado de máquina – Random Forest, J48 e MLP –, associados a procedimentos de discretização, balanceamento de classes, seleção de variáveis e expansão do conjunto de treinamento. O balanceamento de classes, a discretização de variáveis por frequências iguais e o algoritmo Random Forest apresentaram os melhores desempenhos. A extensão da representatividade das observações em campo, que presume uma área de treinamento mais ampla, não trouxe ganho preditivo. A generalização taxonômica para subordem diminui a fragmentação dos polígonos mapeados e aumenta a acurácia dos mapas pedológicos digitais. Quando são produzidos após treinamento por observações de solo in situ, na área de mapeamento, os mapas pedológicos digitais têm valores de acurácia equivalentes aos dos treinados em mapas preexistentes. |
id |
EMBRAPA-4_9ec1c5589598d8eeaa8c98deb567eb7b |
---|---|
oai_identifier_str |
oai:ojs.seer.sct.embrapa.br:article/22491 |
network_acronym_str |
EMBRAPA-4 |
network_name_str |
Pesquisa Agropecuária Brasileira (Online) |
repository_id_str |
|
spelling |
Predição de classes de solo por mineração de dados em área da bacia sedimentar do São FranciscoSoil class prediction by data mining in an area of the sedimentary São Francisco basinacurácia de mapas pedológicos, algoritmos de classificação, mapa digital de solos, variáveis preditivas do meio físicosoil map accuracy, classification algorithms, digital soil map, predictive variables of the terrainO objetivo deste trabalho foi avaliar diferentes estratégias para a predição da distribuição de classes de solo em mapas pedológicos digitais de áreas sem dados de referência, na bacia sedimentar do São Francisco, no Norte de Minas Gerais. As estratégias incluíram: o detalhamento da legenda, o treinamento por observações em campo, a ampliação do conjunto de treinamento e o uso de diferentes algoritmos de mineração de dados. Foram elaboradas quatro matrizes, diferenciadas pelo volume de dados, para o aprendizado dos algoritmos, e pelo nível taxonômico das classes de solo a serem preditas. Avaliou-se o desempenho dos algoritmos de aprendizado de máquina – Random Forest, J48 e MLP –, associados a procedimentos de discretização, balanceamento de classes, seleção de variáveis e expansão do conjunto de treinamento. O balanceamento de classes, a discretização de variáveis por frequências iguais e o algoritmo Random Forest apresentaram os melhores desempenhos. A extensão da representatividade das observações em campo, que presume uma área de treinamento mais ampla, não trouxe ganho preditivo. A generalização taxonômica para subordem diminui a fragmentação dos polígonos mapeados e aumenta a acurácia dos mapas pedológicos digitais. Quando são produzidos após treinamento por observações de solo in situ, na área de mapeamento, os mapas pedológicos digitais têm valores de acurácia equivalentes aos dos treinados em mapas preexistentes.The objective of this work was to evaluate different strategies for the prediction of soil class distribution on digital soil maps of areas without reference data, in the sedimentary basin of San Francisco, in the north of the state of Minas Gerais, Brazil. The strategies included: taxonomic generalization, training by field observations, training set expansion, and the use of different data mining algorithms. Four matrices were developed, differentiated by the volume of data for machine learning and by soil taxonomic levels to be predicted. The performance of the machine learning algorithms – Random Forest, J48, and MLP –, associated with discretization, class balancing, variable selection, and expansion of the training set was evaluated. Class balancing, variable discretization by equal frequencies, and the Random Forest algorithm showed the best performances. The representativeness extension of field observations, that assumes a larger training area, brought no predictive gain. Soil taxonomic generalization to the suborder level reduces the fragmentation of mapped polygons and improves the accuracy of digital soil maps. When generated by training on in situ soil observations at the mapping area, digital soil maps are as accurate as those trained on preexistent maps.Pesquisa Agropecuaria BrasileiraPesquisa Agropecuária BrasileiraCoordenação de Aperfeiçoamento de Pessoal de Nível Superior, CapesPetrobrás/PBIOCoordenação de Aperfeiçoamento de Pessoal de Nível Superior, CapesPetrobrás/PBIODias, Laura Milani da SilvaCoelho, Ricardo MarquesValladares, Gustavo SouzaAssis, Ana Carolina Cunha deFerreira, Edilene PereiraSilva, Rafael Cipriano da2016-10-17info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://seer.sct.embrapa.br/index.php/pab/article/view/22491Pesquisa Agropecuaria Brasileira; v.51, n.9, set. 2016: Número Temático O solo como fator de integração entre os componentes ambientais e a produção agropecuária; 1396-1404Pesquisa Agropecuária Brasileira; v.51, n.9, set. 2016: Número Temático O solo como fator de integração entre os componentes ambientais e a produção agropecuária; 1396-14041678-39210100-104xreponame:Pesquisa Agropecuária Brasileira (Online)instname:Empresa Brasileira de Pesquisa Agropecuária (Embrapa)instacron:EMBRAPAporhttps://seer.sct.embrapa.br/index.php/pab/article/view/22491/13499https://seer.sct.embrapa.br/index.php/pab/article/downloadSuppFile/22491/14527Direitos autorais 2016 Pesquisa Agropecuária Brasileirainfo:eu-repo/semantics/openAccess2016-10-31T17:52:12Zoai:ojs.seer.sct.embrapa.br:article/22491Revistahttp://seer.sct.embrapa.br/index.php/pabPRIhttps://old.scielo.br/oai/scielo-oai.phppab@sct.embrapa.br || sct.pab@embrapa.br1678-39210100-204Xopendoar:2016-10-31T17:52:12Pesquisa Agropecuária Brasileira (Online) - Empresa Brasileira de Pesquisa Agropecuária (Embrapa)false |
dc.title.none.fl_str_mv |
Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco Soil class prediction by data mining in an area of the sedimentary São Francisco basin |
title |
Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco |
spellingShingle |
Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco Dias, Laura Milani da Silva acurácia de mapas pedológicos, algoritmos de classificação, mapa digital de solos, variáveis preditivas do meio físico soil map accuracy, classification algorithms, digital soil map, predictive variables of the terrain |
title_short |
Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco |
title_full |
Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco |
title_fullStr |
Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco |
title_full_unstemmed |
Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco |
title_sort |
Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco |
author |
Dias, Laura Milani da Silva |
author_facet |
Dias, Laura Milani da Silva Coelho, Ricardo Marques Valladares, Gustavo Souza Assis, Ana Carolina Cunha de Ferreira, Edilene Pereira Silva, Rafael Cipriano da |
author_role |
author |
author2 |
Coelho, Ricardo Marques Valladares, Gustavo Souza Assis, Ana Carolina Cunha de Ferreira, Edilene Pereira Silva, Rafael Cipriano da |
author2_role |
author author author author author |
dc.contributor.none.fl_str_mv |
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, Capes Petrobrás/PBIO Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, Capes Petrobrás/PBIO |
dc.contributor.author.fl_str_mv |
Dias, Laura Milani da Silva Coelho, Ricardo Marques Valladares, Gustavo Souza Assis, Ana Carolina Cunha de Ferreira, Edilene Pereira Silva, Rafael Cipriano da |
dc.subject.por.fl_str_mv |
acurácia de mapas pedológicos, algoritmos de classificação, mapa digital de solos, variáveis preditivas do meio físico soil map accuracy, classification algorithms, digital soil map, predictive variables of the terrain |
topic |
acurácia de mapas pedológicos, algoritmos de classificação, mapa digital de solos, variáveis preditivas do meio físico soil map accuracy, classification algorithms, digital soil map, predictive variables of the terrain |
description |
O objetivo deste trabalho foi avaliar diferentes estratégias para a predição da distribuição de classes de solo em mapas pedológicos digitais de áreas sem dados de referência, na bacia sedimentar do São Francisco, no Norte de Minas Gerais. As estratégias incluíram: o detalhamento da legenda, o treinamento por observações em campo, a ampliação do conjunto de treinamento e o uso de diferentes algoritmos de mineração de dados. Foram elaboradas quatro matrizes, diferenciadas pelo volume de dados, para o aprendizado dos algoritmos, e pelo nível taxonômico das classes de solo a serem preditas. Avaliou-se o desempenho dos algoritmos de aprendizado de máquina – Random Forest, J48 e MLP –, associados a procedimentos de discretização, balanceamento de classes, seleção de variáveis e expansão do conjunto de treinamento. O balanceamento de classes, a discretização de variáveis por frequências iguais e o algoritmo Random Forest apresentaram os melhores desempenhos. A extensão da representatividade das observações em campo, que presume uma área de treinamento mais ampla, não trouxe ganho preditivo. A generalização taxonômica para subordem diminui a fragmentação dos polígonos mapeados e aumenta a acurácia dos mapas pedológicos digitais. Quando são produzidos após treinamento por observações de solo in situ, na área de mapeamento, os mapas pedológicos digitais têm valores de acurácia equivalentes aos dos treinados em mapas preexistentes. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016-10-17 |
dc.type.none.fl_str_mv |
|
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://seer.sct.embrapa.br/index.php/pab/article/view/22491 |
url |
https://seer.sct.embrapa.br/index.php/pab/article/view/22491 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://seer.sct.embrapa.br/index.php/pab/article/view/22491/13499 https://seer.sct.embrapa.br/index.php/pab/article/downloadSuppFile/22491/14527 |
dc.rights.driver.fl_str_mv |
Direitos autorais 2016 Pesquisa Agropecuária Brasileira info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Direitos autorais 2016 Pesquisa Agropecuária Brasileira |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pesquisa Agropecuaria Brasileira Pesquisa Agropecuária Brasileira |
publisher.none.fl_str_mv |
Pesquisa Agropecuaria Brasileira Pesquisa Agropecuária Brasileira |
dc.source.none.fl_str_mv |
Pesquisa Agropecuaria Brasileira; v.51, n.9, set. 2016: Número Temático O solo como fator de integração entre os componentes ambientais e a produção agropecuária; 1396-1404 Pesquisa Agropecuária Brasileira; v.51, n.9, set. 2016: Número Temático O solo como fator de integração entre os componentes ambientais e a produção agropecuária; 1396-1404 1678-3921 0100-104x reponame:Pesquisa Agropecuária Brasileira (Online) instname:Empresa Brasileira de Pesquisa Agropecuária (Embrapa) instacron:EMBRAPA |
instname_str |
Empresa Brasileira de Pesquisa Agropecuária (Embrapa) |
instacron_str |
EMBRAPA |
institution |
EMBRAPA |
reponame_str |
Pesquisa Agropecuária Brasileira (Online) |
collection |
Pesquisa Agropecuária Brasileira (Online) |
repository.name.fl_str_mv |
Pesquisa Agropecuária Brasileira (Online) - Empresa Brasileira de Pesquisa Agropecuária (Embrapa) |
repository.mail.fl_str_mv |
pab@sct.embrapa.br || sct.pab@embrapa.br |
_version_ |
1793416690083561472 |