Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco

Detalhes bibliográficos
Autor(a) principal: Dias, Laura Milani da Silva
Data de Publicação: 2016
Outros Autores: Coelho, Ricardo Marques, Valladares, Gustavo Souza, Assis, Ana Carolina Cunha de, Ferreira, Edilene Pereira, Silva, Rafael Cipriano da
Tipo de documento: Artigo
Idioma: por
Título da fonte: Pesquisa Agropecuária Brasileira (Online)
Texto Completo: https://seer.sct.embrapa.br/index.php/pab/article/view/22491
Resumo: O objetivo deste trabalho foi avaliar diferentes estratégias para a predição da distribuição de classes de solo em mapas pedológicos digitais de áreas sem dados de referência, na bacia sedimentar do São Francisco, no Norte de Minas Gerais. As estratégias incluíram: o detalhamento da legenda, o treinamento por observações em campo, a ampliação do conjunto de treinamento e o uso de diferentes algoritmos de mineração de dados. Foram elaboradas quatro matrizes, diferenciadas pelo volume de dados, para o aprendizado dos algoritmos, e pelo nível taxonômico das classes de solo a serem preditas. Avaliou-se o desempenho dos algoritmos de aprendizado de máquina – Random Forest, J48 e MLP –, associados a procedimentos de discretização, balanceamento de classes, seleção de variáveis e expansão do conjunto de treinamento. O balanceamento de classes, a discretização de variáveis por frequências iguais e o algoritmo Random Forest apresentaram os melhores desempenhos. A extensão da representatividade das observações em campo, que presume uma área de treinamento mais ampla, não trouxe ganho preditivo. A generalização taxonômica para subordem diminui a fragmentação dos polígonos mapeados e aumenta a acurácia dos mapas pedológicos digitais. Quando são produzidos após treinamento por observações de solo in situ, na área de mapeamento, os mapas pedológicos digitais têm valores de acurácia equivalentes aos dos treinados em mapas preexistentes.
id EMBRAPA-4_9ec1c5589598d8eeaa8c98deb567eb7b
oai_identifier_str oai:ojs.seer.sct.embrapa.br:article/22491
network_acronym_str EMBRAPA-4
network_name_str Pesquisa Agropecuária Brasileira (Online)
repository_id_str
spelling Predição de classes de solo por mineração de dados em área da bacia sedimentar do São FranciscoSoil class prediction by data mining in an area of the sedimentary São Francisco basinacurácia de mapas pedológicos, algoritmos de classificação, mapa digital de solos, variáveis preditivas do meio físicosoil map accuracy, classification algorithms, digital soil map, predictive variables of the terrainO objetivo deste trabalho foi avaliar diferentes estratégias para a predição da distribuição de classes de solo em mapas pedológicos digitais de áreas sem dados de referência, na bacia sedimentar do São Francisco, no Norte de Minas Gerais. As estratégias incluíram: o detalhamento da legenda, o treinamento por observações em campo, a ampliação do conjunto de treinamento e o uso de diferentes algoritmos de mineração de dados. Foram elaboradas quatro matrizes, diferenciadas pelo volume de dados, para o aprendizado dos algoritmos, e pelo nível taxonômico das classes de solo a serem preditas. Avaliou-se o desempenho dos algoritmos de aprendizado de máquina – Random Forest, J48 e MLP –, associados a procedimentos de discretização, balanceamento de classes, seleção de variáveis e expansão do conjunto de treinamento. O balanceamento de classes, a discretização de variáveis por frequências iguais e o algoritmo Random Forest apresentaram os melhores desempenhos. A extensão da representatividade das observações em campo, que presume uma área de treinamento mais ampla, não trouxe ganho preditivo. A generalização taxonômica para subordem diminui a fragmentação dos polígonos mapeados e aumenta a acurácia dos mapas pedológicos digitais. Quando são produzidos após treinamento por observações de solo in situ, na área de mapeamento, os mapas pedológicos digitais têm valores de acurácia equivalentes aos dos treinados em mapas preexistentes.The objective of this work was to evaluate different strategies for the prediction of soil class distribution on digital soil maps of areas without reference data, in the sedimentary basin of San Francisco, in the north of the state of Minas Gerais, Brazil. The strategies included: taxonomic generalization, training by field observations, training set expansion, and the use of different data mining algorithms. Four matrices were developed, differentiated by the volume of data for machine learning and by soil taxonomic levels to be predicted. The performance of the machine learning algorithms – Random Forest, J48, and MLP –, associated with discretization, class balancing, variable selection, and expansion of the training set was evaluated. Class balancing, variable discretization by equal frequencies, and the Random Forest algorithm showed the best performances. The representativeness extension of field observations, that assumes a larger training area, brought no predictive gain. Soil taxonomic generalization to the suborder level reduces the fragmentation of mapped polygons and improves the accuracy of digital soil maps. When generated by training on in situ soil observations at the mapping area, digital soil maps are as accurate as those trained on preexistent maps.Pesquisa Agropecuaria BrasileiraPesquisa Agropecuária BrasileiraCoordenação de Aperfeiçoamento de Pessoal de Nível Superior, CapesPetrobrás/PBIOCoordenação de Aperfeiçoamento de Pessoal de Nível Superior, CapesPetrobrás/PBIODias, Laura Milani da SilvaCoelho, Ricardo MarquesValladares, Gustavo SouzaAssis, Ana Carolina Cunha deFerreira, Edilene PereiraSilva, Rafael Cipriano da2016-10-17info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://seer.sct.embrapa.br/index.php/pab/article/view/22491Pesquisa Agropecuaria Brasileira; v.51, n.9, set. 2016: Número Temático O solo como fator de integração entre os componentes ambientais e a produção agropecuária; 1396-1404Pesquisa Agropecuária Brasileira; v.51, n.9, set. 2016: Número Temático O solo como fator de integração entre os componentes ambientais e a produção agropecuária; 1396-14041678-39210100-104xreponame:Pesquisa Agropecuária Brasileira (Online)instname:Empresa Brasileira de Pesquisa Agropecuária (Embrapa)instacron:EMBRAPAporhttps://seer.sct.embrapa.br/index.php/pab/article/view/22491/13499https://seer.sct.embrapa.br/index.php/pab/article/downloadSuppFile/22491/14527Direitos autorais 2016 Pesquisa Agropecuária Brasileirainfo:eu-repo/semantics/openAccess2016-10-31T17:52:12Zoai:ojs.seer.sct.embrapa.br:article/22491Revistahttp://seer.sct.embrapa.br/index.php/pabPRIhttps://old.scielo.br/oai/scielo-oai.phppab@sct.embrapa.br || sct.pab@embrapa.br1678-39210100-204Xopendoar:2016-10-31T17:52:12Pesquisa Agropecuária Brasileira (Online) - Empresa Brasileira de Pesquisa Agropecuária (Embrapa)false
dc.title.none.fl_str_mv Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco
Soil class prediction by data mining in an area of the sedimentary São Francisco basin
title Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco
spellingShingle Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco
Dias, Laura Milani da Silva
acurácia de mapas pedológicos, algoritmos de classificação, mapa digital de solos, variáveis preditivas do meio físico
soil map accuracy, classification algorithms, digital soil map, predictive variables of the terrain
title_short Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco
title_full Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco
title_fullStr Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco
title_full_unstemmed Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco
title_sort Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco
author Dias, Laura Milani da Silva
author_facet Dias, Laura Milani da Silva
Coelho, Ricardo Marques
Valladares, Gustavo Souza
Assis, Ana Carolina Cunha de
Ferreira, Edilene Pereira
Silva, Rafael Cipriano da
author_role author
author2 Coelho, Ricardo Marques
Valladares, Gustavo Souza
Assis, Ana Carolina Cunha de
Ferreira, Edilene Pereira
Silva, Rafael Cipriano da
author2_role author
author
author
author
author
dc.contributor.none.fl_str_mv Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, Capes
Petrobrás/PBIO
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, Capes
Petrobrás/PBIO
dc.contributor.author.fl_str_mv Dias, Laura Milani da Silva
Coelho, Ricardo Marques
Valladares, Gustavo Souza
Assis, Ana Carolina Cunha de
Ferreira, Edilene Pereira
Silva, Rafael Cipriano da
dc.subject.por.fl_str_mv acurácia de mapas pedológicos, algoritmos de classificação, mapa digital de solos, variáveis preditivas do meio físico
soil map accuracy, classification algorithms, digital soil map, predictive variables of the terrain
topic acurácia de mapas pedológicos, algoritmos de classificação, mapa digital de solos, variáveis preditivas do meio físico
soil map accuracy, classification algorithms, digital soil map, predictive variables of the terrain
description O objetivo deste trabalho foi avaliar diferentes estratégias para a predição da distribuição de classes de solo em mapas pedológicos digitais de áreas sem dados de referência, na bacia sedimentar do São Francisco, no Norte de Minas Gerais. As estratégias incluíram: o detalhamento da legenda, o treinamento por observações em campo, a ampliação do conjunto de treinamento e o uso de diferentes algoritmos de mineração de dados. Foram elaboradas quatro matrizes, diferenciadas pelo volume de dados, para o aprendizado dos algoritmos, e pelo nível taxonômico das classes de solo a serem preditas. Avaliou-se o desempenho dos algoritmos de aprendizado de máquina – Random Forest, J48 e MLP –, associados a procedimentos de discretização, balanceamento de classes, seleção de variáveis e expansão do conjunto de treinamento. O balanceamento de classes, a discretização de variáveis por frequências iguais e o algoritmo Random Forest apresentaram os melhores desempenhos. A extensão da representatividade das observações em campo, que presume uma área de treinamento mais ampla, não trouxe ganho preditivo. A generalização taxonômica para subordem diminui a fragmentação dos polígonos mapeados e aumenta a acurácia dos mapas pedológicos digitais. Quando são produzidos após treinamento por observações de solo in situ, na área de mapeamento, os mapas pedológicos digitais têm valores de acurácia equivalentes aos dos treinados em mapas preexistentes.
publishDate 2016
dc.date.none.fl_str_mv 2016-10-17
dc.type.none.fl_str_mv
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://seer.sct.embrapa.br/index.php/pab/article/view/22491
url https://seer.sct.embrapa.br/index.php/pab/article/view/22491
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://seer.sct.embrapa.br/index.php/pab/article/view/22491/13499
https://seer.sct.embrapa.br/index.php/pab/article/downloadSuppFile/22491/14527
dc.rights.driver.fl_str_mv Direitos autorais 2016 Pesquisa Agropecuária Brasileira
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Direitos autorais 2016 Pesquisa Agropecuária Brasileira
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pesquisa Agropecuaria Brasileira
Pesquisa Agropecuária Brasileira
publisher.none.fl_str_mv Pesquisa Agropecuaria Brasileira
Pesquisa Agropecuária Brasileira
dc.source.none.fl_str_mv Pesquisa Agropecuaria Brasileira; v.51, n.9, set. 2016: Número Temático O solo como fator de integração entre os componentes ambientais e a produção agropecuária; 1396-1404
Pesquisa Agropecuária Brasileira; v.51, n.9, set. 2016: Número Temático O solo como fator de integração entre os componentes ambientais e a produção agropecuária; 1396-1404
1678-3921
0100-104x
reponame:Pesquisa Agropecuária Brasileira (Online)
instname:Empresa Brasileira de Pesquisa Agropecuária (Embrapa)
instacron:EMBRAPA
instname_str Empresa Brasileira de Pesquisa Agropecuária (Embrapa)
instacron_str EMBRAPA
institution EMBRAPA
reponame_str Pesquisa Agropecuária Brasileira (Online)
collection Pesquisa Agropecuária Brasileira (Online)
repository.name.fl_str_mv Pesquisa Agropecuária Brasileira (Online) - Empresa Brasileira de Pesquisa Agropecuária (Embrapa)
repository.mail.fl_str_mv pab@sct.embrapa.br || sct.pab@embrapa.br
_version_ 1793416690083561472