Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem

Detalhes bibliográficos
Autor(a) principal: Macarringue, Lucrêncio Silvestre, 1985-
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/5618
Resumo: Orientador: Edson Luis Bolfe
id UNICAMP-30_a4541d858c71ea69cefd7d777c2dba08
oai_identifier_str oai::1249815
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvemLand use and land cover in the northern region of Mozambique between 2011 and 2020 : an approach based on machine learning and cloud computingPlataforma computacionalSéries temporaisAprendizado de máquinaMineração de dados (Computação)Floresta aleatóriaComputing platformTime seriesMachine learningData miningRandom ForestOrientador: Edson Luis BolfeTese (doutorado) - Universidade Estadual de Campinas, Instituto de GeociênciasResumo: Em Moçambique, os dados de referência nacional sobre cobertura vegetal apresentam desafios, devido, por um lado, ao intervalo de tempo entre os levantamentos (1980, 1994, 2007 e 2018), e, por outro, devido à adoção de metodologias diferenciadas no levantamento desses dados. Considerando a evolução das técnicas e métodos de aquisição e tratamento de dados de sensoriamento remoto, nesta pesquisa, propôs-se: i) fazer o levantamento de métodos e técnicas de tratamento de dados para fins de mapeamento e monitoramento do uso e cobertura da terra; ii) propor, aplicar e avaliar o método e técnica de mapeamento do uso e cobertura da terra na região norte de Moçambique baseado em algoritmos de aprendizado de máquinas e plataformas de computação em nuvem; iii) analisar as dinâmicas do uso e cobertura da terra na região entre o período de 2011 e 2020. Como materiais, trabalhou-se com imagens orbitais de média resolução espacial e de distribuição gratuita, associadas às imagens de alta resolução disponíveis em plataformas gratuitas (Google Earth ou outras), processadas em plataformas e softwares livre e de código aberto (Google Earth Engine/QGIS) em função das necessidades e limitações de ordem institucional, estruturais e financeiras do país. Para esta tese, optou-se pela série Landsat (2011-2020), aplicando o algoritmo Random Forest (RF) tanto para a avaliação do modelo de seleção de variáveis (Feature Selection) bem como para a classificação e refinamento dos dados por meio da abordagem por pixel na plataforma Google Earth Engine (GEE) em função da complexidade que representa o processamento de grande volume de dados. As imagens foram acessadas diretamente na plataforma GEE e foram normalizadas por ano, aplicando procedimentos tais como realce, agregação temporal pela mediana, formação das composições falsa-cor, fusão espacial, redução/remoção de nuvens, mosaico, redução de dimensionalidade através da seleção de variáveis (Feature Selection). Os dados foram processados utilizando amostras de treinamento adquiridas através dos levantamentos em campo e interpretação visual aplicando a abordagem de análise da importância das variáveis com a finalidade de serem integradas na classificação. Definidas as classes e coletadas as amostras, a classificação foi realizada aplicando o RF. Com isso, gerou-se mapas de uso e cobertura da terra para cada ano, os quais foram validados com base em amostras de validação por meio de métricas quantitativas derivadas da matriz de confusão, como acurácia global e Índice Kappa, bem como métricas ponderadas (acurácia do produtor e acurácia do usuário). Filtros espaciais e temporais foram aplicados para reduzir o efeito de "sal e pimenta" e correção dos dados ausentes. Cinco classes de uso e cobertura de terra compuseram os mapas finais, os quais apresentaram uma consistência espacial relativamente baixa para as classes agrícola e urbana devido à elevada fragmentação da paisagem. Os mapas gerados apresentaram uma acurácia global que varia de 80,93 a 88,08%, sendo que as classes área urbana e agrícola apresentaram maior confusão. Com estes resultados, foram realizadas análises estatísticas anuais a fim de detectar mudanças/transições nas classes de uso e cobertura decorridas no período em análise as quais mostraram uma estabilidade da dinâmica da vegetação para o recorte temporal 2011-2020. A abordagem metodológica utilizada responde aos desafios vigentes em Moçambique para mapeamentos sistemáticos e monitoramento do uso e cobertura da terra e pode ser utilizada para trabalhos futuros similares, minimizando as lacunas metodológicas e a amplitude temporal nos levantamentos e para apoio a políticas de desenvolvimento territorial regionalAbstract: In Mozambique, the national reference data on vegetation cover presents challenges, on the one hand due to the time interval between the surveys (1980, 1994, 2007 and 2018) and on the other, due to the adoption of different methodologies in the collection of these data. With the development and evolution of techniques and methods of acquisition and treatment of remotely sensed data, it is proposed, in this study: i) survey data processing methods and techniques for mapping and monitoring land use and land cover; ii) propose, apply and evaluate the method and technique for mapping land use and land cover in the northern region of Mozambique based on machine learning algorithms and cloud computing platform; iii) analyze the dynamics of land use and land cover in the region between 2011 and 2020. As materials, we worked with remotely sensed data of medium spatial resolution and free distribution, associated with high-resolution images available on free platforms (Google Earth or others), processed on free and open source platforms and software (Google Earth Engine/QGIS) according to the institutional, structural and financial needs and limitations of the country. For this thesis, we chose to use Landsat series data from (2011-2020), applying the Random Forest (RF) algorithm both for the evaluation of the Feature Selection model, as well as for the classification and refinement of data through the pixel approach in the Google Earth Engine (GEE) platform due to the complexity that represents the management of Big Data. The images were accessed directly on the GEE platform in which they were normalized year by year, applying procedures such as enhancement, temporal aggregation by the median, false-color compositions, spatial fusion, cloud mask, mosaic, dimensionality reduction through Feature Selection. Data were processed using training samples acquired through field surveys and visual interpretation, applying the embeded approach that consists of analyzing feature importance in order to integrate them into the classification process. After defining the classes and collecting the samples, the classification was performed using the RF. Thus, maps of land use and cover were generated for each year, which were validated based on validation samples through quantitative metrics derived from the confusion matrix, such as a global accuracy and Kappa index, as well as weighted metrics (producer’s and user’s accuracies). Spatial and temporal filters were applied to reduce the "salt and pepper" effect and correct inaccurated data. Five land use and land cover classes composed the final maps, which presented a relatively low spatial consistency for the agricultural and urban classes due to the high fragmentation of the landscape. The generated maps showed an overall accuracy that ranged from 80.93 to 88.08%, with the urban and agricultural classes showing greater confusion. With these results, annual statistical analyzes were carried out in order to detect changes/transitions on the land use and cover classes that took place in the period under analysis, which showed a stability of the vegetation dynamics for the 2011-2020 time frame. In addition, that methodological approach responds to the current challenges in Mozambique for systematic mapping and monitoring of land use and cover which can be used as reference for similar and future works and so, supporting regional development policiesDoutoradoAnálise Ambiental e Dinâmica TerritorialDoutor em GeografiaCNPQ190158/2017-4[s.n.]Bolfe, Edson Luis, 1974-Matias, Lindon FonsecaZullo Junior, JurandirSano, Edson EyjiCaldas, Marcellus MarquesUniversidade Estadual de Campinas. Instituto de GeociênciasPrograma de Pós-Graduação em GeografiaUNIVERSIDADE ESTADUAL DE CAMPINASMacarringue, Lucrêncio Silvestre, 1985-20222022-07-27T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf1 recurso online (157 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/5618MACARRINGUE, Lucrêncio Silvestre. Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020: uma abordagem baseada em aprendizado de máquina e computação em nuvem. 2022. 1 recurso online (157 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Geociências, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/5618. Acesso em: 15 mai. 2024.https://repositorio.unicamp.br/acervo/detalhe/1249815Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2022-09-20T10:16:57Zoai::1249815Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2022-09-20T10:16:57Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem
Land use and land cover in the northern region of Mozambique between 2011 and 2020 : an approach based on machine learning and cloud computing
title Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem
spellingShingle Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem
Macarringue, Lucrêncio Silvestre, 1985-
Plataforma computacional
Séries temporais
Aprendizado de máquina
Mineração de dados (Computação)
Floresta aleatória
Computing platform
Time series
Machine learning
Data mining
Random Forest
title_short Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem
title_full Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem
title_fullStr Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem
title_full_unstemmed Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem
title_sort Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem
author Macarringue, Lucrêncio Silvestre, 1985-
author_facet Macarringue, Lucrêncio Silvestre, 1985-
author_role author
dc.contributor.none.fl_str_mv Bolfe, Edson Luis, 1974-
Matias, Lindon Fonseca
Zullo Junior, Jurandir
Sano, Edson Eyji
Caldas, Marcellus Marques
Universidade Estadual de Campinas. Instituto de Geociências
Programa de Pós-Graduação em Geografia
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Macarringue, Lucrêncio Silvestre, 1985-
dc.subject.por.fl_str_mv Plataforma computacional
Séries temporais
Aprendizado de máquina
Mineração de dados (Computação)
Floresta aleatória
Computing platform
Time series
Machine learning
Data mining
Random Forest
topic Plataforma computacional
Séries temporais
Aprendizado de máquina
Mineração de dados (Computação)
Floresta aleatória
Computing platform
Time series
Machine learning
Data mining
Random Forest
description Orientador: Edson Luis Bolfe
publishDate 2022
dc.date.none.fl_str_mv 2022
2022-07-27T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/5618
MACARRINGUE, Lucrêncio Silvestre. Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020: uma abordagem baseada em aprendizado de máquina e computação em nuvem. 2022. 1 recurso online (157 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Geociências, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/5618. Acesso em: 15 mai. 2024.
url https://hdl.handle.net/20.500.12733/5618
identifier_str_mv MACARRINGUE, Lucrêncio Silvestre. Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020: uma abordagem baseada em aprendizado de máquina e computação em nuvem. 2022. 1 recurso online (157 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Geociências, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/5618. Acesso em: 15 mai. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1249815
Requisitos do sistema: Software para leitura de arquivo em PDF
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
1 recurso online (157 p.) : il., digital, arquivo PDF.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1799138572655132672