Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/5618 |
Resumo: | Orientador: Edson Luis Bolfe |
id |
UNICAMP-30_a4541d858c71ea69cefd7d777c2dba08 |
---|---|
oai_identifier_str |
oai::1249815 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvemLand use and land cover in the northern region of Mozambique between 2011 and 2020 : an approach based on machine learning and cloud computingPlataforma computacionalSéries temporaisAprendizado de máquinaMineração de dados (Computação)Floresta aleatóriaComputing platformTime seriesMachine learningData miningRandom ForestOrientador: Edson Luis BolfeTese (doutorado) - Universidade Estadual de Campinas, Instituto de GeociênciasResumo: Em Moçambique, os dados de referência nacional sobre cobertura vegetal apresentam desafios, devido, por um lado, ao intervalo de tempo entre os levantamentos (1980, 1994, 2007 e 2018), e, por outro, devido à adoção de metodologias diferenciadas no levantamento desses dados. Considerando a evolução das técnicas e métodos de aquisição e tratamento de dados de sensoriamento remoto, nesta pesquisa, propôs-se: i) fazer o levantamento de métodos e técnicas de tratamento de dados para fins de mapeamento e monitoramento do uso e cobertura da terra; ii) propor, aplicar e avaliar o método e técnica de mapeamento do uso e cobertura da terra na região norte de Moçambique baseado em algoritmos de aprendizado de máquinas e plataformas de computação em nuvem; iii) analisar as dinâmicas do uso e cobertura da terra na região entre o período de 2011 e 2020. Como materiais, trabalhou-se com imagens orbitais de média resolução espacial e de distribuição gratuita, associadas às imagens de alta resolução disponíveis em plataformas gratuitas (Google Earth ou outras), processadas em plataformas e softwares livre e de código aberto (Google Earth Engine/QGIS) em função das necessidades e limitações de ordem institucional, estruturais e financeiras do país. Para esta tese, optou-se pela série Landsat (2011-2020), aplicando o algoritmo Random Forest (RF) tanto para a avaliação do modelo de seleção de variáveis (Feature Selection) bem como para a classificação e refinamento dos dados por meio da abordagem por pixel na plataforma Google Earth Engine (GEE) em função da complexidade que representa o processamento de grande volume de dados. As imagens foram acessadas diretamente na plataforma GEE e foram normalizadas por ano, aplicando procedimentos tais como realce, agregação temporal pela mediana, formação das composições falsa-cor, fusão espacial, redução/remoção de nuvens, mosaico, redução de dimensionalidade através da seleção de variáveis (Feature Selection). Os dados foram processados utilizando amostras de treinamento adquiridas através dos levantamentos em campo e interpretação visual aplicando a abordagem de análise da importância das variáveis com a finalidade de serem integradas na classificação. Definidas as classes e coletadas as amostras, a classificação foi realizada aplicando o RF. Com isso, gerou-se mapas de uso e cobertura da terra para cada ano, os quais foram validados com base em amostras de validação por meio de métricas quantitativas derivadas da matriz de confusão, como acurácia global e Índice Kappa, bem como métricas ponderadas (acurácia do produtor e acurácia do usuário). Filtros espaciais e temporais foram aplicados para reduzir o efeito de "sal e pimenta" e correção dos dados ausentes. Cinco classes de uso e cobertura de terra compuseram os mapas finais, os quais apresentaram uma consistência espacial relativamente baixa para as classes agrícola e urbana devido à elevada fragmentação da paisagem. Os mapas gerados apresentaram uma acurácia global que varia de 80,93 a 88,08%, sendo que as classes área urbana e agrícola apresentaram maior confusão. Com estes resultados, foram realizadas análises estatísticas anuais a fim de detectar mudanças/transições nas classes de uso e cobertura decorridas no período em análise as quais mostraram uma estabilidade da dinâmica da vegetação para o recorte temporal 2011-2020. A abordagem metodológica utilizada responde aos desafios vigentes em Moçambique para mapeamentos sistemáticos e monitoramento do uso e cobertura da terra e pode ser utilizada para trabalhos futuros similares, minimizando as lacunas metodológicas e a amplitude temporal nos levantamentos e para apoio a políticas de desenvolvimento territorial regionalAbstract: In Mozambique, the national reference data on vegetation cover presents challenges, on the one hand due to the time interval between the surveys (1980, 1994, 2007 and 2018) and on the other, due to the adoption of different methodologies in the collection of these data. With the development and evolution of techniques and methods of acquisition and treatment of remotely sensed data, it is proposed, in this study: i) survey data processing methods and techniques for mapping and monitoring land use and land cover; ii) propose, apply and evaluate the method and technique for mapping land use and land cover in the northern region of Mozambique based on machine learning algorithms and cloud computing platform; iii) analyze the dynamics of land use and land cover in the region between 2011 and 2020. As materials, we worked with remotely sensed data of medium spatial resolution and free distribution, associated with high-resolution images available on free platforms (Google Earth or others), processed on free and open source platforms and software (Google Earth Engine/QGIS) according to the institutional, structural and financial needs and limitations of the country. For this thesis, we chose to use Landsat series data from (2011-2020), applying the Random Forest (RF) algorithm both for the evaluation of the Feature Selection model, as well as for the classification and refinement of data through the pixel approach in the Google Earth Engine (GEE) platform due to the complexity that represents the management of Big Data. The images were accessed directly on the GEE platform in which they were normalized year by year, applying procedures such as enhancement, temporal aggregation by the median, false-color compositions, spatial fusion, cloud mask, mosaic, dimensionality reduction through Feature Selection. Data were processed using training samples acquired through field surveys and visual interpretation, applying the embeded approach that consists of analyzing feature importance in order to integrate them into the classification process. After defining the classes and collecting the samples, the classification was performed using the RF. Thus, maps of land use and cover were generated for each year, which were validated based on validation samples through quantitative metrics derived from the confusion matrix, such as a global accuracy and Kappa index, as well as weighted metrics (producer’s and user’s accuracies). Spatial and temporal filters were applied to reduce the "salt and pepper" effect and correct inaccurated data. Five land use and land cover classes composed the final maps, which presented a relatively low spatial consistency for the agricultural and urban classes due to the high fragmentation of the landscape. The generated maps showed an overall accuracy that ranged from 80.93 to 88.08%, with the urban and agricultural classes showing greater confusion. With these results, annual statistical analyzes were carried out in order to detect changes/transitions on the land use and cover classes that took place in the period under analysis, which showed a stability of the vegetation dynamics for the 2011-2020 time frame. In addition, that methodological approach responds to the current challenges in Mozambique for systematic mapping and monitoring of land use and cover which can be used as reference for similar and future works and so, supporting regional development policiesDoutoradoAnálise Ambiental e Dinâmica TerritorialDoutor em GeografiaCNPQ190158/2017-4[s.n.]Bolfe, Edson Luis, 1974-Matias, Lindon FonsecaZullo Junior, JurandirSano, Edson EyjiCaldas, Marcellus MarquesUniversidade Estadual de Campinas. Instituto de GeociênciasPrograma de Pós-Graduação em GeografiaUNIVERSIDADE ESTADUAL DE CAMPINASMacarringue, Lucrêncio Silvestre, 1985-20222022-07-27T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf1 recurso online (157 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/5618MACARRINGUE, Lucrêncio Silvestre. Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020: uma abordagem baseada em aprendizado de máquina e computação em nuvem. 2022. 1 recurso online (157 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Geociências, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/5618. Acesso em: 15 mai. 2024.https://repositorio.unicamp.br/acervo/detalhe/1249815Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2022-09-20T10:16:57Zoai::1249815Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2022-09-20T10:16:57Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem Land use and land cover in the northern region of Mozambique between 2011 and 2020 : an approach based on machine learning and cloud computing |
title |
Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem |
spellingShingle |
Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem Macarringue, Lucrêncio Silvestre, 1985- Plataforma computacional Séries temporais Aprendizado de máquina Mineração de dados (Computação) Floresta aleatória Computing platform Time series Machine learning Data mining Random Forest |
title_short |
Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem |
title_full |
Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem |
title_fullStr |
Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem |
title_full_unstemmed |
Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem |
title_sort |
Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020 : uma abordagem baseada em aprendizado de máquina e computação em nuvem |
author |
Macarringue, Lucrêncio Silvestre, 1985- |
author_facet |
Macarringue, Lucrêncio Silvestre, 1985- |
author_role |
author |
dc.contributor.none.fl_str_mv |
Bolfe, Edson Luis, 1974- Matias, Lindon Fonseca Zullo Junior, Jurandir Sano, Edson Eyji Caldas, Marcellus Marques Universidade Estadual de Campinas. Instituto de Geociências Programa de Pós-Graduação em Geografia UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Macarringue, Lucrêncio Silvestre, 1985- |
dc.subject.por.fl_str_mv |
Plataforma computacional Séries temporais Aprendizado de máquina Mineração de dados (Computação) Floresta aleatória Computing platform Time series Machine learning Data mining Random Forest |
topic |
Plataforma computacional Séries temporais Aprendizado de máquina Mineração de dados (Computação) Floresta aleatória Computing platform Time series Machine learning Data mining Random Forest |
description |
Orientador: Edson Luis Bolfe |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022 2022-07-27T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/5618 MACARRINGUE, Lucrêncio Silvestre. Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020: uma abordagem baseada em aprendizado de máquina e computação em nuvem. 2022. 1 recurso online (157 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Geociências, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/5618. Acesso em: 15 mai. 2024. |
url |
https://hdl.handle.net/20.500.12733/5618 |
identifier_str_mv |
MACARRINGUE, Lucrêncio Silvestre. Uso e cobertura da terra na região norte de Moçambique entre 2011 e 2020: uma abordagem baseada em aprendizado de máquina e computação em nuvem. 2022. 1 recurso online (157 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Geociências, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/5618. Acesso em: 15 mai. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/1249815 Requisitos do sistema: Software para leitura de arquivo em PDF |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 1 recurso online (157 p.) : il., digital, arquivo PDF. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1799138572655132672 |