Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial

Detalhes bibliográficos
Autor(a) principal: PINHEIRO, MAYARA MAEZANO FAITA
Data de Publicação: 2023
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UNOESTE
Texto Completo: http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514
Resumo: O mapeamento de rios é fundamental para o diagnóstico e planejamentos ambiental e o sensoriamento remoto tem auxiliado em investigações relacionadas a este recurso hídrico. Um método que tem ganhado atenção e auxiliado na tarefa de mapear rios é o método de aprendizagem profunda. Os métodos de aprendizagem profunda mais utilizados na tarefa de mapeamento (segmentação semântica) são baseados em arquiteturas de rede em convolução e, mais recentemente, Vision Transformers. São métodos robustos que tem apresentado uma boa performance para esse tipo de tarefa, porém, ainda existem desafios a serem superados ao mapear feições de rios estreitos. Nesse sentido, considerando a diversidade de feições de rios e ausência de uma abordagem que se aprofunde em suas características como a largura dos mesmos, o objetivo deste estudo é mapear rios com diferentes tamanhos em imagens aéreas RGB de alta resolução espacial utilizando redes profundas de segmentação semântica. Para isso, o presente trabalho buscou avaliar o desempenho de redes profundas de segmentação semântica ao identificar rios largos (largura superior a 10 metros) em imagens RGB de alta resolução espacial; caracterizar as capacidades e limitações das redes profundas de segmentação semântica em identificar rios estreitos (largura inferior a 10 metros) em imagens RGB de alta resolução espacial; e avaliar o desempenho de redes profundas de segmentação semântica baseadas em Transformers para segmentar rios, comparando-as com as redes neurais profundas tradicionais baseadas em convoluções. As imagens aéreas possuem 1 m de resolução e foram treinadas e testadas em ambiente computacional, utilizando os métodos de segmentação semântica baseados em convolução e Vision Transformer. Em seguida, os resultados foram comparados qualitativamente, por meio visual, e quantitativamente, por meio de métricas de avaliação (Acurácia, F1-Score, Precisão, Recall, IoU). Os resultados mostraram que o desempenho das redes profundas de segmentação semântica varia conforme a largura dos rios. A melhor abordagem para segmentar rios largos (superior a 10 metros) e rios estreitos (inferior a 10 metros) é usar ambos os tipos de larguras de rios no treinamento das redes profundas de segmentação semântica. Outra descoberta é que as redes profundas baseadas em Vision Transformer superaram a performance das redes profundas baseadas em convoluções para a tarefa de segmentação semântica de rios largos e estreitos em imagens RGB de 1 m de resolução. O SegFormer superou as métricas de avaliação para segmentação de rios com um F1-Score cima de 98%. Os trabalhos futuros devem continuar investigando as redes profundas baseadas em Vision Transformer, podendo explorar imagens multi-temporais e multimodais, a fim de melhorar o monitoramento de recursos hídricos.
id UOES_c4dc3910c471bec53ba71019bd771f3c
oai_identifier_str oai:bdtd.unoeste.br:jspui/1514
network_acronym_str UOES
network_name_str Biblioteca Digital de Teses e Dissertações da UNOESTE
repository_id_str
spelling Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacialDeep Learning in Semantic Segmentation of Rivers in High Spatial Resolution ImagesMapeamento de corpos d’águaSensoriamento RemotoRedes de aprendizagem profundaMapping of water bodiesRemote sensingDeep learning networksOUTROS::CIENCIASO mapeamento de rios é fundamental para o diagnóstico e planejamentos ambiental e o sensoriamento remoto tem auxiliado em investigações relacionadas a este recurso hídrico. Um método que tem ganhado atenção e auxiliado na tarefa de mapear rios é o método de aprendizagem profunda. Os métodos de aprendizagem profunda mais utilizados na tarefa de mapeamento (segmentação semântica) são baseados em arquiteturas de rede em convolução e, mais recentemente, Vision Transformers. São métodos robustos que tem apresentado uma boa performance para esse tipo de tarefa, porém, ainda existem desafios a serem superados ao mapear feições de rios estreitos. Nesse sentido, considerando a diversidade de feições de rios e ausência de uma abordagem que se aprofunde em suas características como a largura dos mesmos, o objetivo deste estudo é mapear rios com diferentes tamanhos em imagens aéreas RGB de alta resolução espacial utilizando redes profundas de segmentação semântica. Para isso, o presente trabalho buscou avaliar o desempenho de redes profundas de segmentação semântica ao identificar rios largos (largura superior a 10 metros) em imagens RGB de alta resolução espacial; caracterizar as capacidades e limitações das redes profundas de segmentação semântica em identificar rios estreitos (largura inferior a 10 metros) em imagens RGB de alta resolução espacial; e avaliar o desempenho de redes profundas de segmentação semântica baseadas em Transformers para segmentar rios, comparando-as com as redes neurais profundas tradicionais baseadas em convoluções. As imagens aéreas possuem 1 m de resolução e foram treinadas e testadas em ambiente computacional, utilizando os métodos de segmentação semântica baseados em convolução e Vision Transformer. Em seguida, os resultados foram comparados qualitativamente, por meio visual, e quantitativamente, por meio de métricas de avaliação (Acurácia, F1-Score, Precisão, Recall, IoU). Os resultados mostraram que o desempenho das redes profundas de segmentação semântica varia conforme a largura dos rios. A melhor abordagem para segmentar rios largos (superior a 10 metros) e rios estreitos (inferior a 10 metros) é usar ambos os tipos de larguras de rios no treinamento das redes profundas de segmentação semântica. Outra descoberta é que as redes profundas baseadas em Vision Transformer superaram a performance das redes profundas baseadas em convoluções para a tarefa de segmentação semântica de rios largos e estreitos em imagens RGB de 1 m de resolução. O SegFormer superou as métricas de avaliação para segmentação de rios com um F1-Score cima de 98%. Os trabalhos futuros devem continuar investigando as redes profundas baseadas em Vision Transformer, podendo explorar imagens multi-temporais e multimodais, a fim de melhorar o monitoramento de recursos hídricos.Mapping rivers is essential for diagnosis and environmental planning, and remote sensing has helped in research related to this water resource. A method that has gained attention and helped in the task of mapping rivers is the deep learning method. The most used deep learning methods in the mapping task (semantic segmentation) are based on convolutional network architectures (CNN - Convolutional Neural Networks) and, more recently, Vision Transformers. They are robust methods that have shown good performance for this type of task, however, there are still challenges to be overcome when mapping features of narrow rivers. In this sense, considering the diversity of river features and the absence of an approach that goes deeper into their characteristics such as their width, the objective of this study is to map rivers with different sizes in RGB aerial images of high spatial resolution using deep segmentation networks semantics. For this, the present work sought to evaluate the performance of deep semantic segmentation networks when identifying large rivers (width greater than 10 m) in RGB images of high spatial resolution; characterize the capabilities and limits of deep semantic segmentation networks to identify narrow rivers (width less than 10 m) in high spatial resolution RGB images; and to evaluate the performance of deep semantic segmentation networks experimented in Vision Transformer to segment rivers, comparing them with traditional neural networks experimented in convolutions. The aerial images have 1 m of resolution and were trained and tested in a computational environment, using semantic segmentation methods based on convolution and Vision Transformer. Then, the results were compared qualitatively, visually, and quantitatively, using evaluation metrics (Accuracy, F1-Score, Precision, Recall, IoU). The results appreciated that the performance of deep semantic segmentation networks varies according to the width of the rivers. The best approach to segmenting large rivers (greater than 10 m) and narrow rivers (less than 10 m) is to use both river widths to train the deep semantic segmentation networks. Another finding is that the deep networks in Vision Transformers outperformed the deep networks in convolutions for the semantic segmentation task of large and narrow rivers in RGB images of 1 m resolution. SegFormer outperformed as evaluation indicators for river segmentation with an F1-Score above 98%. Future work should continue to investigate the aspiring deep networks in Vision Transformers, being able to explore multitemporal and multimodal images, in order to improve the monitoring of water resources.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESUniversidade do Oeste PaulistaDoutorado em Meio Ambiente e Desenvolvimento RegionalBrasilUNOESTEDoutorado em Meio Ambiente e Desenvolvimento RegionalRamos, Ana Paula Marqueshttps://orcid.org/0000-0001-6633-2903http://lattes.cnpq.br/9006947238035954Alves, Marcelo Rodrigohttp://lattes.cnpq.br/8257691552745291Osco, Lucas Pradohttps://orcid.org/0000-0002-0258-536Xhttp://lattes.cnpq.br/7723347042259816Marcato Júnior, Joséhttps://orcid.org/0000-0002-9096-6866http://lattes.cnpq.br/1054922336409334Mendes, Tatiana Sussel Gonçalveshttp://lattes.cnpq.br/3219252827913286PINHEIRO, MAYARA MAEZANO FAITA2023-08-25T18:32:10Z2023-02-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfPINHEIRO, M. M. F. Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial. 2023. 102 f. Tese (Doutorado em Meio Ambiente e Desenvolvimento Regional)- Universidade do Oeste Paulista, Presidente Prudente, 2023.http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514porhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UNOESTEinstname:Universidade do Oeste Paulista (UNOESTE)instacron:UNOESTE2023-08-26T04:01:48Zoai:bdtd.unoeste.br:jspui/1514Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.unoeste.br:8080/jspui/PUBhttp://bdtd.unoeste.br:8080/oai/requestbdtd@unoeste.bropendoar:2023-08-26T04:01:48Biblioteca Digital de Teses e Dissertações da UNOESTE - Universidade do Oeste Paulista (UNOESTE)false
dc.title.none.fl_str_mv Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
Deep Learning in Semantic Segmentation of Rivers in High Spatial Resolution Images
title Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
spellingShingle Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
PINHEIRO, MAYARA MAEZANO FAITA
Mapeamento de corpos d’água
Sensoriamento Remoto
Redes de aprendizagem profunda
Mapping of water bodies
Remote sensing
Deep learning networks
OUTROS::CIENCIAS
title_short Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
title_full Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
title_fullStr Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
title_full_unstemmed Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
title_sort Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
author PINHEIRO, MAYARA MAEZANO FAITA
author_facet PINHEIRO, MAYARA MAEZANO FAITA
author_role author
dc.contributor.none.fl_str_mv Ramos, Ana Paula Marques
https://orcid.org/0000-0001-6633-2903
http://lattes.cnpq.br/9006947238035954
Alves, Marcelo Rodrigo
http://lattes.cnpq.br/8257691552745291
Osco, Lucas Prado
https://orcid.org/0000-0002-0258-536X
http://lattes.cnpq.br/7723347042259816
Marcato Júnior, José
https://orcid.org/0000-0002-9096-6866
http://lattes.cnpq.br/1054922336409334
Mendes, Tatiana Sussel Gonçalves
http://lattes.cnpq.br/3219252827913286
dc.contributor.author.fl_str_mv PINHEIRO, MAYARA MAEZANO FAITA
dc.subject.por.fl_str_mv Mapeamento de corpos d’água
Sensoriamento Remoto
Redes de aprendizagem profunda
Mapping of water bodies
Remote sensing
Deep learning networks
OUTROS::CIENCIAS
topic Mapeamento de corpos d’água
Sensoriamento Remoto
Redes de aprendizagem profunda
Mapping of water bodies
Remote sensing
Deep learning networks
OUTROS::CIENCIAS
description O mapeamento de rios é fundamental para o diagnóstico e planejamentos ambiental e o sensoriamento remoto tem auxiliado em investigações relacionadas a este recurso hídrico. Um método que tem ganhado atenção e auxiliado na tarefa de mapear rios é o método de aprendizagem profunda. Os métodos de aprendizagem profunda mais utilizados na tarefa de mapeamento (segmentação semântica) são baseados em arquiteturas de rede em convolução e, mais recentemente, Vision Transformers. São métodos robustos que tem apresentado uma boa performance para esse tipo de tarefa, porém, ainda existem desafios a serem superados ao mapear feições de rios estreitos. Nesse sentido, considerando a diversidade de feições de rios e ausência de uma abordagem que se aprofunde em suas características como a largura dos mesmos, o objetivo deste estudo é mapear rios com diferentes tamanhos em imagens aéreas RGB de alta resolução espacial utilizando redes profundas de segmentação semântica. Para isso, o presente trabalho buscou avaliar o desempenho de redes profundas de segmentação semântica ao identificar rios largos (largura superior a 10 metros) em imagens RGB de alta resolução espacial; caracterizar as capacidades e limitações das redes profundas de segmentação semântica em identificar rios estreitos (largura inferior a 10 metros) em imagens RGB de alta resolução espacial; e avaliar o desempenho de redes profundas de segmentação semântica baseadas em Transformers para segmentar rios, comparando-as com as redes neurais profundas tradicionais baseadas em convoluções. As imagens aéreas possuem 1 m de resolução e foram treinadas e testadas em ambiente computacional, utilizando os métodos de segmentação semântica baseados em convolução e Vision Transformer. Em seguida, os resultados foram comparados qualitativamente, por meio visual, e quantitativamente, por meio de métricas de avaliação (Acurácia, F1-Score, Precisão, Recall, IoU). Os resultados mostraram que o desempenho das redes profundas de segmentação semântica varia conforme a largura dos rios. A melhor abordagem para segmentar rios largos (superior a 10 metros) e rios estreitos (inferior a 10 metros) é usar ambos os tipos de larguras de rios no treinamento das redes profundas de segmentação semântica. Outra descoberta é que as redes profundas baseadas em Vision Transformer superaram a performance das redes profundas baseadas em convoluções para a tarefa de segmentação semântica de rios largos e estreitos em imagens RGB de 1 m de resolução. O SegFormer superou as métricas de avaliação para segmentação de rios com um F1-Score cima de 98%. Os trabalhos futuros devem continuar investigando as redes profundas baseadas em Vision Transformer, podendo explorar imagens multi-temporais e multimodais, a fim de melhorar o monitoramento de recursos hídricos.
publishDate 2023
dc.date.none.fl_str_mv 2023-08-25T18:32:10Z
2023-02-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PINHEIRO, M. M. F. Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial. 2023. 102 f. Tese (Doutorado em Meio Ambiente e Desenvolvimento Regional)- Universidade do Oeste Paulista, Presidente Prudente, 2023.
http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514
identifier_str_mv PINHEIRO, M. M. F. Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial. 2023. 102 f. Tese (Doutorado em Meio Ambiente e Desenvolvimento Regional)- Universidade do Oeste Paulista, Presidente Prudente, 2023.
url http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade do Oeste Paulista
Doutorado em Meio Ambiente e Desenvolvimento Regional
Brasil
UNOESTE
Doutorado em Meio Ambiente e Desenvolvimento Regional
publisher.none.fl_str_mv Universidade do Oeste Paulista
Doutorado em Meio Ambiente e Desenvolvimento Regional
Brasil
UNOESTE
Doutorado em Meio Ambiente e Desenvolvimento Regional
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UNOESTE
instname:Universidade do Oeste Paulista (UNOESTE)
instacron:UNOESTE
instname_str Universidade do Oeste Paulista (UNOESTE)
instacron_str UNOESTE
institution UNOESTE
reponame_str Biblioteca Digital de Teses e Dissertações da UNOESTE
collection Biblioteca Digital de Teses e Dissertações da UNOESTE
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UNOESTE - Universidade do Oeste Paulista (UNOESTE)
repository.mail.fl_str_mv bdtd@unoeste.br
_version_ 1811100156532097024