Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UNOESTE |
Texto Completo: | http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514 |
Resumo: | O mapeamento de rios é fundamental para o diagnóstico e planejamentos ambiental e o sensoriamento remoto tem auxiliado em investigações relacionadas a este recurso hídrico. Um método que tem ganhado atenção e auxiliado na tarefa de mapear rios é o método de aprendizagem profunda. Os métodos de aprendizagem profunda mais utilizados na tarefa de mapeamento (segmentação semântica) são baseados em arquiteturas de rede em convolução e, mais recentemente, Vision Transformers. São métodos robustos que tem apresentado uma boa performance para esse tipo de tarefa, porém, ainda existem desafios a serem superados ao mapear feições de rios estreitos. Nesse sentido, considerando a diversidade de feições de rios e ausência de uma abordagem que se aprofunde em suas características como a largura dos mesmos, o objetivo deste estudo é mapear rios com diferentes tamanhos em imagens aéreas RGB de alta resolução espacial utilizando redes profundas de segmentação semântica. Para isso, o presente trabalho buscou avaliar o desempenho de redes profundas de segmentação semântica ao identificar rios largos (largura superior a 10 metros) em imagens RGB de alta resolução espacial; caracterizar as capacidades e limitações das redes profundas de segmentação semântica em identificar rios estreitos (largura inferior a 10 metros) em imagens RGB de alta resolução espacial; e avaliar o desempenho de redes profundas de segmentação semântica baseadas em Transformers para segmentar rios, comparando-as com as redes neurais profundas tradicionais baseadas em convoluções. As imagens aéreas possuem 1 m de resolução e foram treinadas e testadas em ambiente computacional, utilizando os métodos de segmentação semântica baseados em convolução e Vision Transformer. Em seguida, os resultados foram comparados qualitativamente, por meio visual, e quantitativamente, por meio de métricas de avaliação (Acurácia, F1-Score, Precisão, Recall, IoU). Os resultados mostraram que o desempenho das redes profundas de segmentação semântica varia conforme a largura dos rios. A melhor abordagem para segmentar rios largos (superior a 10 metros) e rios estreitos (inferior a 10 metros) é usar ambos os tipos de larguras de rios no treinamento das redes profundas de segmentação semântica. Outra descoberta é que as redes profundas baseadas em Vision Transformer superaram a performance das redes profundas baseadas em convoluções para a tarefa de segmentação semântica de rios largos e estreitos em imagens RGB de 1 m de resolução. O SegFormer superou as métricas de avaliação para segmentação de rios com um F1-Score cima de 98%. Os trabalhos futuros devem continuar investigando as redes profundas baseadas em Vision Transformer, podendo explorar imagens multi-temporais e multimodais, a fim de melhorar o monitoramento de recursos hídricos. |
id |
UOES_c4dc3910c471bec53ba71019bd771f3c |
---|---|
oai_identifier_str |
oai:bdtd.unoeste.br:jspui/1514 |
network_acronym_str |
UOES |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UNOESTE |
repository_id_str |
|
spelling |
Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacialDeep Learning in Semantic Segmentation of Rivers in High Spatial Resolution ImagesMapeamento de corpos d’águaSensoriamento RemotoRedes de aprendizagem profundaMapping of water bodiesRemote sensingDeep learning networksOUTROS::CIENCIASO mapeamento de rios é fundamental para o diagnóstico e planejamentos ambiental e o sensoriamento remoto tem auxiliado em investigações relacionadas a este recurso hídrico. Um método que tem ganhado atenção e auxiliado na tarefa de mapear rios é o método de aprendizagem profunda. Os métodos de aprendizagem profunda mais utilizados na tarefa de mapeamento (segmentação semântica) são baseados em arquiteturas de rede em convolução e, mais recentemente, Vision Transformers. São métodos robustos que tem apresentado uma boa performance para esse tipo de tarefa, porém, ainda existem desafios a serem superados ao mapear feições de rios estreitos. Nesse sentido, considerando a diversidade de feições de rios e ausência de uma abordagem que se aprofunde em suas características como a largura dos mesmos, o objetivo deste estudo é mapear rios com diferentes tamanhos em imagens aéreas RGB de alta resolução espacial utilizando redes profundas de segmentação semântica. Para isso, o presente trabalho buscou avaliar o desempenho de redes profundas de segmentação semântica ao identificar rios largos (largura superior a 10 metros) em imagens RGB de alta resolução espacial; caracterizar as capacidades e limitações das redes profundas de segmentação semântica em identificar rios estreitos (largura inferior a 10 metros) em imagens RGB de alta resolução espacial; e avaliar o desempenho de redes profundas de segmentação semântica baseadas em Transformers para segmentar rios, comparando-as com as redes neurais profundas tradicionais baseadas em convoluções. As imagens aéreas possuem 1 m de resolução e foram treinadas e testadas em ambiente computacional, utilizando os métodos de segmentação semântica baseados em convolução e Vision Transformer. Em seguida, os resultados foram comparados qualitativamente, por meio visual, e quantitativamente, por meio de métricas de avaliação (Acurácia, F1-Score, Precisão, Recall, IoU). Os resultados mostraram que o desempenho das redes profundas de segmentação semântica varia conforme a largura dos rios. A melhor abordagem para segmentar rios largos (superior a 10 metros) e rios estreitos (inferior a 10 metros) é usar ambos os tipos de larguras de rios no treinamento das redes profundas de segmentação semântica. Outra descoberta é que as redes profundas baseadas em Vision Transformer superaram a performance das redes profundas baseadas em convoluções para a tarefa de segmentação semântica de rios largos e estreitos em imagens RGB de 1 m de resolução. O SegFormer superou as métricas de avaliação para segmentação de rios com um F1-Score cima de 98%. Os trabalhos futuros devem continuar investigando as redes profundas baseadas em Vision Transformer, podendo explorar imagens multi-temporais e multimodais, a fim de melhorar o monitoramento de recursos hídricos.Mapping rivers is essential for diagnosis and environmental planning, and remote sensing has helped in research related to this water resource. A method that has gained attention and helped in the task of mapping rivers is the deep learning method. The most used deep learning methods in the mapping task (semantic segmentation) are based on convolutional network architectures (CNN - Convolutional Neural Networks) and, more recently, Vision Transformers. They are robust methods that have shown good performance for this type of task, however, there are still challenges to be overcome when mapping features of narrow rivers. In this sense, considering the diversity of river features and the absence of an approach that goes deeper into their characteristics such as their width, the objective of this study is to map rivers with different sizes in RGB aerial images of high spatial resolution using deep segmentation networks semantics. For this, the present work sought to evaluate the performance of deep semantic segmentation networks when identifying large rivers (width greater than 10 m) in RGB images of high spatial resolution; characterize the capabilities and limits of deep semantic segmentation networks to identify narrow rivers (width less than 10 m) in high spatial resolution RGB images; and to evaluate the performance of deep semantic segmentation networks experimented in Vision Transformer to segment rivers, comparing them with traditional neural networks experimented in convolutions. The aerial images have 1 m of resolution and were trained and tested in a computational environment, using semantic segmentation methods based on convolution and Vision Transformer. Then, the results were compared qualitatively, visually, and quantitatively, using evaluation metrics (Accuracy, F1-Score, Precision, Recall, IoU). The results appreciated that the performance of deep semantic segmentation networks varies according to the width of the rivers. The best approach to segmenting large rivers (greater than 10 m) and narrow rivers (less than 10 m) is to use both river widths to train the deep semantic segmentation networks. Another finding is that the deep networks in Vision Transformers outperformed the deep networks in convolutions for the semantic segmentation task of large and narrow rivers in RGB images of 1 m resolution. SegFormer outperformed as evaluation indicators for river segmentation with an F1-Score above 98%. Future work should continue to investigate the aspiring deep networks in Vision Transformers, being able to explore multitemporal and multimodal images, in order to improve the monitoring of water resources.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESUniversidade do Oeste PaulistaDoutorado em Meio Ambiente e Desenvolvimento RegionalBrasilUNOESTEDoutorado em Meio Ambiente e Desenvolvimento RegionalRamos, Ana Paula Marqueshttps://orcid.org/0000-0001-6633-2903http://lattes.cnpq.br/9006947238035954Alves, Marcelo Rodrigohttp://lattes.cnpq.br/8257691552745291Osco, Lucas Pradohttps://orcid.org/0000-0002-0258-536Xhttp://lattes.cnpq.br/7723347042259816Marcato Júnior, Joséhttps://orcid.org/0000-0002-9096-6866http://lattes.cnpq.br/1054922336409334Mendes, Tatiana Sussel Gonçalveshttp://lattes.cnpq.br/3219252827913286PINHEIRO, MAYARA MAEZANO FAITA2023-08-25T18:32:10Z2023-02-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfPINHEIRO, M. M. F. Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial. 2023. 102 f. Tese (Doutorado em Meio Ambiente e Desenvolvimento Regional)- Universidade do Oeste Paulista, Presidente Prudente, 2023.http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514porhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UNOESTEinstname:Universidade do Oeste Paulista (UNOESTE)instacron:UNOESTE2023-08-26T04:01:48Zoai:bdtd.unoeste.br:jspui/1514Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.unoeste.br:8080/jspui/PUBhttp://bdtd.unoeste.br:8080/oai/requestbdtd@unoeste.bropendoar:2023-08-26T04:01:48Biblioteca Digital de Teses e Dissertações da UNOESTE - Universidade do Oeste Paulista (UNOESTE)false |
dc.title.none.fl_str_mv |
Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial Deep Learning in Semantic Segmentation of Rivers in High Spatial Resolution Images |
title |
Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial |
spellingShingle |
Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial PINHEIRO, MAYARA MAEZANO FAITA Mapeamento de corpos d’água Sensoriamento Remoto Redes de aprendizagem profunda Mapping of water bodies Remote sensing Deep learning networks OUTROS::CIENCIAS |
title_short |
Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial |
title_full |
Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial |
title_fullStr |
Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial |
title_full_unstemmed |
Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial |
title_sort |
Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial |
author |
PINHEIRO, MAYARA MAEZANO FAITA |
author_facet |
PINHEIRO, MAYARA MAEZANO FAITA |
author_role |
author |
dc.contributor.none.fl_str_mv |
Ramos, Ana Paula Marques https://orcid.org/0000-0001-6633-2903 http://lattes.cnpq.br/9006947238035954 Alves, Marcelo Rodrigo http://lattes.cnpq.br/8257691552745291 Osco, Lucas Prado https://orcid.org/0000-0002-0258-536X http://lattes.cnpq.br/7723347042259816 Marcato Júnior, José https://orcid.org/0000-0002-9096-6866 http://lattes.cnpq.br/1054922336409334 Mendes, Tatiana Sussel Gonçalves http://lattes.cnpq.br/3219252827913286 |
dc.contributor.author.fl_str_mv |
PINHEIRO, MAYARA MAEZANO FAITA |
dc.subject.por.fl_str_mv |
Mapeamento de corpos d’água Sensoriamento Remoto Redes de aprendizagem profunda Mapping of water bodies Remote sensing Deep learning networks OUTROS::CIENCIAS |
topic |
Mapeamento de corpos d’água Sensoriamento Remoto Redes de aprendizagem profunda Mapping of water bodies Remote sensing Deep learning networks OUTROS::CIENCIAS |
description |
O mapeamento de rios é fundamental para o diagnóstico e planejamentos ambiental e o sensoriamento remoto tem auxiliado em investigações relacionadas a este recurso hídrico. Um método que tem ganhado atenção e auxiliado na tarefa de mapear rios é o método de aprendizagem profunda. Os métodos de aprendizagem profunda mais utilizados na tarefa de mapeamento (segmentação semântica) são baseados em arquiteturas de rede em convolução e, mais recentemente, Vision Transformers. São métodos robustos que tem apresentado uma boa performance para esse tipo de tarefa, porém, ainda existem desafios a serem superados ao mapear feições de rios estreitos. Nesse sentido, considerando a diversidade de feições de rios e ausência de uma abordagem que se aprofunde em suas características como a largura dos mesmos, o objetivo deste estudo é mapear rios com diferentes tamanhos em imagens aéreas RGB de alta resolução espacial utilizando redes profundas de segmentação semântica. Para isso, o presente trabalho buscou avaliar o desempenho de redes profundas de segmentação semântica ao identificar rios largos (largura superior a 10 metros) em imagens RGB de alta resolução espacial; caracterizar as capacidades e limitações das redes profundas de segmentação semântica em identificar rios estreitos (largura inferior a 10 metros) em imagens RGB de alta resolução espacial; e avaliar o desempenho de redes profundas de segmentação semântica baseadas em Transformers para segmentar rios, comparando-as com as redes neurais profundas tradicionais baseadas em convoluções. As imagens aéreas possuem 1 m de resolução e foram treinadas e testadas em ambiente computacional, utilizando os métodos de segmentação semântica baseados em convolução e Vision Transformer. Em seguida, os resultados foram comparados qualitativamente, por meio visual, e quantitativamente, por meio de métricas de avaliação (Acurácia, F1-Score, Precisão, Recall, IoU). Os resultados mostraram que o desempenho das redes profundas de segmentação semântica varia conforme a largura dos rios. A melhor abordagem para segmentar rios largos (superior a 10 metros) e rios estreitos (inferior a 10 metros) é usar ambos os tipos de larguras de rios no treinamento das redes profundas de segmentação semântica. Outra descoberta é que as redes profundas baseadas em Vision Transformer superaram a performance das redes profundas baseadas em convoluções para a tarefa de segmentação semântica de rios largos e estreitos em imagens RGB de 1 m de resolução. O SegFormer superou as métricas de avaliação para segmentação de rios com um F1-Score cima de 98%. Os trabalhos futuros devem continuar investigando as redes profundas baseadas em Vision Transformer, podendo explorar imagens multi-temporais e multimodais, a fim de melhorar o monitoramento de recursos hídricos. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-08-25T18:32:10Z 2023-02-24 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
PINHEIRO, M. M. F. Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial. 2023. 102 f. Tese (Doutorado em Meio Ambiente e Desenvolvimento Regional)- Universidade do Oeste Paulista, Presidente Prudente, 2023. http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514 |
identifier_str_mv |
PINHEIRO, M. M. F. Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial. 2023. 102 f. Tese (Doutorado em Meio Ambiente e Desenvolvimento Regional)- Universidade do Oeste Paulista, Presidente Prudente, 2023. |
url |
http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade do Oeste Paulista Doutorado em Meio Ambiente e Desenvolvimento Regional Brasil UNOESTE Doutorado em Meio Ambiente e Desenvolvimento Regional |
publisher.none.fl_str_mv |
Universidade do Oeste Paulista Doutorado em Meio Ambiente e Desenvolvimento Regional Brasil UNOESTE Doutorado em Meio Ambiente e Desenvolvimento Regional |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UNOESTE instname:Universidade do Oeste Paulista (UNOESTE) instacron:UNOESTE |
instname_str |
Universidade do Oeste Paulista (UNOESTE) |
instacron_str |
UNOESTE |
institution |
UNOESTE |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UNOESTE |
collection |
Biblioteca Digital de Teses e Dissertações da UNOESTE |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UNOESTE - Universidade do Oeste Paulista (UNOESTE) |
repository.mail.fl_str_mv |
bdtd@unoeste.br |
_version_ |
1811100156532097024 |