Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial

PINHEIRO, MAYARA MAEZANO FAITA

Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial

Detalhes bibliográficos
Autor(a) principal:	PINHEIRO, MAYARA MAEZANO FAITA
Data de Publicação:	2023
Tipo de documento:	Tese
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da UNOESTE
Texto Completo:	http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514
Resumo:	O mapeamento de rios é fundamental para o diagnóstico e planejamentos ambiental e o sensoriamento remoto tem auxiliado em investigações relacionadas a este recurso hídrico. Um método que tem ganhado atenção e auxiliado na tarefa de mapear rios é o método de aprendizagem profunda. Os métodos de aprendizagem profunda mais utilizados na tarefa de mapeamento (segmentação semântica) são baseados em arquiteturas de rede em convolução e, mais recentemente, Vision Transformers. São métodos robustos que tem apresentado uma boa performance para esse tipo de tarefa, porém, ainda existem desafios a serem superados ao mapear feições de rios estreitos. Nesse sentido, considerando a diversidade de feições de rios e ausência de uma abordagem que se aprofunde em suas características como a largura dos mesmos, o objetivo deste estudo é mapear rios com diferentes tamanhos em imagens aéreas RGB de alta resolução espacial utilizando redes profundas de segmentação semântica. Para isso, o presente trabalho buscou avaliar o desempenho de redes profundas de segmentação semântica ao identificar rios largos (largura superior a 10 metros) em imagens RGB de alta resolução espacial; caracterizar as capacidades e limitações das redes profundas de segmentação semântica em identificar rios estreitos (largura inferior a 10 metros) em imagens RGB de alta resolução espacial; e avaliar o desempenho de redes profundas de segmentação semântica baseadas em Transformers para segmentar rios, comparando-as com as redes neurais profundas tradicionais baseadas em convoluções. As imagens aéreas possuem 1 m de resolução e foram treinadas e testadas em ambiente computacional, utilizando os métodos de segmentação semântica baseados em convolução e Vision Transformer. Em seguida, os resultados foram comparados qualitativamente, por meio visual, e quantitativamente, por meio de métricas de avaliação (Acurácia, F1-Score, Precisão, Recall, IoU). Os resultados mostraram que o desempenho das redes profundas de segmentação semântica varia conforme a largura dos rios. A melhor abordagem para segmentar rios largos (superior a 10 metros) e rios estreitos (inferior a 10 metros) é usar ambos os tipos de larguras de rios no treinamento das redes profundas de segmentação semântica. Outra descoberta é que as redes profundas baseadas em Vision Transformer superaram a performance das redes profundas baseadas em convoluções para a tarefa de segmentação semântica de rios largos e estreitos em imagens RGB de 1 m de resolução. O SegFormer superou as métricas de avaliação para segmentação de rios com um F1-Score cima de 98%. Os trabalhos futuros devem continuar investigando as redes profundas baseadas em Vision Transformer, podendo explorar imagens multi-temporais e multimodais, a fim de melhorar o monitoramento de recursos hídricos.

Metadados do item

id	UOES_c4dc3910c471bec53ba71019bd771f3c
oai_identifier_str	oai:bdtd.unoeste.br:jspui/1514
network_acronym_str	UOES
network_name_str	Biblioteca Digital de Teses e Dissertações da UNOESTE
repository_id_str
spelling	Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacialDeep Learning in Semantic Segmentation of Rivers in High Spatial Resolution ImagesMapeamento de corpos d’águaSensoriamento RemotoRedes de aprendizagem profundaMapping of water bodiesRemote sensingDeep learning networksOUTROS::CIENCIASO mapeamento de rios é fundamental para o diagnóstico e planejamentos ambiental e o sensoriamento remoto tem auxiliado em investigações relacionadas a este recurso hídrico. Um método que tem ganhado atenção e auxiliado na tarefa de mapear rios é o método de aprendizagem profunda. Os métodos de aprendizagem profunda mais utilizados na tarefa de mapeamento (segmentação semântica) são baseados em arquiteturas de rede em convolução e, mais recentemente, Vision Transformers. São métodos robustos que tem apresentado uma boa performance para esse tipo de tarefa, porém, ainda existem desafios a serem superados ao mapear feições de rios estreitos. Nesse sentido, considerando a diversidade de feições de rios e ausência de uma abordagem que se aprofunde em suas características como a largura dos mesmos, o objetivo deste estudo é mapear rios com diferentes tamanhos em imagens aéreas RGB de alta resolução espacial utilizando redes profundas de segmentação semântica. Para isso, o presente trabalho buscou avaliar o desempenho de redes profundas de segmentação semântica ao identificar rios largos (largura superior a 10 metros) em imagens RGB de alta resolução espacial; caracterizar as capacidades e limitações das redes profundas de segmentação semântica em identificar rios estreitos (largura inferior a 10 metros) em imagens RGB de alta resolução espacial; e avaliar o desempenho de redes profundas de segmentação semântica baseadas em Transformers para segmentar rios, comparando-as com as redes neurais profundas tradicionais baseadas em convoluções. As imagens aéreas possuem 1 m de resolução e foram treinadas e testadas em ambiente computacional, utilizando os métodos de segmentação semântica baseados em convolução e Vision Transformer. Em seguida, os resultados foram comparados qualitativamente, por meio visual, e quantitativamente, por meio de métricas de avaliação (Acurácia, F1-Score, Precisão, Recall, IoU). Os resultados mostraram que o desempenho das redes profundas de segmentação semântica varia conforme a largura dos rios. A melhor abordagem para segmentar rios largos (superior a 10 metros) e rios estreitos (inferior a 10 metros) é usar ambos os tipos de larguras de rios no treinamento das redes profundas de segmentação semântica. Outra descoberta é que as redes profundas baseadas em Vision Transformer superaram a performance das redes profundas baseadas em convoluções para a tarefa de segmentação semântica de rios largos e estreitos em imagens RGB de 1 m de resolução. O SegFormer superou as métricas de avaliação para segmentação de rios com um F1-Score cima de 98%. Os trabalhos futuros devem continuar investigando as redes profundas baseadas em Vision Transformer, podendo explorar imagens multi-temporais e multimodais, a fim de melhorar o monitoramento de recursos hídricos.Mapping rivers is essential for diagnosis and environmental planning, and remote sensing has helped in research related to this water resource. A method that has gained attention and helped in the task of mapping rivers is the deep learning method. The most used deep learning methods in the mapping task (semantic segmentation) are based on convolutional network architectures (CNN - Convolutional Neural Networks) and, more recently, Vision Transformers. They are robust methods that have shown good performance for this type of task, however, there are still challenges to be overcome when mapping features of narrow rivers. In this sense, considering the diversity of river features and the absence of an approach that goes deeper into their characteristics such as their width, the objective of this study is to map rivers with different sizes in RGB aerial images of high spatial resolution using deep segmentation networks semantics. For this, the present work sought to evaluate the performance of deep semantic segmentation networks when identifying large rivers (width greater than 10 m) in RGB images of high spatial resolution; characterize the capabilities and limits of deep semantic segmentation networks to identify narrow rivers (width less than 10 m) in high spatial resolution RGB images; and to evaluate the performance of deep semantic segmentation networks experimented in Vision Transformer to segment rivers, comparing them with traditional neural networks experimented in convolutions. The aerial images have 1 m of resolution and were trained and tested in a computational environment, using semantic segmentation methods based on convolution and Vision Transformer. Then, the results were compared qualitatively, visually, and quantitatively, using evaluation metrics (Accuracy, F1-Score, Precision, Recall, IoU). The results appreciated that the performance of deep semantic segmentation networks varies according to the width of the rivers. The best approach to segmenting large rivers (greater than 10 m) and narrow rivers (less than 10 m) is to use both river widths to train the deep semantic segmentation networks. Another finding is that the deep networks in Vision Transformers outperformed the deep networks in convolutions for the semantic segmentation task of large and narrow rivers in RGB images of 1 m resolution. SegFormer outperformed as evaluation indicators for river segmentation with an F1-Score above 98%. Future work should continue to investigate the aspiring deep networks in Vision Transformers, being able to explore multitemporal and multimodal images, in order to improve the monitoring of water resources.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESUniversidade do Oeste PaulistaDoutorado em Meio Ambiente e Desenvolvimento RegionalBrasilUNOESTEDoutorado em Meio Ambiente e Desenvolvimento RegionalRamos, Ana Paula Marqueshttps://orcid.org/0000-0001-6633-2903http://lattes.cnpq.br/9006947238035954Alves, Marcelo Rodrigohttp://lattes.cnpq.br/8257691552745291Osco, Lucas Pradohttps://orcid.org/0000-0002-0258-536Xhttp://lattes.cnpq.br/7723347042259816Marcato Júnior, Joséhttps://orcid.org/0000-0002-9096-6866http://lattes.cnpq.br/1054922336409334Mendes, Tatiana Sussel Gonçalveshttp://lattes.cnpq.br/3219252827913286PINHEIRO, MAYARA MAEZANO FAITA2023-08-25T18:32:10Z2023-02-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfPINHEIRO, M. M. F. Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial. 2023. 102 f. Tese (Doutorado em Meio Ambiente e Desenvolvimento Regional)- Universidade do Oeste Paulista, Presidente Prudente, 2023.http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514porhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UNOESTEinstname:Universidade do Oeste Paulista (UNOESTE)instacron:UNOESTE2023-08-26T04:01:48Zoai:bdtd.unoeste.br:jspui/1514Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.unoeste.br:8080/jspui/PUBhttp://bdtd.unoeste.br:8080/oai/requestbdtd@unoeste.bropendoar:2023-08-26T04:01:48Biblioteca Digital de Teses e Dissertações da UNOESTE - Universidade do Oeste Paulista (UNOESTE)false
dc.title.none.fl_str_mv	Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial Deep Learning in Semantic Segmentation of Rivers in High Spatial Resolution Images
title	Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
spellingShingle	Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial PINHEIRO, MAYARA MAEZANO FAITA Mapeamento de corpos d’água Sensoriamento Remoto Redes de aprendizagem profunda Mapping of water bodies Remote sensing Deep learning networks OUTROS::CIENCIAS
title_short	Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
title_full	Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
title_fullStr	Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
title_full_unstemmed	Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
title_sort	Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
author	PINHEIRO, MAYARA MAEZANO FAITA
author_facet	PINHEIRO, MAYARA MAEZANO FAITA
author_role	author
dc.contributor.none.fl_str_mv	Ramos, Ana Paula Marques https://orcid.org/0000-0001-6633-2903 http://lattes.cnpq.br/9006947238035954 Alves, Marcelo Rodrigo http://lattes.cnpq.br/8257691552745291 Osco, Lucas Prado https://orcid.org/0000-0002-0258-536X http://lattes.cnpq.br/7723347042259816 Marcato Júnior, José https://orcid.org/0000-0002-9096-6866 http://lattes.cnpq.br/1054922336409334 Mendes, Tatiana Sussel Gonçalves http://lattes.cnpq.br/3219252827913286
dc.contributor.author.fl_str_mv	PINHEIRO, MAYARA MAEZANO FAITA
dc.subject.por.fl_str_mv	Mapeamento de corpos d’água Sensoriamento Remoto Redes de aprendizagem profunda Mapping of water bodies Remote sensing Deep learning networks OUTROS::CIENCIAS
topic	Mapeamento de corpos d’água Sensoriamento Remoto Redes de aprendizagem profunda Mapping of water bodies Remote sensing Deep learning networks OUTROS::CIENCIAS
description	O mapeamento de rios é fundamental para o diagnóstico e planejamentos ambiental e o sensoriamento remoto tem auxiliado em investigações relacionadas a este recurso hídrico. Um método que tem ganhado atenção e auxiliado na tarefa de mapear rios é o método de aprendizagem profunda. Os métodos de aprendizagem profunda mais utilizados na tarefa de mapeamento (segmentação semântica) são baseados em arquiteturas de rede em convolução e, mais recentemente, Vision Transformers. São métodos robustos que tem apresentado uma boa performance para esse tipo de tarefa, porém, ainda existem desafios a serem superados ao mapear feições de rios estreitos. Nesse sentido, considerando a diversidade de feições de rios e ausência de uma abordagem que se aprofunde em suas características como a largura dos mesmos, o objetivo deste estudo é mapear rios com diferentes tamanhos em imagens aéreas RGB de alta resolução espacial utilizando redes profundas de segmentação semântica. Para isso, o presente trabalho buscou avaliar o desempenho de redes profundas de segmentação semântica ao identificar rios largos (largura superior a 10 metros) em imagens RGB de alta resolução espacial; caracterizar as capacidades e limitações das redes profundas de segmentação semântica em identificar rios estreitos (largura inferior a 10 metros) em imagens RGB de alta resolução espacial; e avaliar o desempenho de redes profundas de segmentação semântica baseadas em Transformers para segmentar rios, comparando-as com as redes neurais profundas tradicionais baseadas em convoluções. As imagens aéreas possuem 1 m de resolução e foram treinadas e testadas em ambiente computacional, utilizando os métodos de segmentação semântica baseados em convolução e Vision Transformer. Em seguida, os resultados foram comparados qualitativamente, por meio visual, e quantitativamente, por meio de métricas de avaliação (Acurácia, F1-Score, Precisão, Recall, IoU). Os resultados mostraram que o desempenho das redes profundas de segmentação semântica varia conforme a largura dos rios. A melhor abordagem para segmentar rios largos (superior a 10 metros) e rios estreitos (inferior a 10 metros) é usar ambos os tipos de larguras de rios no treinamento das redes profundas de segmentação semântica. Outra descoberta é que as redes profundas baseadas em Vision Transformer superaram a performance das redes profundas baseadas em convoluções para a tarefa de segmentação semântica de rios largos e estreitos em imagens RGB de 1 m de resolução. O SegFormer superou as métricas de avaliação para segmentação de rios com um F1-Score cima de 98%. Os trabalhos futuros devem continuar investigando as redes profundas baseadas em Vision Transformer, podendo explorar imagens multi-temporais e multimodais, a fim de melhorar o monitoramento de recursos hídricos.
publishDate	2023
dc.date.none.fl_str_mv	2023-08-25T18:32:10Z 2023-02-24
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
format	doctoralThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	PINHEIRO, M. M. F. Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial. 2023. 102 f. Tese (Doutorado em Meio Ambiente e Desenvolvimento Regional)- Universidade do Oeste Paulista, Presidente Prudente, 2023. http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514
identifier_str_mv	PINHEIRO, M. M. F. Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial. 2023. 102 f. Tese (Doutorado em Meio Ambiente e Desenvolvimento Regional)- Universidade do Oeste Paulista, Presidente Prudente, 2023.
url	http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidade do Oeste Paulista Doutorado em Meio Ambiente e Desenvolvimento Regional Brasil UNOESTE Doutorado em Meio Ambiente e Desenvolvimento Regional
publisher.none.fl_str_mv	Universidade do Oeste Paulista Doutorado em Meio Ambiente e Desenvolvimento Regional Brasil UNOESTE Doutorado em Meio Ambiente e Desenvolvimento Regional
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UNOESTE instname:Universidade do Oeste Paulista (UNOESTE) instacron:UNOESTE
instname_str	Universidade do Oeste Paulista (UNOESTE)
instacron_str	UNOESTE
institution	UNOESTE
reponame_str	Biblioteca Digital de Teses e Dissertações da UNOESTE
collection	Biblioteca Digital de Teses e Dissertações da UNOESTE
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UNOESTE - Universidade do Oeste Paulista (UNOESTE)
repository.mail.fl_str_mv	bdtd@unoeste.br
_version_	1822154854482575360

Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial

Registros relacionados