A Vision Transformer Architecture for the Automated Segmentation of Retinal Fluids in Spectral Domain Optical Coherence Tomography Images

Detalhes bibliográficos
Autor(a) principal: Philippi, Daniel
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10362/148612
Resumo: Project Work presented as the partial requirement for obtaining a Master's degree in Data Science and Advanced Analytics, specialization in Data Science
id RCAP_6803ab9246d461d4cde0332138048e08
oai_identifier_str oai:run.unl.pt:10362/148612
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling A Vision Transformer Architecture for the Automated Segmentation of Retinal Fluids in Spectral Domain Optical Coherence Tomography ImagesSemantic image segmentationSpectral domain optical coherence tomography (SD-OCT)Age-related macular degeneration (AMD)Vision Transformer (ViT)Convolutional neuronal networks (CNN)Segmentação de imagem semânticaRafia de coerência óptica do domínio espectral (SD-OCT)Degeneração macular relacionada com a idade (AMD)Transformador de visão (ViT)Redes neuronais convolucionais (CNN)Domínio/Área Científica::Ciências Naturais::Ciências da Computação e da InformaçãoDomínio/Área Científica::Ciências Médicas::Ciências da SaúdeProject Work presented as the partial requirement for obtaining a Master's degree in Data Science and Advanced Analytics, specialization in Data ScienceContext Neovascular age-related macular degeneration (nAMD) is one of the major causes of irreversible blindness and is characterized by accumulations of different types of fluids inside the retina. An early detection and activity monitoring of predominately three types of fluids, namely intra-retinal fluid (IRF), sub-retinal fluid (SRF), and pigment epithelium detachment (PED), is critical for a successful treatment. Spectraldomain optical coherence tomography (SD-OCT) revolutionized nAMD treatment by providing cross-sectional images of the retina. Motivation Automatic segmentation and quantification of IRF, SRF, and PED in SD-OCT images can be extremely useful for clinical decision-making. Various authors proposed state-of-the-art CNN-based methods. However, the task remains challenging due to huge variations in the location, size, shape, and texture of the fluids. Contributions This work is the first to adopt a transformer-based method to automatically segment retinal fluid from SD-OCT images and to qualitatively and quantitatively evaluate its performance against CNN-based methods. Method Swin-UNETR is a Transformer-CNN hybrid, specifically designed to the challenges of medical image segmentation. It combines the efficient long-range feature extraction and aggregation capabilities of a vision transformer (ViT) with dataefficient training of Convolutional Neural Networks (CNN). We use a private dataset containing 3842 2-dimensional retinal SD-OCT images, manually labeled by experts of the Franziskus-Eye-Hospital1, to train and evaluate the network. Results While one of the competitors presents a better performance in terms of Dice score, the proposed method is significantly less computationally expensive. Thus, future research will focus on the proposed network’s architecture to increase its segmentation performance while maintaining its computational efficiencyContextoA degeneração macular relacionada com a idade (nAMD) é uma das principais causas da cegueira irreversível e caracteriza-se por acumulações de diferentes tipos de fluidos no interior da retina. Uma detecção precoce e monitorização da actividade de predominantemente três tipos de fluidos, nomeadamente fluido intra-retinal (IRF), fluido sub-retinal (SRF), e desprendimento do epitélio pigmentar (PED), é fundamental para um tratamento bem sucedido. A tomografia de coerência óptica de domínio espectral (SD-OCT) revolucionou o tratamento nAMD ao fornecer imagens transversais da retina. Motivação A segmentação e quantificação automática de IRF, SRF, e PED em imagens SD-OCT pode ser extremamente útil para a tomada de decisões clínicas. Vários autores propuseram métodos baseados no estado da arte da CNN. Contudo, a tarefa continua a ser desafiante devido a enormes variações na localização, tamanho, forma, e textura dos fluidos. Contribuições Este trabalho é o primeiro a adoptar um método baseado em transformadores para segmentar automaticamente o fluido da retina a partir de imagens SD-OCT e para avaliar qualitativa e quantitativamente o seu desempenho em relação aos métodos baseados na CNN. O método Swin-UNETR é um híbrido Transformer-CNN, especificamente concebido para os desafios da segmentação da imagem médica. Combina as eficientes capacidades de extracção e agregação de características de longo alcance de um transformador de visão (ViT) com o treino eficiente de dados de Redes Neurais Convolucionais (CNN). Utilizamos um conjunto de dados privado contendo 3842 imagens bidimensionais da retina SD-OCT, rotulado manualmente por peritos do Franziskus-Eye-Hospital, para treinar e avaliar a rede. Resultados Embora um dos concorrentes apresente um melhor desempenho em termos de pontuação dos dados, o método proposto é significativamente menos dispendioso em termos computacionais. Assim, a investigação futura centrar-se-á na arquitectura da rede proposta para aumentar o seu desempenho de segmentação, mantendo ao mesmo tempo a sua eficiência computacional.Castelli, MauroRUNPhilippi, Daniel2023-01-252025-01-25T00:00:00Z2023-01-25T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/148612TID:203224230enginfo:eu-repo/semantics/embargoedAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T05:30:19Zoai:run.unl.pt:10362/148612Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:53:26.682006Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv A Vision Transformer Architecture for the Automated Segmentation of Retinal Fluids in Spectral Domain Optical Coherence Tomography Images
title A Vision Transformer Architecture for the Automated Segmentation of Retinal Fluids in Spectral Domain Optical Coherence Tomography Images
spellingShingle A Vision Transformer Architecture for the Automated Segmentation of Retinal Fluids in Spectral Domain Optical Coherence Tomography Images
Philippi, Daniel
Semantic image segmentation
Spectral domain optical coherence tomography (SD-OCT)
Age-related macular degeneration (AMD)
Vision Transformer (ViT)
Convolutional neuronal networks (CNN)
Segmentação de imagem semântica
Rafia de coerência óptica do domínio espectral (SD-OCT)
Degeneração macular relacionada com a idade (AMD)
Transformador de visão (ViT)
Redes neuronais convolucionais (CNN)
Domínio/Área Científica::Ciências Naturais::Ciências da Computação e da Informação
Domínio/Área Científica::Ciências Médicas::Ciências da Saúde
title_short A Vision Transformer Architecture for the Automated Segmentation of Retinal Fluids in Spectral Domain Optical Coherence Tomography Images
title_full A Vision Transformer Architecture for the Automated Segmentation of Retinal Fluids in Spectral Domain Optical Coherence Tomography Images
title_fullStr A Vision Transformer Architecture for the Automated Segmentation of Retinal Fluids in Spectral Domain Optical Coherence Tomography Images
title_full_unstemmed A Vision Transformer Architecture for the Automated Segmentation of Retinal Fluids in Spectral Domain Optical Coherence Tomography Images
title_sort A Vision Transformer Architecture for the Automated Segmentation of Retinal Fluids in Spectral Domain Optical Coherence Tomography Images
author Philippi, Daniel
author_facet Philippi, Daniel
author_role author
dc.contributor.none.fl_str_mv Castelli, Mauro
RUN
dc.contributor.author.fl_str_mv Philippi, Daniel
dc.subject.por.fl_str_mv Semantic image segmentation
Spectral domain optical coherence tomography (SD-OCT)
Age-related macular degeneration (AMD)
Vision Transformer (ViT)
Convolutional neuronal networks (CNN)
Segmentação de imagem semântica
Rafia de coerência óptica do domínio espectral (SD-OCT)
Degeneração macular relacionada com a idade (AMD)
Transformador de visão (ViT)
Redes neuronais convolucionais (CNN)
Domínio/Área Científica::Ciências Naturais::Ciências da Computação e da Informação
Domínio/Área Científica::Ciências Médicas::Ciências da Saúde
topic Semantic image segmentation
Spectral domain optical coherence tomography (SD-OCT)
Age-related macular degeneration (AMD)
Vision Transformer (ViT)
Convolutional neuronal networks (CNN)
Segmentação de imagem semântica
Rafia de coerência óptica do domínio espectral (SD-OCT)
Degeneração macular relacionada com a idade (AMD)
Transformador de visão (ViT)
Redes neuronais convolucionais (CNN)
Domínio/Área Científica::Ciências Naturais::Ciências da Computação e da Informação
Domínio/Área Científica::Ciências Médicas::Ciências da Saúde
description Project Work presented as the partial requirement for obtaining a Master's degree in Data Science and Advanced Analytics, specialization in Data Science
publishDate 2023
dc.date.none.fl_str_mv 2023-01-25
2023-01-25T00:00:00Z
2025-01-25T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10362/148612
TID:203224230
url http://hdl.handle.net/10362/148612
identifier_str_mv TID:203224230
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/embargoedAccess
eu_rights_str_mv embargoedAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799138125174276096