Automated Macular Edema Detection and Segmentation in Optical Coherence Tomography Using Deep Learning

Gordon, Alex Bolivar Cazañas

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/114614

Title:	Automated Macular Edema Detection and Segmentation in Optical Coherence Tomography Using Deep Learning
Other Titles:	Deteção e Segmentação Automáticas de Edema Macular em Tomografias de Coerência Ótica Usando Aprendizagem Profunda
Authors:	Gordon, Alex Bolivar Cazañas
Orientador:	Cruz, Luís Alberto da Silva
Keywords:	Deteção automática; Segmentação automática; Edema macular; Aprendizagem profunda; Tomografias de Coerência Ótica; Automated Detection; Automated Segmentation; Macular edema; Deep learning; Optical Coherence Tomography
Issue Date:	30-Oct-2023
Serial title, monograph or event:	Automated Macular Edema Detection and Segmentation in Optical Coherence Tomography Using Deep Learning
Place of publication or event:	DEEC
Abstract:	Este trabalho de pesquisa aborda o problema da detecção e caracterização automatizada do edema macular na tomografia de coerência óptica (OCT, em inglês). O edema macular é uma condição retiniana que ameaça a visão e está ligada à diabetes e ao fenómeno do envelhecimento da população. A crescente incidência da diabetes e o aumento da expectativa de vida pressionam os sistemas de saúde em todo o mundo. Assim, há uma necessidade premente de aumentar a capacidade de atendimento dos serviços de saúde para responder ao aumento potencial da procura de atendimento oftalmológico. Atualmente, uma parte substancial do processo de diagnóstico depende da análise manual de imagens, que é demorada e requer avaliadores especializados. Além disso, os resultados dos exames são propensos à variabilidade entre observadores e podem levar tempo para chegar ao paciente. Nesse contexto, este trabalho investiga métodos automatizados para processamento de imagens usando aprendizagem profunda para auxiliar o diagnóstico. Em particular, esta investigação concentra-se na aplicação de redes neurais convolucionais (CNN, em inglês) à detecção e segmentação de edema macular em tomografia de coerência óptica. Após o sucesso da aprendizagem profunda e das redes neurais convolucionais na classificação de imagens naturais, os métodos de aprendizagem profunda começam a ser aplicados à análise de imagens da retina. Apesar dos resultados promissores, há ainda desafios, nomidamente a robustez dos classificadores e o desequilíbrio de classes. O trabalho de pesquisa descrito nesta dissertação produziu três contribuições principais.A primeira contribuição compreende técnicas de aprendizagem profunda para aprendizagem supervisionada com dados etiquetados limitados. É apresentado um estudo sobre a adequação da aprendizagem por transferência de conhecimento para detecção de fluido macular usando classificadores pré-treinados no conjunto de dados ImageNet. Os resultados deste estudo mostram que a aprendizagem por transferência permite o desenvolvimento de classificadores de alto desempenho usando muito menos dados de treino do que seria necessário para o treino partindo do zero. O estudo também fornece informações sobre o desempenho de diferentes arquiteturas de CNN quando elas são treinadas com dados limitados. Os resultados também mostraram que as redes mais profundas não superam necessariamente as menos profundas. Além disso, arquiteturas mais simples atingem melhor desempenho mais rapidamente.A segunda contribuição consiste em um método automatizado para a segmentação dos limites inter-camada da retina o qual é robusto a rupturas das camadas retinianas. Essa abordagem descreve uma estrutura que se baseia em um conjunto de classificadores CNN que generaliza melhor do que classificadores independentes. Experiências em dois conjuntos de dados independentes demonstraram que a abordagem proposta supera os algoritmos de referência na segmentação da extensão da retina em imagens OCT. Além disso, as medições da espessura da retina derivadas da segmentação automática mostram boa concordância com os resultados de avaliadores humanos.A terceira contribuição propõe um novo método automático extremo-a-extremo para segmentar camadas retinianas e lesões cistóides em imagens OCT da mácula. Essa abordagem introduz uma nova rede neural totalmente convolucional ou (FCN, em inglês) que usa um mecanismo de atenção para melhorar os resultados da segmentação. Além disso, o FCN proposto apresenta uma arquitetura eficiente, que permite reduzir a complexidade computational do modelo sem comprometer os resultados da segmentação. A abordagem proposta apresenta também um esquema de ponderação de perda eficaz e sem parâmetros para lidar com o problema de desequilíbrio de classe. Os resultados da avaliação em dois conjuntos de dados de referência, disponíveis publicamente, mostraram que o método proposto alcançou um desempenho competitivo com FCNs de última geração.Os resultados da pesquisa apresentados nesta dissertação fornecem uma nova visão sobre a estrutura da aprendizagem profunda e ampliam o corpo de conhecimento sobre análise automatizada de imagens da retina. Além disso, os resultados empíricos dos métodos propostos mostram o potencial da aprendizagem profunda para atender às necessidades atuais do diagnóstico retiniano. This research work addresses the problem of automated detection and segmentation of macular edema in optical coherence tomography (OCT). Macular edema is a sight-threatening retinal condition linked to diabetes and aging. Growing diabetes incidence and increasing life expectancy together pressure healthcare systems worldwide. Thus, there is a pressing need to enhance the service capacity of health providers to meet the potential increase in eye care demand. Presently, a substantial part of the diagnosis process relies on manual image analysis, which is time-consuming and requires trained graders. Moreover, examination results are prone to inter-observer variability and can take time to reach the patient. In this context, this dissertation investigates automated methods for image processing using deep learning to aid diagnosis. In particular, this investigation focuses on applying convolutional neural networks (CNN) to macular edema detection and segmentation in optical coherence tomography. Following the success of deep learning and convolutional neural networks in natural image classification, deep-learning methods are making their way into retinal image analysis. Despite promising results, some problems remain challenging, such as the robustness of CNN classifiers to class imbalance. The research work reported in this dissertation has produced three main contributions.The first contribution comprises deep learning techniques for supervised learning with limited labeled data. A study on the suitability of transfer learning for macular fluid detection using classifiers pre-trained on the ImageNet dataset is presented. Results of this study show that transfer learning allows for developing high-performance classifiers using much fewer training data than what would have been necessary for from-scratch training. The study also provides insight into how different CNN architectures perform when fine-tuned with limited labeled data. Results also showed that deeper networks do not necessarily outperform shallower ones. In addition, shallower architectures reached their best performance faster.The second contribution consists of an automated method for retinal-boundary segmentation that is robust to retinal layer disruptions in OCT scans. This approach describes a framework that builds upon a CNN-classifier ensemble that generalizes better than stand-alone classifiers. Experiments in two independent datasets demonstrated that the proposed approach outperforms reference algorithms at segmenting the retinal extent in OCT scans. Furthermore, retinal thickness measurements derived from the automatic segmentation show agreement with human grader results.The third contribution is a novel end-to-end automatic method for segmenting retinal layers and cystoid lesions in macular OCT scans. The proposed approach introduces a novel fully-convolutional neural network (FCN) that enforces an attention mechanism to enhance segmentation results. In addition, the proposed FCN introduces an efficiency-driven design tailored to reduce model complexity without compromising segmentation results. Furthermore, the proposed approach introduces an effective, parameter-free loss weighting scheme to handle the class imbalance problem. Results of the evaluation on two publicly available benchmark datasets showed that the proposed method reached competitive performance on par with state-of-the-art FCNs.The research work presented in this thesis provides fresh insight into the deep learning framework and extends the body of knowledge on automated retinal image analysis. Moreover, the empirical results of the proposed CNN-based methods show the potential of deep learning to address the unmet needs of current retinal diagnosis.
Description:	Tese de Doutoramento em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia
URI:	https://hdl.handle.net/10316/114614
Rights:	embargoedAccess
Appears in Collections:	UC - Teses de Doutoramento