Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/115503
Title: Accurately Predicting Brain Age with Machine Learning: Implications for Biomarker Development
Other Titles: Previsão precisa da idade cerebral com métodos de aprendizagem máquina: Implicações para o desenvolvimento de biomarcadores
Authors: Dias, Maria de Fátima Machado
Orientador: Duarte, João Valente
Branco, Miguel Sá Sousa Castelo
Carvalho, Paulo Fernando Pereira de
Keywords: Machine Learning; Neuroimaging; Ageing; Biomarker; Aprendizagem máquina; Biomarcador; Envelhecimento; Neuroimagem; -; -
Issue Date: 24-May-2024
Serial title, monograph or event: Accurately Predicting Brain Age with Machine Learning: Implications for Biomarker Development
Place of publication or event: Departamento de Engenharia Informática da Faculdade de Ciências e Tecnologia da Universidade de Coimbra
Abstract: Brain age gap estimation (BrainAGE) is a putative ageing biomarker that aims to identify the onset of pathological ageing of the brain and monitor its progress. Diagnosing age-related brain conditions in a preclinical stage could enable early interventions, decreasing the disease burden. BrainAGE emerges as a promising ageing biomarker that seems to tackle biological ageing mechanisms. Its value is sensitive to lifestyle activities and numerous pathological conditions. BrainAGE primarily models healthy brain ageing as a way to detect pathological deviations. Healthy brain ageing can be modelled by machine learning algorithms that learn ageing patterns from structural magnetic resonance imaging (MRI) data. The BrainAGE provides information about the difference between the predicted and the chronological age. A wide range of approaches have been considered to model brain age, from shallow to deep learning. However, current models lack generalisation when applied to data obtained in acquisition settings different from those used to train the model. Moreover, BrainAGE is sensitive to detecting changes in multiple diseases but lacks specificity, which might be essential for its adoption in clinical practice. This thesis aimed to improve the BrainAGE generalisability and specificity. One hypothesis for the generalisability problem is that MRI data may contain scanner artefacts, which leads to a bias in machine learning models towards acquisition settings. Preprocessing has a preponderant role in reducing scanner artefacts. Nevertheless, there is no preprocessing gold standard in neuroimaging. FreeSurfer and SPM emerge as two frameworks that are extensively used in BrainAGE. The first study in this thesis assessed the reproducibility between the FreeSurfer and computational anatomy toolbox (CAT12), an SPM toolbox for structural data, and the reliability of each one. The results outlined that the reliability of the frameworks differs, and CAT12 outperformed FreeSurfer. Therefore, CAT12 was selected to preprocess the data. Overfitting to training data could also cause the generalisability problem. Deep learning is extensively applied in the BrainAGE field with state-of-the-art performance. Nonetheless, the performance of these models often decreases when tested on an external test set. Transfer learning from a 3D-Convolutional Autoencoder (3D-CAE), an unsupervised model, was considered to overcome this limitation. The results outlined that reusing weights from pre-trained 3D-CAE improves generalisation on an external test set. The specificity of BrainAGE might be improved by using multiple sources of information. The preprocessing of MRI data involves registering the image into a template. The transformations applied to overlap the two images are designated by deformation fields. Most studies use minimally preprocessed T1-weighted images, or grey matter (GM) or white matter (WM) segmented images, to predict brain age. Few studies consider deformation fields to model brain age, and results are inconsistent. One study of this thesis focuses on comprehensively comparing the performance of the deformation fields with the GM, WM and cerebrospinal fluid (CSF). The results outlined that deformation fields yield better performance than WM and CSF. Furthermore, combining deformation fields with GM improves performance compared to GM alone. Finally, the last study assessed sensitivity maps to explain the model predictions and increase BrainAGE specificity. All the previous analyses were combined. Five brain age models were trained, leveraging transfer learning from the 3D-CAE, using the following inputs: minimally processed, GM, WM, CSF and deformation results. In general, the BrainAGE was statistically significant in all models and conditions. The results evidenced model sensitivity, but lack specificity. The analysis of sensitivity maps revealed different patterns across the different diseases and input types, thus contributing to a biological explanatory framework. Explainability from multiple sources might provide insights on BrainAGE specificity. This thesis contributed to the BrainAGE field on two axes: generalisability and specificity. The former was addressed using the preprocessing framework with higher reliability and transfer learning from an agnostic model. The latter was attained by including deformation fields in brain ageing modelling and exploring sensitivity maps for differential diagnosis.
Estimativa da diferença de idade cerebral (BrainAGE) é um possível biomarcador de envelhecimento que visa identificar o início do envelhecimento patológico e monitorar seu progresso. O diagnóstico de condições relacionadas com a idade em estágio pre-clínico poderá possibilitar intervenções precoces, diminuindo o impacto da doença. BrainAGE surge como um biomarcador de envelhecimento promissor que parece estar relacionado com os mecanismos biológicos de envelhecimento. O seu valor é sensível ao estilo de vida e a inúmeras condições patológicas. BrainAGE modela o envelhecimento cerebral saudável como forma de detectar os desvios patológicos. O envelhecimento saudável do cérebro pode ser modelado por algoritmos de aprendizagem máquina, que aprendem padrões de envelhecimento a partir de dados estruturais de ressonância magnética. BrainAGE corresponde à diferença entre a idade prevista e a cronológica. Uma ampla gama de abordagens tem sido considerada para modelar a idade do cérebro, usando abordagens tradicionais (shallow learning) ou mais complexas (deep learning). No entanto, os modelos atuais carecem de generalização quando aplicados a dados obtidos em condições de aquisição diferentes daquelas utilizadas para treinar o modelo. Adicionalmente, o BrainAGE é sensível a múltiplas doenças e, por isso, tem uma reduzida especificidade, o que pode dificultar a sua adoção na prática clínica. Esta tese teve como objetivo melhorar a generalização e especificidade do BrainAGE. O problema de generalização pode advir dos dados de ressonância magnética conterem artefatos específicos das condições da aquisição, o que leva a um viés nos modelos em relação às configurações de aquisição. O pre-processamento tem um papel preponderante na redução destes artefatos. No entanto, não existe uma abordagem padrão definida para o pre-processamento em neuroimagem. Duas ferramentas amplamente utilizadas em BrainAGE são o FreeSurfer e o SPM. O primeiro estudo desta tese avalia a reprodutibilidade entre o FreeSurfer e a CAT12, uma ferramenta do SPM para dados estruturais, e a fiabilidade de cada ferramenta. Os resultados mostram que a fiabilidade das ferramentas difere, a CAT12 tem um melhor desempenho que o FreeSurfer. Pelo que, a CAT12 foi selecionada para pre-processar os dados. O overfitting aos dados de treino pode também ser a causa do problema de generalização. As abordagens de deep learning têm sido amplamente utilizadas em BrainAGE. No entanto, o desempenho destes modelos diminui quando testados em dados independentes. Para ultrapassar este entrave, foi avaliada a transferência de conhecimento de um 3D Convolucional Autoencoder (3D-CAE), um modelo não supervisionado. Os resultados revelam que a reutilização de pesos do 3D-CAE melhora a generalização do modelo. A especificidade do BrainAGE pode ser melhorada usando múltiplas fontes de informação. O pre-processamento de imagens de ressonância magnética envolve o registo das imagens com uma imagem base. As transformações aplicadas para sobrepor as duas imagens são designadas por campos de deformação. A maioria dos estudos usa imagens minimamente pre-processadas, substância cinzenta (GM) ou substância branca (WM), para prever a idade cerebral. Poucos estudos consideram campos de deformação para modelar a idade cerebral e os resultados são inconsistentes. Um estudo desta tese concentra-se na comparação do desempenho dos campos de deformação com a GM, WM e líquido cefalorraquidiano (CSF). Os resultados demonstraram que os campos de deformação apresentam melhor desempenho que WM e CSF. Adicionalmente, a combinação dos campos de deformação com GM melhora o desempenho do modelo em comparação com a utilização de apenas GM. Finalmente, o último estudo avaliou a utilização de mapas de sensibilidade para explicar as previsões do modelo e aumentar a especificidade do BrainAGE. Nesta análise, todas os estudos anteriores foram combinados. Foram treinados cinco modelos para prever a idade cerebral, utilizando os pesos do 3D-CAE, usando os seguintes tipos de dados: imagens com processamento mínimo, GM, WM, CSF e campos de deformação. De modo geral, o BrainAGE foi estatisticamente significativo em todos os modelos e condições. Os resultados evidenciam a sensibilidade do biomarcador e sua falta de especificidade. A análise dos mapas de sensibilidade revelou diferentes padrões nas diferentes doenças e tipo de dados. Desta forma, a explicação das previsões, utilizando múltiplos tipos de dados, pode aumentar a especificidade do BrainAGE. Esta tese contribuiu para o BrainAGE em dois eixos: generalização e especificidade. O primeiro foi abordado usando a ferramenta de pre-processamento com maior fiabilidade e transferência de conhecimento de um modelo agnóstico. Em relação à especificidade foram incluídos os campos de deformação na modelação do envelhecimento cerebral e explorados os mapas de sensibilidade para o diagnóstico diferencial.
Description: Tese de Doutoramento em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/115503
Rights: openAccess
Appears in Collections:UC - Teses de Doutoramento

Files in This Item:
File SizeFormat
thesis-1.pdf27.99 MBAdobe PDFView/Open
Show full item record

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons