Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/114384
Title: Diagnostics of the Future: Spectral Histopathology for the Diagnosis of Breast Cancer at a Molecular Level
Other Titles: Diagnóstico do Futuro: Histopatologia Espetral para o Diagnóstico de Cancro de Mama a Nível Molecular
Authors: Mamede, Adriana Maria Pires
Orientador: Santos, Inês Pereira dos
Carvalho, Luís Alberto Esteves Batista de
Catarro, Maria Paula Matos Marques
Keywords: Cancro de Mama; DCIS; Carcinoma Invasivo; Histopatologia Espetral; Diagnóstico; Classification Models; Machine Learning; Multivariate Analysis; FTIR Spectroscopy; Raman Spectroscopy
Issue Date: 2-Mar-2023
Project: info:eu-repo/grantAgreement/FCT/POR_CENTRO/SFRH/BD/137001/2018/PT
Serial title, monograph or event: Diagnostics of the Future: Spectral Histopathology for the Diagnosis of Breast Cancer at a Molecular Level
Place of publication or event: DCV
Abstract: O cancro de mama é o tipo de cancro com maior incidência em todo o mundo, sendo as campanhas de prevenção e triagem grátis o motivo para a baixa mortalidade associada a esta doença, quando comparada com outros tipos de cancro.A técnica padrão para o diagnóstico de cancro é a análise histopatológica, que é caracterizada por um determinado grau de subjetividade, estando sujeita aos critérios de patologistas experientes. Têm sido reportadas elevadas taxas de irreprodutibilidade das análises e identificação de diagnóstico erradas em casos de cancro de mama difíceis de diagnosticar, havendo a necessidade de desenvolver técnicas complementares à histopatologia, que aumentem a sensibilidade, especificidade e precisão dos diagnósticos. A espetroscopia vibracional ótica, de Raman e FTIR, foi presentemente aplicada ao estudo de amostras de mama fixas em parafina com o objetivo de desenvolver uma metodologia capaz de melhorar a precisão e reprodutibilidade da cadeia de diagnóstico.Foram estabelecidas 3 categorias de tecido, tecido mamário normal circundante, carcinoma invasivo da mama e carcinoma ductal in situ. Todas as amostras foram desparafinidas antes da análise espetroscópica e, com base nestas categorias de tecido, foi criada uma base de dados e desenvolvidos 8 modelos de classificação utilizando um algoritmo de classificação do tipo ensemble adaptative, AdaBoost, antecedido ou não da seleção de variáveis. Tendo-se obtido resultados excecionais. No entanto, aquando da aplicação dos modelos em amostras independentes, simulando um cenário real, verificou-se que os modelos desenvolvidos sofriam de sobreajuste. Conclui-se então que, de modo a obter modelos robustos, a divisão dos dados em grupos de treino, validação e teste deve ser feita por doente, de outro modo, a independência exigida no passo de validação é desrespeitada causando a ocorrência de vazamento de dados e, consequentemente, sobreajuste.O modelo de FTIR que visava a discriminação de tecido doente de tecido normal circundante foi redesenhado considerando a correção ao nível da divisão dos dados (por doente), tendo-se obtido 92% de sensibilidade e 37% de especificidade, mostrando-se incapaz de prever a ocorrência de SNBT. Concluiu-se então que a manipulação das amostras, nomeadamente a exposição a xileno, foi responsável por lavar a componente lipídica do tecido, a qual representa as características singulares de tecido com aparência normal. Isto é, aquando do tratamento com xileno, as amostras foram “bioquimicamente normalizadas”, o que eliminou do tecido normal circundante as suas características discriminatórias, portanto, o grupo de treino não tinha variabilidade suficiente para que o algoritmo fosse capaz de aprender com a informação bioquímica disponível.De um ponto de vista fundamental, foi realizada uma experiência de QENS, que permitiu o estudo do perfil dinâmico de IBC e SNBT, tendo-se concluído que carcinoma invasivo apresenta, na sua generalidade, um perfil dinâmico menos restrito. No entanto, verificou-se que a água intersticial de SNBT é mais móvel do que a de IBC. Estes resultados poderão estar relacionados com o papel importante do estroma na malignidade da mama.A aplicação de técnicas de Raman com configurações não lineares, foi também tentada nas amostras de mama fixas em parafina, através de CARS e SHG. Enquanto não foi possível obter imagens de CARS, as imagens obtidas por SHG permitiram constatar que o tecido maligno é caracterizado por fibras de colagénio direitas e cruzadas, ao invés do padrão de ondas observado no tecido normal circundante, a transição entre os dois padrões, dentro da mesma amostra, sendo facilmente identificada. Embora seja necessário aumentar o número de amostras neste estudo, para garantir reprodutibilidade, o estudo imagiológico por SHG de amostras fixas, apresenta um grande potencial para uma aplicação rotineira nas análises histopatológicas.Embora o objetivo final do projeto de tese não tenha sido atingido, chegou-se a conclusões extremamente importantes para o desenho e planeamento de estudos semelhantes que visem a aplicação biomédica de Raman e FTIR no diagnóstico de cancro.
Breast cancer is the most incident type of cancer, worldwide. Prevention and free screening campaigns being the reason for the lower mortality associated to this disease when compared to that of other types of cancer. The gold standard for cancer diagnosis is the histopathology analysis which carries a certain degree of subjectivity, relying on the judgement of well-trained pathologists. High misidentification and irreproducibility rates have been reported for the difficult cases of breast cancer, being imperative that complementary techniques are developed to assist histopathology, increasing the sensitivity, specificity and accuracy of the diagnoses. Optical vibrational spectroscopy, Raman and FTIR, was hereby applied to the study of FFPE breast samples aiming at the development of a methodology capable of improving the accuracy and reproducibility of the diagnostic chain. Three tissue categories were established for the present study, surrounding normal breast tissue, invasive breast carcinoma and ductal carcinoma in situ. All samples were chemically dewaxed prior spectral analysis. A spectral database was constructed based on these categories and 8 classification models were developed using an ensemble adaptative classification algorithm, AdaBoost, preceded or not by feature selection, and achieving outstanding results. However, the developed models were found to overfit upon their application on independent samples, intended to simulate a real-life scenario. It was concluded that, in order to have a robust model, the splitting of the data into training, validation and testing must occur patient-wise if not, the independency requirement of the validation process is disrespected leading to data leakage and, consequently, to overfitting.The FTIR model aiming at the discrimination of tissue with the disease from surrounding normal tissue was re-designed assessing this splitting error, achieving 92% sensitivity and 37% specificity, being unable to predict SNBT. It was then determined that the sample manipulation, namely the exposure to xylene, was washing away the lipidic component of the tissue which represents the singular features of normal appearing breast tissue. Upon this chemical treatment, the samples were “biochemically normalised”, surrounding normal tissue being cleared of its discriminant features therefore, there was no variability in the training dataset in order to allow the algorithm to learn from the available biochemical information.Aiming at a fundamental look into the disease, a QENS experiment was performed allowing to assess the dynamical profile within the IBC and SNBT samples, the former having shown, a less restricted dynamical profile. However, the interstitial water in SNBT was found to be more mobile than that of IBC. These findings were related to the role of the stroma in the malignancy of breast tissue.Non-linear Raman scattering configuration techniques, CARS and SHG imaging, were also applied to the study of the breast FFPE samples. While no CARS images could be obtained, SHG imaging allowed us to verify that the malignant tissue was characterised by straight-crossed collagen fibres while the normal appearing tissue was composed of wave-like collagen fibres, a normal-to-malignant transition being therefore easily identified. Although an increased sample size is needed to ensure reproducibility, SHG imaging showed to have great potential for routine application in histopathology analysis.Despite the fact that the goal initially defined for this study was not achieved, extremely important conclusions were drawn, which are expected to be of great value for the design and planning of future similar studies aiming at a biomedical application of Raman and FTIR for cancer diagnosis.
Description: Tese de Doutoramento em Biociências apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/114384
Rights: embargoedAccess
Appears in Collections:UC - Teses de Doutoramento

Files in This Item:
File SizeFormat Login
PhDThesis_Biosciences_APMamede.pdf10.33 MBAdobe PDFEmbargo Access    Request a copy
Show full item record

Page view(s)

15
checked on May 8, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons