Published July 7, 2023 | Version v1
Publication

Metabolomics of localized breast cancer with high risk of recurrence

Citation

An error occurred while generating the citation.

Description

Breast cancer is a heterogeneous disease with multiple histological, biological, and molecular subtypes. Several fundamental studies have highlighted the activation of specific metabolic pathways in aggressive breast cancers. The aim of this thesis was to identify a signature or markers of the metabolome in localized breast cancer at high risk of recurrence.Our initial studies were based on the retrospective inclusion of 52 patients with localized breast cancer treated at the Antoine Lacassagne Center in Nice. We also analyzed diagnostic biopsies from a cohort of 49 patients treated with neo-adjuvant chemotherapy at the Georges-François Leclerc Center in Dijon for locally advanced breast cancer. After extraction, separation, and concentration of metabolites from diagnostic biopsies and resected tumors, we performed metabolomic profiling using LC-MS/MS to identify and quantify metabolites relatively, followed by biological and statistical analysis.First, we compared the performance of 5 unsupervised machine learning methods (PCA k-means, sparse k-means, spectral clustering, SIMLR, and k-sparse) to identify groups of breast cancer patients. This analysis was only performed on the cohort from Nice.In Article 1, the clusters obtained using the 5 unsupervised machine learning methods were compared. The five methods identified three groups of patients, distinguished by their supposed prognosis (favorable group 1, intermediate group 2, unfavorable group 3), with different clinical and biological profiles. The SIMLR and K-sparse methods were the most effective in terms of clustering. The most discriminating metabolic pathways were glycolysis, glutaminolysis, and amino acid metabolism. The simulated "in-silico" survival analysis (PREDICT tool) revealed a significant difference between the 3 groups for 5-year and 10-year specific survival.In Article 2, survival analyses were performed based on actual patient survival data. Each patient was assigned to his prognostic group established by the 5 unsupervised machine learning methods. Groups 1 and 2 were combined and compared to group 3. The median follow-up was extended to 85.8 months. Bootstrap optimization was applied. The PCA k-means, K-sparse, and Spectral clustering methods achieved the best results for predicting 2-year progression-free survival. The PCA k-means method had the best performance. However, CSS and OS analyses revealed discrepancies between the 5 unsupervised machine learning methods.Simultaneously, a supervised analysis comparing high-grade tumors to low/intermediate grade tumors was conducted to determine the metabolites involved in tumor aggressiveness (Article 3). The Nice cohort was used as a training cohort, while the Dijon cohort was used for external validation. The metabolomic signature was composed of 12 metabolites. The AUCs for the training and validation cohorts were greater than 0.88. Thus, the model could distinguish high-grade tumors from low/intermediate grade tumors with a probability of nearly 90%. We identified several biomarkers of tumor aggressiveness, such as N1, N12 diacetylspermine and tryptophan catabolites (kynurenine and serotonin), which are involved in inhibiting the immune response.These studies open up new perspectives on the underlying biological mechanisms of tumor aggressiveness. Furthermore, the identified biomarkers will allow the development of new strategies. However, analyses on larger populations are necessary.

Abstract (French)

Le cancer du sein est une maladie hétérogène avec de multiples sous-types histologiques, biologiques et moléculaires. Plusieurs études fondamentales ont mis en évidence l'activation de voies métaboliques spécifiques dans les cancers du sein agressifs. L'objectif de cette thèse était d'identifier une signature ou des marqueurs du métabolome dans le cancer du sein localisé à haut risque de récidive.Nos premières études se sont basées sur l'inclusion rétrospective de 52 patientes atteintes d'un cancer du sein localisé et traitées au Centre Antoine Lacassagne de Nice. Nous avons également analysé les biopsies diagnostiques issues d'une cohorte de 49 patientes traitées par chimiothérapie néo-adjuvante au Centre Georges-François Leclerc de Dijon pour un cancer du sein localement avancé. Après extraction, séparation et concentration des métabolites, nous avons réalisé un profilage métabolomique par LC-MS/MS pour identifier et quantifier de manière relative les métabolites, suivi d'analyses biologiques et statistiques.Tout d'abord, nous avons comparé les performances de 5 méthodes de machine learning non supervisées (PCA k-means, sparse k-means, spectral clustering, SIMLR et k-sparse) pour identifier des groupes de patients atteints de cancer du sein. Cette analyse n'a été réalisée que sur la cohorte de Nice.Les clusters obtenus en utilisant les 5 méthodes de machine learning non supervisées ont été comparés dans l'Article 1. Les cinq méthodes ont identifié trois groupes de patients, distincts par leur pronostic supposé (groupe 1 favorable, groupe 2 intermédiaire, groupe 3 défavorable), avec des profils cliniques et biologiques différents. Les méthodes SIMLR et K-sparse étaient les plus efficaces en termes de clustering. Les voies métaboliques les plus discriminantes étaient la glycolyse, la glutaminolyse et le métabolisme des acides aminés. L'analyse de survie simulée « in-silico » (outil PREDICT) a révélé une différence significative entre les 3 groupes pour la survie spécifique à 5 ans et à 10 ans.Dans l'Article 2, les analyses de survie ont été réalisées à partir des données de survie réelle des patients. Chaque patient était rattaché à son groupe pronostic comme établi précédemment par les 5 méthodes d'apprentissage automatique non supervisées. Les groupes 1 et 2 ont été regroupés et comparés au groupe 3. Le suivi médian a été prolongé à 85,8 mois. Une optimisation Bootstrap a été appliquée. Les méthodes PCA k-means, K-sparse et Spectral clustering ont obtenu les meilleurs résultats pour prédire la survie sans progression à 2 ans. La méthode PCA k-means avait les meilleures performances. Les analyses CSS et OS ont révélé cependant des discordances entre les 5 méthodes de machine learning non supervisées.Parallèlement, une analyse supervisée comparant les tumeurs de haut grade et celles de grade faible/intermédiaire a été réalisée pour déterminer les métabolites entrant en jeu dans l'agressivité tumorale (Article 3). La cohorte niçoise a été utilisée comme cohorte d'entrainement. La cohorte dijonnaise a permis une validation externe en tant que cohorte de validation. La signature métabolomique était composée de 12 métabolites. Les AUC pour la cohorte d'entraînement et la cohorte de validation étaient supérieures à 0,88. Le modèle pouvait donc distinguer les tumeurs de grade élevé et de grade faible/intermédiaire avec une probabilité de près de 90 %. Nous avons identifié plusieurs biomarqueurs de l'agressivité tumorale, tels que la N1, N12 diacétylspermine et les catabolites du tryptophane (la kynurénine et la sérotonine), impliqués dans l'inhibition de la réponse immunitaire.Ces études ouvrent de nouvelles perspectives sur les mécanismes biologiques sous-jacents à l'agressivité tumorale. De plus, les biomarqueurs identifiés permettront le développement de nouvelles stratégies. Cependant, des analyses sur des populations avec de plus grands effectifs sont nécessaires.

Additional details

Created:
October 15, 2023
Modified:
November 27, 2023