热点基因集+单细胞+百种机器学习+简单实验验证=5+SCI。

杂志: Frontiers in Immunology

影响因子:5.7

研究概述:

作为抗肿瘤免疫的主要组成部分,T细胞在肿瘤微环境(TME)中容易衰竭和发生功能障碍。深入了解 TME 中的 T 细胞耗竭 (TEX) 对于在临床环境中有效解决 TEX 问题和提高免疫检查点阻断疗法的疗效至关重要。在真核生物中,许多细胞表面蛋白通过糖基磷脂酰肌醇 (GPI) 锚栓拴在质膜上,这在促进膜蛋白的正确易位方面起着至关重要的作用。然而,现有证据并不足以支持该结论。该研究了乳腺癌(BC)患者TME中GPI-锚生物合成的特征,特别是其与TEX的相关性。GPI-锚定生物合成应被视为乳腺癌的预后危险因素。GPI-锚定生物合成高的患者表现出更严重的TEX。耗竭的CD8 T细胞中GPI-锚定生物合成水平高于正常CD8 T细胞,这在恶性上皮细胞和正常乳腺上皮细胞之间未观察到。此外,作者还发现GPI-锚定生物合成相关基因可用于诊断BC患者的TEX状态和预测预后,TEX诊断模型和预后模型均表现出良好的AUC值。最后,作者在细胞和临床样本中进一步证实,敲低 PIGU 基因表达可显著降低 MDA-MB-231 和 MCF-7 细胞系的增殖率。临床样本的免疫荧光结果显示,GPAA1 和 PIGU 高表达的组织中 CD8 T 细胞聚集减少。

机器学习目前在肿瘤和非肿瘤生信中越来越常见,不管是构建模型还是筛选关键基因,都有很出色的发挥。想做类似分析的朋友,欢迎交流!

研究结果:

糖基磷脂酰肌醇(GPI)锚生物合成是乳腺癌的预后危险因素

作者利用收集的GPI相关的基因,量化了具有 GPI 评分的患者 GPI 锚定生物合成的强度,并评估了 TCGA 泛癌数据集中癌症和癌旁组织之间 GPI 锚定生物合成的差异(图1A)。根据森林图(图1B)所示的Unicox分析结果,GPI锚定的生物合成是LGG、HNSC、GBM、CESC和BRCA预后的危险因素,而在READ、THYM、OV、MESO、LUSC和KIRC中,GPI锚定的生物合成是预后的保护因素。KM生存曲线显示,GPI锚定生物合成的增强与HNSC,BRCA,LGG和LUAD的不良预后有关(图1C)。综合Cox回归、KM生存曲线和肿瘤和正常样本中GPI-scores的表达结果,最终确定GPI锚定的生物合成可能在乳腺癌(BC)的发生发展中起关键作用。

GPI锚定生物合成的功能富集分析

根据 GPI 评分的最佳临界值,将 TCGA BC 患者分为 GPI 锚定生物合成高和低两个队列。热图说明了不同患者亚组内的不同基因表达情况(图2A)。KEGG功能富集分析显示,GPI锚定生物合成高的患者预后较差,伴有较低的免疫应答,具体表现包括细胞因子-细胞因子受体相互作用下调、辅助性T淋巴细胞(Th17、Th1和Th2)细胞分化、原发性免疫缺陷、抗原处理和表现(图2B)。有趣的是,高GPI锚定生物合成组的患者表现出增强的代谢途径,其特征是雌激素信号通路和AMPK信号通路,以及增强的脂肪酸代谢和皮质醇合成分泌(图2B)。此外,GSEA分析显示,随着GPI-score的升高,蛋白质分泌和雌激素反应升高,过氧化物酶体代谢和氧化磷酸化途径增强。然而,IL2-STAT5信号转导,IL6-JAK-STAT3信号转导,TNFA信号转导,干扰素γ反应和炎症反应下调(图2C)。

GPI锚定生物合成与T细胞耗竭的相关性

免疫浸润分析显示,GPI评分与T细胞CD8、T细胞CD4记忆激活、Treg、B细胞记忆和T细胞滤泡螺旋呈负相关(P<0.001),与M2巨噬细胞呈正相关(P<0.001)(图3A)。如图3B所示,参与GPI锚定生物合成的大多数基因的表达与不同的免疫细胞群呈显著负相关。然后,采用共识聚类分析,根据包括TNF、IL-2、IFN-γ和CTL的特定TEX通路对BC患者进行分类。热图显示了TEX在四组患者中其他分子通路的变化(图3C)。一致地,这些表征的 TEX 通路(包括 CYT 和 CD4 T 细胞以及 CD 8 T 细胞)在 C1-C4 中呈下降趋势(图 3D-F),表明该研究中确定的四个 TEX 亚组准确代表了 TEX 分级阶段的生物学。此外,GPI锚定生物合成的强度随着TEX的严重程度而增加(图3G)。

肿瘤微环境中GPI锚定生物合成的单细胞分析

作者使用GSE114727中的单细胞数据进行分析,将样本的的临床信息投射到各种细胞亚群上以追踪细胞起源,发现耗尽的CD8 T细胞主要存在于肿瘤组织中(图4B)。与正常乳腺微环境相比,TME中各类型细胞的比例发生了显著变化,其中B细胞、内皮细胞、巨噬细胞和单核细胞的比例升高,而CD4 T细胞和CD8 T细胞的比例降低,取而代之的是耗竭的CD8 T细胞的大幅增加(图4C)。接着,作者使用 InferCNV 算法在肿瘤上皮细胞群中定义了 127 个恶性细胞(图 4D、E)并比较了恶性上皮细胞与正常乳腺上皮细胞GPI锚定生物合成的差异,结果显示,在恶性上皮细胞中,GPI锚定的生物合成反而减少了(图4F)。在比较了其他肿瘤来源的细胞群中GPI锚定生物合成的改变情况后,作者发现只有在CD8 T细胞和耗尽的CD8 T细胞之间才能观察到显着的差异(图4G)。与正常的 CD8 T 细胞相比,耗尽的 CD8 T 细胞中 GPI 锚定的生物合成要强得多。同样,KEGG生物通路的GSVA分析显示,恶性和非恶性上皮细胞之间的GPI锚定生物合成没有差异(图4H),而这种差异在CD8 T细胞和耗竭的CD8 T细胞中很明显(图4I)。

TME中GPI锚定生物合成相关基因的伪时序分析

另外,作者构建CD8 T细胞和上皮细胞的分化轨迹,用于观察肿瘤发生过程中CD8 T细胞耗竭和GPI锚定生物合成的代谢重塑过程。在伪定时分析中,CD8 T细胞最初沿着轨迹路径定位,并逐渐转变为耗尽的CD8 T细胞(图5A,B)。基因热图表明PIGP、PIGC、PIGU、PIGW、PIGV、和GPAA1在轨迹路径末端高度表达(图5C),这意味着这些基因在耗尽的CD8 T细胞中高度表达。二维图谱显示了CD8 T细胞(绿色)和耗竭的CD8 T细胞(蓝色)中基因的动态表达(图5D)。图5G则表明,耗尽的CD8 T细胞中GPI锚定的生物合成的总体水平总是高于未耗尽的CD8 T细胞中的整体水平,并且随着CD8 T细胞变得更加耗尽,代谢强度增加。

基于机器学习构建T细胞耗竭诊断模型

将Metabric和TCGA BC队列的GPI评分和TEX评分进行了相关性分析,相关系数(r值)分别为-0.49和-0.51(图6A,B)。然后,利用XGBoost算法中的model_profile函数对Metabric BC队列进行变分分析,评估GPI锚定生物合成相关基因的表达与BC患者T细胞耗竭状态之间的相关性。部分依赖性曲线展示了单个基因表达对XGboost模型预测能力的影响(图6C)。图 6D 说明了每个 GPI 锚定的生物合成相关基因对 Metabric BC 患者 T 细胞耗竭状态的影响程度,可以观察到 PIGQ 对患者的严重 T 细胞耗竭状态影响最明显,其次是 GPAA1。最后,采用XGBoost和Logistic回归方法构建了2个BC队列中GPI锚定生物合成相关基因相关的T细胞耗竭诊断模型。与 XGBoost 算法相比,Logistic 回归模型在 Metabric 和 TCGA 队列中都具有更高的 AUC 值,分别为 0.688 和 0.684(图 6G,H),而 XGBoost 模型的 AUC 值为 0.637 和 0.623(图 6E、F)。

建立与GPI锚定生物合成相关的预后特征

为了验证GPI锚定生物合成相关基因在BC中的预后价值,本文基于21个GPI锚定生物合成相关基因和T细胞耗竭的特征因素(TNF、IL-2、IFN-γ)建立了基因特征(GPIS)。患者数量众多的 Metabric 数据集用作训练集,而样本数量较少的 TCGA 队列用作验证集。作者采用十倍交叉验证框架来训练和验证 101 个预测模型,随后确定每个集合的 C 指数,其中,最优模型是随机森林(RSF),平均C指数最高(0.767),如图7A所示。然后,利用RandomForestSRC算法对RSF的结果进行优化。图7B代表了GPIS中表征基因的权重比,表明PIGV、PIGU、GPAA1和PGAP1是模型的核心基因。通过在 RandomForestSRC 中对 13 个基因表达值及其回归系数进行加权,获得了每位患者的风险评分(图 7C)。根据“surviminer”软件包确定的风险评分最佳阈值,将患者分为高风险组和低风险组。KM曲线表明,与低风险队列中的个体相比,被归类为高风险的患者表现出显着减少的OS持续时间(图7D,E)。ROC分析测量了GPIS的区分度,训练数据集的3年、4年和5年AUC分别为0.62、0.64和0.65(图7F)。验证数据集中的 1 年、3 年和 5 年 AUC 分别为 0.68、0.60 和 0.59(图 7G)。

建立与GPI锚定生物合成相关的预后特征

在T细胞耗竭诊断模型和预后模型的特征权重分析中,作者选择对GPAA1和PIGU进行进一步的全面研究。作者通过免疫浸润分析了两个基因与其他38种癌症免疫细胞之间的相关性(图 8A)。CD8+T细胞在乳腺癌中的浸润与GPAA1和PIGU的表达水平呈负相关。此外,KM曲线表明GPAA1和PIGU高表达的患者具有较差的OS(图8B,C)。与正常乳腺细胞(MCF10A)相比,GPAA1和PIGU在MCF7,MDA-MB-231和BT-474细胞中的表达相对较高(图8D)。功能实验表明敲低PIGU 能有效延缓 MCF7 和 MDA-MB-231 的细胞增殖(图 8E)。多重免疫荧光染色技术检测了 GPAA1 和 PIGU 分子的表达水平,以局部乳腺癌组织中 CD8 T 细胞浸润的程度,发现乳腺癌细胞中GPAA1和PIGU的表达与邻近淋巴细胞中CD8分子的表达呈负相关。当肿瘤细胞高表达GPAA1和PIGU时,外周浸润淋巴细胞中CD8分子的荧光强度明显降低,表明CD8+ T细胞数量减少(图8F,G)。

研究总结:

总的来说,作者目标很明确,确定一个明确与膜蛋白定位有关的基因集,选定特定癌症乳腺癌,探讨该基因集在乳腺癌中与免疫应答中T细胞免疫浸润的关系, 发现GPI锚定生物合成是乳腺癌的危险预后因素,通过免疫浸润分析,发现该基因集与T细胞耗竭有关,利用单细胞数据进一步分析基因集与特定细胞群的关系,发现了GPI评分与耗竭CD8 T细胞显著相关,结合机器学习算法中的XGBoost算法构建了以GPI锚定生物合成基因为基础的预测T细胞耗竭模型,发现该模型在预测BC患者是否已经发展为严重的T细胞耗竭具有高的AUC值,随后作者结合基因与T细胞耗竭的特征因素,进一步构建了GPIS相关的预后风险评分模型。最后,作者对组成模型的核心基因进行了功能上的验证,发现GPAA1和PIGU与BC预后不良和CD8 T细胞浸润有关。

版权声明:
作者:Mr李
链接:https://www.techfm.club/p/151608.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>