最新6.7分生信,十几个数据集+数千例样本+百种机器学习建模+pcr验证。主打一个大力出奇迹!

影响因子:6.70

**研究概述: **

抗体依赖性的细胞介导的细胞毒作用(antibody-dependent cell-mediated cytotoxicity, ADCC)是指表达IgGFc受体的NK细胞、巨噬细胞和中性粒细胞等,通过与已结合在病毒感染细胞和肿瘤细胞等靶细胞表面的IgG抗体的Fc段结合,而杀伤这些靶细胞的作用。以往的研究大多忽略ADCC在肺腺癌中的作用,目前关于ADCC相关基因能否作为预后指标也尚未有研究报道。

该研究纳入了1564例肺腺癌患者,2057例非小细胞肺癌患者,以及来自不同队列的超过5000例不同类型的肿瘤患者。进行无监督聚类,鉴定出两种不同的LUAD亚型,每种亚型都表现出不同的临床特征。利用多种机器学习算法筛选出ADCC相关评分(ADCCRS),由16个基因组成。ADCCRS 的预测功能在 28 个独立数据集中得到验证。此外,ADCCRS在预测肺腺癌患者生存方面比之前发表的102个特征基因显示出更好的预测能力。结合ADCCRS和临床特征构建的列线图具有较高的预测效能。ADCCRS与患者的基因突变呈正相关,批量和单细胞转录组数据的整合分析揭示了ADCCRS与TME调节的相关性。高ADCCRS表型的细胞具有更多的恶性特征。ADCCRS评分高的肺腺癌患者对化疗和靶向治疗敏感,而对免疫治疗耐药。在泛癌分析中,ADCCRS仍显示出显著的预后价值,并被发现是大多数癌症患者的危险因素。总的来说,作者发现ADCCRS有助于评估肺腺癌患者的预后,揭示肿瘤微环境,预测治疗反应性。

机器学习目前在肿瘤和非肿瘤生信中越来越常见,不管是构建模型还是筛选关键基因,都有很出色的发挥。想做类似分析的朋友,欢迎交流!

研究结果:

探索ADCC相关细胞类型

在GSE127465单细胞测序数据集中,作者筛选了26,655个细胞用于质量控制,确定了12种细胞类型(图1A),图1B显示了每种细胞类型的前6个标记基因。通过从Genecards 数据库中下载的ADCC相关基因,利用AUCell算法发现NK细胞是ADCC评分最高的细胞,提示在肿瘤微环境中,NK细胞与ADCC强相关。作者利用“FindMarkers”函数,根据|log2(fold change)|> 0.25和校正的p值(Padj) < 0.05的标准,定义了1,696个显著的NK细胞标志基因。通过GO(图1D)和KEGG(图1E)分析进一步发现,这些基因主要富集与ADCC和免疫相关功能。主要途径包括“自然杀伤细胞介导的细胞毒性”、“免疫反应的激活”、“Fcγr介导的吞噬作用”和“抗原处理和呈递”。

共识聚类将LUAD患者分为两个ADCC相关亚型

基于1696个NK细胞标记基因,作者旨在确定对肺腺癌预后有重要影响的基因。在他们收集的LUAD数据集中选取了TCGA、GSE72094和GSE68465三个样本量最大的数据集进行了单因素Cox回归分析,以确定影响肺腺癌患者预后的基因。随后,将1696个NK细胞标记基因与筛选的预后显著相关基因取交集。确定了55个与LUAD患者预后显著相关的ADCC相关基因。对55个ADCCRGs(ADCC相关基因)进行无监督聚类,用于识别迄今未知的与肺腺癌中ADCC相关的亚型。当选择最佳簇数(k = 2)时,组间的分歧最明显。在TCGA数据集中,这55个基因在Cluster I和Cluster II中的表达如图2A所示,表明两个簇之间有显著差异表达。此外,Cluster II的患者表现出明显较差的预后(图2B),以及与更多恶性临床特征的相关性(图2D)。PCA分析强调了这两个集群之间的显著差异(图2C)。ssGSEA显示簇I中大多数免疫细胞的表达高于簇II(图2E)。此外,在整合后的meta-GEO数据集中,这55个基因在不同聚类中的表达模式与在TCGA数据集中观察到的一致(图2F)。Cluster II的患者再次显示出显著较差的预后(图2G),与恶性临床特征的关联较大(图2I),并且免疫细胞浸润较低(图2J)。Meta-GEO数据集中的PCA分析进一步强调了两个集群之间的显著差异(图2H)。至此,利用这55个ADCCRGs,可以将肺腺癌患者分为两类,在预后、临床特征和肿瘤微环境相关特征方面存在显著差异。

构建抗体依赖性细胞增殖相关风险评分(ADCCRS)

基于55个具有预后意义的ADCCRGs,作者采用采用机器学习算法从这些基因获得了预后模型。基于TCGA数据集,作者构建了96个预测模型(图3A),并在三个独立的验证集(GSE68465、GSE72094和GSE31210)上评估了每个模型的性能。最后作者选择了在所有四个数据集中具有一致的强预测能力的 “Lasso + GBM”组合,该组合创建的模型在四个数据集中达到了0.707的平均C-Index。该组合是一个由16个ADCCRGs组成的GBM模型(图3A)。作者在补充图2中检测了这16个基因在LUAD中的表达模式和与预后的关联。GBM算法评估了模型内这16个ADCCRGs的相对影响。利用每个患者的这16个ADCCRGs的表达,根据它们的相对影响进行加权,计算出每个个体的风险评分。我们将风险评分命名为抗体依赖性细胞毒性相关风险评分(ADCCRS)。以ADCCRS中位数作为分界线将患者分为两组。在训练集TCGA中(图3B), GSE68465(图3C)、GSE31210(图3D)、GSE72094(图3E)和Meta-All(图3f)中,高ADCCRS组的预后明显劣于低ADCCRS组。此外,PCA分析显示,ADCCRS高、低受试者之间存在显著差异(图3B-F 右侧)。

ADCCRS与LUAD患者临床特征之间存在显著相关性

热图展示了在四个不同数据集(TCGA、GSE68465、GSE31210和GSE72094)中构成ADCCRS的16个基因的转录谱(图4A-D)。Time-ROC曲线显示ADCCRS能有效预测患者预后,AUC值较高,具有良好的预测能力(图4E)。在TCGA队列中,LUAD患者的ADCCRS随着T(图4F)、N(图4G)和临床分期(图4H)进展而增加。同样,在GSE31210(图4I)和GSE72094(图4J)队列中,ADCCRS随着临床分期进展而增加。在GSE68465队列中,ADCCRS随着T(图4K)和N(图4L)分期的进展而增加,并且观察到与LUAD的组织学显著相关(图4M)。低分化肺腺癌组织中ADCCRS最高,中分化次之,高分化最低。此外,研究显示,在GSE31210队列中,ADCCRS与患者的无复发生存期(RFS)呈负相关(图4N),同时在TCGA队列中,患者的无进展生存期(PFS)呈平行降低(图4O)。这些发现强调了ADCCRS作为肺腺癌预后生物标志物的潜在效用。

比较ADCCRS与现有特征的预测效能

为了评估ADCCRS与临床变量在LUAD患者中的区分能力,作者计算了每个因素的C-index和AUC值(图5A-D)。值得注意的是,ADCCRS的表现优于大多数临床标志物,获得了更好的预测效能。在与其他文献报道过的102个特征比较中,ADCCRS显示出最高的C-index(图5E)和HR值(图5F),超过了大多数模型。

列线图的开发和验证

为了阐明ADCCRS的独立预测价值,作者对其进行了单因素和多因素Cox回归分析。在排除临床变量的影响后,作者明确ADCCRS是LUAD患者预后的重要预测因素(图6A、B),通过将ADCCRS与年龄、性别和临床分期等临床标志物整合,作者创建了一个能够预测LUAD患者预后的列线图(图6C),并通过校准图证实了列线图在估计1、3和5年生存率方面的准确性(图6D)。此外,作者还采用了决策曲线分析(DCA)观察到我列线图模型优于本研究中使用的任何替代预测因素(图6E)。高和低列线图评分组之间存在显著的生存差异(图6F)。此外,在其他队列中,该列线图在预测LUAD患者1、3、5年生存前景方面都具有较高的AUC值(图6G)。

差异分析和功能富集分析

为了阐明ADCCRS具有显著预测能力的潜在机制。在TCGA队列中,作者确定了表现出高ADCCRS水平和低ADCCRS水平的两组之间表达差异的基因。(图7A)展示了表达差异最显著的前50个基因。GO和GSEA分析揭示,高ADCCRS组中上调的基因主要与重要的生物学功能相关,如染色体分离、细胞周期、糖酵解和p53信号通路(图7B, D)。相反,低ADCCRS组中上调的基因在抗原呈递、T细胞活化、MHC II抗原呈递和免疫系统过程等功能中发挥关键作用。此外,在TCGA(图7F)和Meta-GEO(图7G)队列中进行的GSVA分析表明,在低ADCCRS组中,免疫细胞活性和免疫相关功能增强,这与GO、KEGG和GSEA分析的结果一致。作者还特别探究了在高ADCCRS组中表达上调最高的两个基因(KRT6A、SLC2A1)和在低ADCCRS组中表达上调最显著的两个基因(PGC、SFTPC)对LUAD患者预后的影响(图7H-I)。

ADCCRS与肿瘤免疫微环境(TIME)的关系

在低ADCCRS的LUAD患者中,免疫细胞浸润增强(图8A),同时ADCCRS和免疫浸润水平之间存在显著的负相关(图8B)。免疫调节因子(包括趋化因子、受体、免疫刺激物、免疫抑制剂和MHC)在低ADCCRS组中显著上调(图8C)。由于低ADCCRS组患者表现出更明显的“免疫热”特征,因此推测这些患者可能对免疫治疗干预反应更强。与这一观点一致的是,在GSE35640、GSE78220、IMvigor210三个免疫治疗数据集中,免疫治疗应答者的ADCCRS值显著低于无应答者(图8E&F)。此外,生存曲线显示接受免疫治疗的低ADCCRS组患者的临床结局均显著改善。

Scissor算法鉴定出与ADCCRS最相关的细胞类型

作者还研究了单细胞数据集GSE127465中ADCCRS及其组成的16个ADCCRGs的分布(图9A)。恶性细胞(Malignant)的ADCCRS值最高(图9B),高ADCCRS组的恶性细胞比例更高(图9C)。

为了阐明支持高ADCCRS临床表现的细胞来源,作者使用“Scissor”包将批量RNA测序数据与单细胞RNA测序数据关联,利用该算法的能力,自主选择与目标表型表现出非常一致的细胞。算法识别出1,760个高ADCCRS细胞(Scissor+细胞)和2,582个低ADCCRS细胞(Scissor-细胞,图9D)。Scissor+细胞的ADCCRS值显著高于Scissor-细胞(图9E)。此外,在GSE127465数据集中,Scissor +细胞的ADCCRS高于其他细胞类型,而Scissor-细胞的ADCCRS低于其他细胞类型(图9F)。至此,作者成功地在单细胞数据集中找到了可以代表不同ADCCRS状态的细胞。然后,其使用AUCell算法计算多个基因集的富集分数,并在Scissor +细胞和Scissor-细胞之间进行比较(图9G-J)。这一结果与在bulk数据集中进行的GO和GSVA分析一致。

作者还分析了细胞之间的通讯。与Scissor +细胞相比,Scissor-细胞更有效地向其他细胞发送信号(图9K)。在细胞接收和传输信号的能力方面, Scissor- 细胞比Scissor +细胞更活跃地与其他细胞进行交流(图9L, M)。Scissor- 细胞还可以特异性表达HLA-DMA、HLA-DMB、HLADQA1、HLA-DQB1和PECAM1(图9N),向CD4Tconv、DC、单核细胞和成纤维细胞等细胞发送/接收信号(图9L, M)。对于Scissor-细胞特异性表达的这5种分子,它们在LUAD组织中的表达显著低于正常肺组织,并且都是LUAD的保护因素(图9O)。

比较两种ADCCRS患者不同SNV(单核苷酸位点变异)和CNV(拷贝数变异)事件的差异

在TCGA数据集,作者以突变频率最高的前20个基因作为研究重点,可视化了ADCCRS高分组和ADCCRS低分组之间的差异(图10A&B)。后续分析表明,突变频率差异最显著的前19个基因在高ADCCRS组中的频率均较高(图10C)。此外,作者还展示了这些基因之间的共突变联系(图10D)。在对两组间最显著的突变差异进行了进一步的研究,特别是COL22A1和TP53基因。这两个基因的突变与LUAD患者的不良预后相关(图10E)。此外,ADCCRS与多种基因突变形式(图10F)、非整倍性评分强相关(图10G)、SNV新生抗原(图10H)显著正相关。其他发现表明,CNV事件在两个ADCCRS组之间也有很大差异(图10I, K);高ADCCRS组患者CNV事件发生率更高,序列更复杂,而低ADCCRS组患者CNV事件发生率更低,序列更复杂。Chrom-Plots进一步显示,与低ADCCRS组患者相比,高ADCCRS组患者具有更高的G-score(图10J, L),这意味着高ADCCRS的LUAD患者更容易表现出恶性特征。

ADCCRS潜在治疗靶点的鉴定

为了确定针对ADCCRS的潜在治疗靶点,作者研究了ADCCRS与临床使用的LUAD治疗药物之间的关联。在研究的12种药物中,它们在高ADCCRS队列中的IC50值显著低于在低ADCCRS子集中观察到的IC50值(图11A)。此外,相关性分析显示ADCCRS与这些药物的IC50值呈负相关(图11B),这意味着这些药物可能对ADCCRS较高的患者更有益。值得注意的是,与对吉非替尼耐药的细胞系相比,对吉非替尼敏感的LUAD细胞系表现出显著较高的ADCCRS水平(图11C),这进一步验证了作者的推论。

深入验证ADCCRS的预测价值

根据上述研究,ADCCRS成为肺腺癌患者稳健且更好的预后指标。然而,NSCLC包括多种亚型。为了评估ADCCRS对所有类型NSCLC的预测效能,作者整理收集了12个独立的NSCLC患者数据集。与LUAD的结果一致,12个独立队列显示,ADCCRS升高的NSCLC患者的预后显著差于ADCCRS低的患者(图12A)。鉴于ADCCRS在预测肺癌预后方面的显著性能,作者还探索了在其他12种类型癌症中的预测价值,发现高ADCCRS组的癌症患者的总生存期(OS)显著低于低ADCCRS组(图12B)。

通过qRT-PCR和IHC验证关键基因的表达

在实验方面,作者验证了ADCCRGs核心基因的表达。从构建ADCCRS的16个基因中筛选出影响最大的前6个基因FAM117A、ERO1A、PRKCD、SLC16A3、FKBP4和LDHA,并将其指定为枢纽基因。与BEAS-2B(人正常肺上皮细胞)相比,至少在一种肺腺癌细胞系中,ERO1A(图13A)、SLC16A3(图13B)、FKBP4(图13C)和LDHA(图13D)的表达呈上升趋势。此外,FAM117A在3种LUAD细胞株中的表达呈下降趋势(图13E),PRKCD在A549和PC9 LUAD细胞株中的表达呈下降趋势(图13F)。综上所述,这6个关键ADCCRGs的表达趋势与TCGA数据集中分析的结果基本一致。另外,来自HPA数据库的免疫组化图像表明,ERO1A、SLC16A3、FKBP4和LDHA,以上四个基因在LUAD组织中的蛋白表达显著高于正常肺组织 (图13G)。

研究总结:

过去对抗体依赖细胞介导的细胞毒性(ADCC)的研究主要集中在ADCC的机制和功能,以及与ADCC相关的创新癌症治疗策略,作者将研究重点转移到总结肺腺癌(LUAD)中与预后相关的ADCC相关基因。通过整合单细胞和批量rna测序分析获得了许多关键的ADCCRGs,描绘了以ADCCRGs异常表达为特征的两种不同的肺腺癌亚型,并通过整合机器学习开发了基于ADCC的预测指标,即ADCCRS。28个独立队列显示ADCCRS具有较高的预后价值,其预测能力高于已发表的102个LUAD预后模型。结合临床特征和ADCCRS构建的列线图具有良好的诊断效能。此外,我们发现ADCCRS与肿瘤微环境调节因子和治疗反应之间存在显著的相关性,并且ADCCRS作为预测指标在其他癌症中也适用。本文本质上是基因集联合多组学数据挖掘的一个很好的例子。

版权声明:
作者:倾城
链接:https://www.techfm.club/p/126452.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>