最新8.4分双疾病联合生信分析,机器学习+实验验证,不仅好发,分数还高!
生信小课堂,全网同名
影响因子:8.44
慢性肾病(CKD)是最重要的心血管风险因素之一,在各种心血管疾病中发挥着至关重要的作用,如钙化主动脉瓣疾病(CAVD)。研究表明,CAVD在CKD中比在普通人群中更常见,CKD是CAVD预后的一个独立风险因素,这表明CKD患者可能表现出更高的CAVD风险。然而,导致CKD相关CAVD的潜在分子机制是复杂而模糊的。作者利用多种综合生物信息学工具,通过从基因表达综合(GEO)数据库中收集三个CAVD数据集和两个CKD数据集,来揭示与CKD相关的CAVD背后的枢纽基因和潜在机制。还确定了CAVD中具有治疗效率的潜在化合物。此外,还进行了机器学习,以在CKD相关致病基因中发现的枢纽基因(SLPI和MMP9)为基础,构建CAVD预测的诊断套路图模型。作者验证了枢纽基因的表达模式,并评估了医院一小群患者中构建的组分组图的诊断效率,最后探索了CAVD的免疫细胞特征,以发现中枢基因与免疫景观的关联。
关于非肿瘤生信,我们也解读过很多,主要有以下类型
1 单个疾病WGCNA+PPI分析筛选hub基因。
2 单个疾病结合免疫浸润,热点基因集,机器学习算法等。
3 两种相关疾病联合分析,包括非肿瘤结合非肿瘤,非肿瘤结合肿瘤或者非肿瘤结合泛癌分析
4 基于分型的非肿瘤生信分析
5 单细胞结合普通转录组生信分析
目前非肿瘤生信发文的门槛较低,有需要的朋友欢迎交流
研究结果:
一、数据处理
生物信息学分析的流程图如图1所示。从GEO数据库中收集了三个钙化和控制主动脉瓣样本的原始数据集,并在进行批量效果去除后合并。批量校正后,获得并归一化了集成的CAVD数据集,包括CAVD组的34个钙化样本和对照组的23个对照样本。
如图2A和B,在批量效果去除后,三个数据集之间的差异显著减少。
二、钙化主动脉瓣疾病中差异表达基因的鉴定
有173个差异表达基因(DEG),包含119个上调和54个下调基因。火山图和热图描述DEG的表达模式(图2C和D)。
三、加权基因共表达网络的构建和CAVD中关键模块的识别
进行加权基因共表达网络分析(WGCNA),以识别钙化主动脉瓣样本中最相关的基因模块。选择5的软阈值功率(图3A),共生成了14个模块,模块的集群树形图如图3B所示。模块特征的聚类显示在图3C中。此外,这项研究探索了CAVD和基因模块之间的相关性(图3D)。这些数据显示,粉红色模块与CAVD的正相关性最高,而黄色模块与CAVD负相关性最高。粉红色和黄色模块被认为是后续分析的关键模块。此外,作者分别在粉红色和黄色模块中发现模块成员和基因显著性之间存在很强的关联(图3E,F)。在粉红色和黄色模块中发现了1127个与CAVD显著相关的关键基因。在钙化主动脉瓣样本中进一步交叉了来自DEGs的基因和来自WGCNA的关键基因,以识别CAVD中的关键基因,总共获得了124个基因,并进行了进一步的后续分析(图3G)。
四、慢性肾病中差异表达分泌蛋白的鉴定
从GEO数据库中重新分析了CKD外周血单核细胞(PBMC)和CKD肾组织的表达概况。如图4A和D中通过火山图和热图可视化,在CKD PBMC中共发现了2681个DEG,而在CKD肾脏组织中发现了4111个DEG。通过结合CKD PBMC的376和607种差异表达的分泌蛋白来获得CKD相关的分泌蛋白(图。4E)和肾脏组织数据集(图4F)
五、蛋白质-蛋白质相互作用网络和参与CKD相关CAVD的病原基因的功能富集
采用MCODE确定了前2个最重要的模块,其中包含的76个基因被确定为CKD相关的致病基因。(图5A和B)。将CKD相关致病基因从前2个重要模块导入DAVID在线数据库,基因本体(GO)术语分析的生物过程(BP)表明,CKD相关CAVD中的致病基因主要富含“炎症反应”和“免疫反应”(图5C)。细胞成分(CC)而言,致病基因主要位于“膜的积分成分”和“细胞外区域”(图5D)。分子功能(MF)分析结果表明,“蛋白质结合”和“相同蛋白质结合”是致病基因中最相关的项目(图5E)。KEGG通路分析表明,CKD相关CAVD中的致病基因与“细胞因子-细胞因子受体相互作用”、“PI3K-Akt信号通路”和“NF-Kappa B信号通路”密切相关(图5F)。
六、用于CAVD治疗的候选小分子化合物的鉴定
将来自CKD相关致病基因的钙化主动脉瓣样本中的上调基因导入到(cMAP)数据库中,包括甲硫酮、杰菲替尼、迪拉西普、氨基戊酰胺、甲氧沙林、佛司可林、CGP-37157、IKK2抑制剂、维达拉宾和TG-101348在内的前10名化合物被认为是治疗CKD相关CAVD的潜在药物治疗剂(图6A)。这10种化合物的目标途径和化学结构的描述显示在图6B和C中。
七、通过机器学习和构建CKD相关CAVD的诊断模型来筛选具有诊断价值的中枢基因
作者在CKD相关分泌蛋白和CAVD关键基因的连接处确定了17个常见基因,并随后构建了CAVD诊断模型,该模型可能会区分有或没有CAVD的CKD患者(图7A)。LASSO回归算法用于识别17个常见基因中的8个潜在候选基因,对诊断CKD相关CAVD患者有很大影响(图7B,C)。进行了随机森林(RF)机器学习算法,对17个常见基因进行排名,并提取了具有MeanDecreaseGini > 2的基因(图7D)。将LASSO的八个候选基因和RF的六个潜在基因叠加后,两个子集中只有两个中枢基因重叠,其中包含分泌性白细胞蛋白酶抑制剂(SLPI)和基质金属蛋白酶9(MMP9)(图7E)。为了在诊断和预测方面表现更好,在两个枢纽基因的基础上构建了诺模图(图8A),展现出对CKD相关的CAVD具有很强的诊断值(图。8B-D)。校准曲线发现,诺模图诊断模型的预测概率与理想模型的预测概率几乎相同(图8E)。进行了诺姆图的DCA,表明根据诺姆图模型的决策可能有利于诊断CKD相关CAVD(图8F)。硬化症是CAVD的早期阶段,诺模图还显示了硬化主动脉瓣CKD患者的理想预测价值(图8G),这意味着诺模图模型也可以对患有CKD的早期CAVD患者表现出良好的诊断效果。
八、CAVD中枢基因与免疫细胞浸润相关性分析
图9A显示了每个样本中22种免疫细胞的比例,在10个免疫细胞亚群中,钙化和对照主动脉瓣样本之间有显著差异。与对照组相比,CAVD显示的巨噬细胞M0、CD8T细胞,Tregs细胞的比例更高,而naiveB细胞、树突状细胞激活、巨噬细胞M2、激活的肥大细胞、激活的NK细胞、血浆细胞和naiveCD4T细胞比例较低(图9B)。naiveCD4T细胞与Tregs呈显著正相关,激活的肥大细胞与激活的树突状细胞呈负相关(图9C)。如图9D所示,中枢基因,SLPI和MMP9,都与CAVD中的免疫细胞积累表现出显著的相关性。
九、验证两个中枢基因的表达模式,并评估诺姆图模型的诊断价值
作者先检查了从外部队列中招募的患者中两个中枢基因的表达模式。RT-qPCR结果证实,与控制主动脉瓣样本相比,钙化主动脉瓣样本中两个中枢基因的一致上调表达模式(图10A)。此外,ELISA可以在血清中检测到SLPI和MMP9,在CKD和CAVD患者以及患有CAVD的CKD患者中,水平显著升高(图10B)。作者根据队列开发了一个CAVD诊断组图模型(名为组图A),以预测对照组和CAVD组中CAVD的可能性(图10C)。根据ROC曲线,与每个生物标志物相比,在对照组和CAVD患者之间可以观察到诺模图A的最高AUC(图10D)。用于评估诺模图A的校准曲线和DCA表明,基于诺姆图A的决策可能有利于CAVD的预测(图10E,F)。此外,还构建了另一个诊断性诺模图模型(名为诺模图B),以区分有或没有CAVD的CKD患者(图10G)。同样,ROC和校准曲线以及DCA表明,CAVD CKD患者具有B组谱的理想预测价值(图10H-J)。
研究结果:
本研究首次挖掘了与CKD相关的致病基因,以阐明CKD与后续CAVD之间的联系。据推测,炎症和免疫过程以及包括“细胞因子-细胞因子受体相互作用”、“PI3K-Akt信号通路”和“NF-Kappa B信号通路”在内的信号通路可能是CKD相关CAVD的潜在机制。此外,使用两个与免疫相关的中枢基因SLPI和MMP9来开发诊断粒度图模型,通过机器学习方法预测CAVD的风险。根据ROC曲线评估和队列的外部验证,基于SLPI和MMP9水平的诊断组图模型在显著区分CAVD,特别是CKD患者的CAVD方面表现良好。SLPI可能为患有CAVD的CKD患者提供潜在的诊断指标。
共有 0 条评论