Cell子刊5.8分2区生信,如何构建单个基因的signature,本篇文章值得参考!
生信小课堂
文章背景
在皮肤黑色素瘤患者中,免疫检查点和靶向激酶抑制剂疗法之间的交叉耐药性证据正在增加。由于转录因子SOX10的缺失导致了对MAPK通路抑制剂的耐受,作者使用生物信息学技术来确定SOX10表达/活性的降低是否与免疫检查点抑制剂耐药性有关。作者整合了来自黑色素瘤细胞模型的SOX10 ChIP-seq、敲除RNA-seq和敲除ATAC-seq数据,以开发一个强大的SOX10基因标签。作者使用计算方法验证了这一特征,并将其作为SOX10依赖活性在独立单细胞和bulk RNA-seq SOX10敲低、细胞系面板和MAPK抑制剂耐药数据集中的度量。对患者单细胞RNA-seq数据的评估显示,在免疫检查点抑制物耐药肿瘤中,SOX10依赖的转录物水平较低。结果表明,SOX10缺陷黑色素瘤细胞与靶向和免疫检查点抑制剂之间的交叉耐药性相关,并强调需要确定针对该亚群的治疗策略。
本研究的工作流程
研究结果
生成SOX10基因标签
文献和数据库搜索发现了多个SOX10基因标签;然而,这些标签的比较显示基因重叠极少(图1A)。Eskiocak等通过将SOX10 (siSOX10)基因表达微阵列的小干扰RNA (siRNA)敲低信号与来自患者基因表达数据集的SOX10芯片-seq和SOX10相关性结果重叠,开发出了下调的25个基因标签。Wouters等开发了两个SOX10标签,称为motif和track。两者都是使用scRNA - seq数据和SCENIC,一种基于共表达识别潜在TF靶标的计算方法创建的具有提供TF和假定基因靶标信息的选项。基于motif和track的标签分别结合了由motif富集和ChIP-seq峰识别的TF调控网络。分子特征数据库(mSigDB)在转录起始位点(TSS)上游1000个碱基和下游100个碱基之间有一个SOX10 ChIP-seq峰值的基因列表。用于开发这些标签的方法的核心差异包括TSS到SOX10 ChIP-seq峰的距离,以及用于产生基因表达数据的来源和技术(图1B)。由于这些标签中的差异,作者决定生成一个SOX10标签,该标签包含多种类型的数据集。
图 1 开发一个强大的SOX10基因标签
作者整合了一份综合列表的注释和生物分子数据集,包括基因、转录本和调控信息,以及ChIP-seq、assay for transposase-accessible chromatin sequencing (ATAC-seq)和RNA-seq数据(图1C)。SOX10敲低ATAC-seq数据的时间序列显示,SOX10 ChIP-seq靶基因的开放染色质持续减少。在Capparelli等人的研究中,在MeWo和A375细胞系中使用两种不同的SOX10 CRISPR引导RNAs (gSOX10)生成了四种SOX10缺失黑色素瘤模型。从相应的RNA-seq数据中,作者对gSOX10和亲本细胞系样本进行了差异基因表达分析,认为四种模型共有的显著下调SOX10 ChIP-seq靶基因为SOX10靶基因。在整合这些结果后,作者开发了一个精细的SOX10- null标签,包含30个基因(图1D和1E)。尽管该标签中的大多数基因至少存在于另一个SOX10基因标签中,但有11个基因是唯一的。通过数据库注释、可视化和综合发现(DAVID)分析作者的标签基因,发现肌动蛋白细胞骨架组织(p值= 1.6E-3)和施旺氏细胞分化(p值= 9E-3)基因集富集。虽然在gSOX10样本中有一些抗原相关基因表达下调或缺失,但根据SOX10 ChIP-seq数据,这些基因并不是预测靶点。
图1 开发一个强大的SOX10基因标
SOX10-knockdown数据集中标签的稳健性
为了确定作者的标签的稳健性,作者首先使用独立的SOX10扰动CM数据集来评估它。该方法采取了一个特征基因列表,并使用基于秩的统计方法来计算总体得分。作者测试了Wouters等人的数据集。由6个CM细胞株的RNA-seq数据组成,每个细胞株转染SOX10靶向siRNA或对照siRNA 72小时。一些SOX10敲除样本的剩余SOX10转录水平与其他细胞株的对照水平相。因此,为了控制细胞株的变异,作者在进行差异表达分析时使用了成对样本模型来生成一个排名列表。GSEA结果显示,在SOX10基因敲低后,SOX10特征显著负富集(p值<0.001)(图2A)。然后作者研究了Sun等人的RNA-seq数据集。其中包含两个SOX10基因敲除样本和一个亲代的对照样本。在处理来自原始读取的数据后,作者使用log2转化比作为预排序基因列表的权重度量来执行GSEA。尽管SOX10基因敲低样本和亲本样本在SOX10表达上有微小差异,但作者观察到SOX10特征接近显著的负富集(p值= 0.099,图2B)。在SOX10的其他基因标签中也观察到了类似的结果。发现作者的标签在两个独立的数据集中,SOX10敲低后出现负富集后,作者得出结论,作者的标签稳健地捕获了CM中SOX10干扰后的基因表达变化。
图 2 SOX10标签在独立的SOX10 knockdown数据集中的富集
为了测试作者的标签在scRNA-seq数据中捕获SOX10活动水平的能力,作者使用了AUCell,该系统使用预定义的按表达水平排序的基因的最高百分比来计算标签中基因的ROC曲线下的面积,从而生成标签得分。通过这样做,作者可以弥补已知的scRNA-seq数据中转录本的缺失。Wouters等人的四组SOX10-knockdown scRNA-seq数据集评估了SOX10后标签分数的差异。作者观察到,在几乎所有与对照样本的两两比较中,sox10依赖的转录本发生了显著变化(图2C-F)。这些结果证实了作者的标签捕获SOX10水平和/或scRNA-seq数据活动的能力。
图2 SOX10标签在独立的SOX10 knockdown数据集中的富集
细胞系panel数据集中特征的稳健性
接下来,作者在多个大规模黑素瘤细胞系群组中评估了他们的标签,以确定其区分SOX 10依赖性转录物与实验诱导的转录物的内源性差异的能力。这一评估将允许作者确定他们的标签是否能够: 1)识别固有低SOX10的黑色素瘤细胞系,2)检测更具有患者群体代表性的不同细胞系中的SOX10丢失。用超过50个CM细胞系样本探索了两个独立的bulk RNA-seq数据集。第一个数据集包括来自癌症依赖图(DepMap)的CM细胞系样本。62个CM样本中有6个几乎没有SOX10表达(图3A)。作者对他们的标记基因的标准化表达数据进行了分级聚类,这导致根据S0X10表达将细胞系分成簇的顶部分支点(图3B)。对于第二个数据集,作者确认了SOX10表达的多模态,并随后将细胞系分层为低(n = 9)组和高(n = 44)组,使用来自双峰核密度的反模态作为截止点(图3C)。使用单样本GSEA (ssGSEA)方法计算每个细胞系的基因标签得分后,作者观察到他们的标签在识别SOX10-low和SOX10-high群体样品时具有很高的准确性(曲线下面积[AUC] 0.98)(图3D)。这些结果表明,本研究的标签可以在大量RNA-seq数据集中区分内源性SOX10低表达和高表达的细胞系,这表明有很强的可重复性。
为了确定标签是否在其他情况下区分SOX10的活性,作者评估了来自已知有不同SOX10表达水平的患者细胞系的scRNA-seq数据。使用AUCell计算SOX10活动评分后,两两比较显示,SOX10低(n = 3)和SOX10表达(n = 7)的细胞系之间存在显著差异(图3E)。当比较SOX10低表达系和SOX10表达系的所有细胞时,SOX10活性也显著下降(p值<1.0 e15)(图3F)。这证实了作者的签名在缺乏内源性SOX10的细胞系的scRNA-seq数据集中捕获SOX10活动的能力。
图 3 SOX10 特征通过多个细胞系队列中 SOX10 表达对样本进行分层
作者测试了他们的标签是如何作为SOX10依赖转录活性的预测因子来对抗SOX10 mRNA表达的。为此,使用了来自DepMap数据库中表达SOX10的CM细胞株的蛋白质组学数据中的SOX10水平。作者对SOX10蛋白表达数据与SOX10 RNA-seq水平和使用ssGSEA从RNA-seq数据计算的标签分数进行了相关性分析。虽然不显著,但作者观察到使用标签得分与SOX10蛋白表达水平的相关性高于使用SOX10 RNA表达数据,这表明,在考虑RNA-seq数据时,作者的签名可能比单独使用SOX10表达更好地解读SOX10依赖的转录。
评估SOX10-null靶向抗抑制剂数据集中的标签
由于SOX10缺失与黑色素瘤中的MAPK抑制剂耐药性有关,作者评估了他们的标签在耐药性模型中捕获SOX10损失的能力。测试了多种耐药CM细胞株,该细胞系是由两个缺乏SOX10表达的单独体内实验建立的。这些包括对BRAFi、PLX8394、BRAFi + MEKi联合治疗,PLX4720 + PD0325901。GSEA与预先排序的列表一起使用,以确定他们的标签在每个耐药细胞系中的富集程度。作者在两株耐PLX8394的细胞株中观察到显著的负富集(p值<0.001)(图4A),在两株耐PLX4720 + PD0325901的细胞株中也观察到显著的负富集(图4B)。这些结果表明,作者的签名在捕获耐药的整体RNA-seq数据中sox10依赖的转录事件丢失方面是稳健的。
图4 SOX10标签可在SOX10耐药数据集中重现
根据作者对sox10敲低和细胞系面板数据的评估,坐着试图利用Schmidt和Mortensen等人的scRNA-seq数据来确定他们的标签是否会在耐药细胞系模型中揭示更低的SOX10依赖转录。未经处理和BRAFi /+ meki耐药的A375样品从原始测序数据中处理,耐药样品中SOX10表达的细胞较少。SOX10活性评分分析显示,当分别考虑每个抗性模型(图4C)或作为一个单独的组(图4D)时,抗性样品中SOX10活性评分显著下降(p值<1.0 e15)。这些结果表明,在scRNA-seq数据中,作者的标签能够捕获BRAFi /+ meki耐药黑色素瘤样本中sox10依赖的转录。
图 4 SOX10标签可在SOX10耐药数据集中重现
降低 ICI 耐药患者肿瘤中的 SOX10 活性水平
在确认标签和AUCell在scRNA-seq数据集中捕捉SOX10依赖差异的能力后,作者试图确定来自ICi治疗患者肿瘤样本的恶性细胞是否与SOX10水平/活性下降有关。为此,作者分析了Alvarez-Breckenridge等人和Jerby-Arnon等人的scRNA-seq队列。作者通过评估来自Capparelli等人的含有SOX10染色的患者肿瘤恶性细胞的IHC数据来跟进这一研究。
作者探索了Alvarez-Breckenridge等人的数据集,以了解治疗反应和SOX10活动评分之间的关联。这个数据集包含了切除的黑素瘤脑转移样本,这些样本以前被分类为ICi治疗(Post-ICi)或ICi初治。标准临床治疗促使每个病例都进行了肿瘤切除术,所有ICi后肿瘤都被描述为因颅内进展而需要切除。每个患者的临床反应先前都被确定为应答者、部分应答者和非应答者,没有一个患者同时具有ICi-naive和ICi后样本。在后来接受了 ICi(Pre-ICi)治疗的三名 ICi 无反应患者中,一人是应答者,其他人是无反应者。根据 Jerby-Arnon 等人使用的标准,作者将肿瘤样本限定为至少有 50 个恶性细胞的样本,以便进行进一步分析。不同治疗组恶性细胞中的 SOX10 特征得分存在差异。当按 Alvarez-Breckenridge 等人定义的组别合并样本时,Pre-ICi 反应者组的平均特征得分最低(图 5A),明显低于 Pre-ICi 非反应者组(p 值 = 2.26 e-3)。虽然没有统计学意义(p 值 = 0.066),但与后ICi 部分应答者相比,后ICi 无应答者的特征得分略低(图 5A)。这些结果表明,ICi 治疗后无反应者与部分反应者的 SOX10 水平/活性呈降低趋势。
作者进一步研究了 Alvarez-Breckenridge 等人的数据集,以确定 SOX10 特征评分与 ICi 是否存在关联。根据患者切除时的全身治疗情况,将无 ICi 样本和后 ICi 样本进行分组,得出无 ICi(n = 8)、On MAPKi(n = 2)、On ICi(n = 6)和 Off ICi(n = 12)肿瘤样本将MAPKi治疗组样本排除在ICi治疗组之外,因为在MAPKi治疗期间,肿瘤进展可能导致SOX10特征得分降低。与未使用 ICi 组(p 值 = 0.0172)和关闭 ICi 组(p 值 = 2.16 e-4)相比,使用 ICi 组的 SOX10 特征得分明显较低(图 5 B)。在分析组间 SOX10 表达时也观察到了类似的结果。
为了确定SOX10水平/活性与ICi抗性之间是否存在关联,作者评估了Jerby-Arnon等人的数据集,其中包含患者肿瘤样本分类为治疗初治或ICi耐药。在不同治疗组中,恶性细胞的SOX10特征得分是异质性的(图5C);然而,在来自ICi耐药样本的恶性细胞中,SOX10特征评分显著降低(p-val = 5.12 e 13)(图5D)。当使用SOX10基因表达数据比较ICi耐药和naive样品时,也观察到类似的结果。这说明在ICi-resist样品中SOX10较低。
作者为了扩展关于ICi治疗患者肿瘤中SOX10依赖性转录水平较低的发现,作者在IHC数据中评估了SOX10的表达。共有22个样本来自过去没有接受过任何治疗(未接受治疗)的患者。在20例既往接受ICi治疗的患者样本中,3例因患者因不良事件停止ICi治疗(n = 1)或没有临床反应和治疗状态信息(n = 2)而被排除。对于既往接受ICi治疗(ICi治疗)的患者的其余样本,使用最新的ICi临床反应信息,将样本分为完全应答者(CRs) (n = 2)和进展或稳定疾病(PD/SD) (n = 12)。在ICi治疗1-2个周期后采集PD样本2例,1例SD患者继续治疗。与两个scRNA-seq数据集相似,作者观察到SOX10在不同处理组之间的异质性染色(图5E)。总的来说,作者观察到,在接受ICi治疗的肿瘤中,SOX10阴性细胞的比例(26%)高于未接受ICi治疗的肿瘤(17.3%)(图5F)。作者还检测到PD/SD样本中SOX10阴性细胞的比例(25.2%)高于CR(10%)和未处理样本。因此,作者得出结论,与CR相比,在ICi治疗的患者肿瘤中,有更多未表达SOX10的恶性细胞,在PD/SD中,有更多未表达SOX10的恶性细胞。
图 5 SOX10 特征揭示了对 ICi 治疗的耐药性
作者还检查了IHC数据,以确定SOX10和On ICi肿瘤之间是否存在关联。部分患者有不同时间点的样本。在两名患者中,有一名患者接受了匹配的治疗初治和ci治疗的肿瘤样本,所有来自On ICi肿瘤的恶性细胞均为SOX10阴性。这些患者中的第二组,在ICi处理的Off ICi样本中,sox10阴性细胞的百分比略有增加。1例进展性疾病患者在ICi治疗期间和治疗后采集样本,其中On ICi样本中SOX10阴性恶性细胞的比例最高。这提示在进行ICi治疗时,可能有更多的恶性细胞缺乏SOX10。
结论
综上所述,作者开发了一个由SOX10调控的CM核心基因列表。一些鉴定出的基因以前与 CM 中的 SOX10 表达无关,但其作用可能与 SOX10 阴性细胞的侵袭特性有关。对不同条件的多个独立数据集的评估验证了作者的基因标签在bulk和 scRNA-seq 数据中确定 SOX10 水平 和/或 活性的能力,以及它作为其他研究 CM 或 SOX10 调控的资源的可用性。作者的研究结果表明,与初治肿瘤相比,ICi耐药肿瘤具有更多缺乏SOX10的细胞。
个人观点,仅供参考
共有 0 条评论