TCGA 成果精读 | 卵巢癌的综合基因组分析
Basic Information
- 英文标题: Integrated genomic analyses of ovarian carcinoma
- 中文标题:卵巢癌的综合基因组分析
- 发表日期:29 June 2011
- 文章类型:Article
- 所属期刊:Nature
- 文章作者:The Cancer Genome Atlas Research Network
- 文章链接:https://www.nature.com/articles/nature10166
Abstract
- 编制导致卵巢癌的分子异常目录对于开发和应用能改善患者生活的疗法至关重要。
- 癌症基因组图谱项目已经分析了489例高级别浆液性卵巢腺癌中的信使RNA表达、微RNA表达、启动子甲基化和DNA拷贝数,并对其中316例肿瘤的编码基因外显子的DNA序列进行了分析。
- 我们在此报告,高级别浆液性卵巢癌的特点是几乎所有肿瘤中都存在TP53突变(96%);在另外九个基因中出现了低频率但统计上显著的体细胞突变,包括NF1、BRCA1、BRCA2、RB1和CDK12;113个显著的焦点DNA拷贝数异常;以及涉及168个基因的启动子甲基化事件。
- 分析界定了四种卵巢癌转录亚型、三种微RNA亚型、四种启动子甲基化亚型以及与生存期相关的转录特征,并揭示了携带BRCA1/2(BRCA1或BRCA2)和CCNE1异常的肿瘤对生存的影响。
- 途径分析表明,在约一半分析的肿瘤中同源重组有缺陷,并且NOTCH和FOXM1信号通路参与了浆液性卵巢癌的病理生理过程。
Main
- 卵巢癌是美国女性癌症死亡的第五大原因;2010年估计有21,880例新病例和13,850例死亡。
- 大多数死亡(约70%)发生在晚期、高级别浆液性卵巢癌患者中。
- 标准治疗包括积极手术后配合铂类-紫杉烷化疗。
- 治疗后,大约25%的患者在六个月内出现铂类耐药性癌症复发。
- 总体五年生存率是31%。
- 大约13%的高级别浆液性卵巢癌可归因于BRCA1/2胚系突变。
- 较小比例的病例可归因于其他胚系突变。
- 然而,大多数卵巢癌可以归咎于越来越多的体细胞异常。
- 缺乏成功的治疗策略促使癌症基因组图谱(TCGA)的研究人员全面测量了临床注释的高级别浆液性卵巢癌(HGS-OvCa)样本中的基因组和表观基因组异常,以识别影响病理生理学、影响预后并构成治疗靶点的分子异常。
- 微阵列分析产生了489个HGS-OvCa肿瘤的mRNA表达、微小RNA(miRNA)表达、DNA拷贝数和DNA启动子甲基化的高分辨率测量。
- 大规模平行测序结合杂交亲和力捕获技术为其中316个样本提供了全外显子DNA序列信息。
Samples and clinical data
- 本文报告了对489例临床注释的II至IV期高级别浆液性卵巢癌(HGS-OvCa)样本及其相应正常DNA的分析(补充方法,第1节,及补充表1.1)。
- 患者反映了通常被诊断为HGS-OvCa个体的诊断年龄、疾病阶段、肿瘤分级和手术结果。
- 临床数据截至2010年8月25日。
- HGS-OvCa样本在系统治疗前通过手术切除,但所有患者均接受了铂类药物治疗,其中94%的患者还接受了紫杉烷类药物治疗。
- 该队列的中位无进展生存期和总生存期与先前发表的试验相似。
- 25%的患者在最后一次随访时仍无疾病复发,45%的患者仍然存活,而31%的患者在完成基于铂类药物的治疗后六个月内出现了疾病进展。
- 中位随访时间为30个月(范围,0-179个月)。
- 用于TCGA分析的样本选择标准是肿瘤细胞核占比超过70%且坏死组织比例低于20%。
- 如表1所示,在独立站点使用多种分子检测方法进行了协调的分子分析。
- 本次分析的数据集可在TCGA网站(http://tcga-data.nci.nih.gov/docs/publications/ov_2011)获取,分为两个级别:公开访问和受控访问。
- 公开访问的数据集对公众开放,而受控访问的数据集包括可能识别出个体的临床或基因组信息,需要用户按照上述网站所述进行认证。
Table 1 Characterization platforms used and data produced
表1 使用的表征平台及产生的数据
Mutation analysis
- 我们对从316个高级别浆液性卵巢癌样本及其各自匹配的正常样本中提取的DNA进行了外显子捕获和测序(补充方法,第2节)。
- 捕获试剂针对大约18,500个基因中的约180,000个外显子,总共有约33兆碱基的非冗余序列。
- 在Illumina GAIIx平台(236个样本对)或ABI SOLiD 3平台(80个样本对)上进行的大规模平行测序产生了每样本约14千兆碱基的数据(总共约9乘以10的12次方个碱基)。
- 平均而言,在肿瘤样本和匹配的正常样本中,76%的编码碱基被覆盖到足够的深度,以便能够自信地检测突变(补充方法,第2节,以及补充图2.1)。
- 我们注释了19,356个体细胞突变(每个肿瘤约61个);这些突变分类见补充表2.1。
- 通过寻找相对于背景显著增加频率的非同义或剪接位点突变、将本研究中的突变与癌症体细胞突变目录及在线孟德尔遗传人类数据库中的突变进行比较、以及预测这些突变对蛋白质功能的影响,我们确定了可能在高级别浆液性卵巢癌病理生理学中重要的突变。
- 两种不同的算法(补充方法,第2节)确定了九个基因(表2),这些基因的非同义或剪接位点突变数量显著多于根据突变分布模型预期的数量。
- 与已发表的结果一致,TP53基因在316个样本中的303个样本中发生突变(283个通过自动化方法检测到,20个通过人工复审确认),BRCA1和BRCA2分别在9%和8%的病例中有胚系突变,并且在另外3%的病例中显示体细胞突变。
- 我们还确定了六个其他统计上频繁突变的基因:RB1、NF1、FAT3、CSMD3、GABRA6和CDK12。
- CDK12参与RNA剪接调控,并以前被发现在肺癌和大肠肿瘤中发挥作用。
- 九个CDK12突变中有五个是无义突变或插入缺失突变,提示可能的功能丧失;四个错义突变(Arg882Leu、Tyr901Cys、Lys975Glu和Leu996Phe)集中在其蛋白激酶域。
- GABRA6和FAT3均表现为显著突变,但在高级别浆液性卵巢癌(HGS-OvCa)(补充图2.1)或输卵管组织中似乎未表达,因此这些基因的突变不太可能在HGS-OvCa发展中扮演重要角色。
Table 2 Significantly mutated genes in HGS-OvCa
表2 显著突变基因在高级别浆液性卵巢癌中的情况
- 我们将本研究中的突变与癌症索引17和在线孟德尔遗传数据库18中的突变进行了比较,以识别更多在高级别浆液性卵巢癌中较少见的突变基因。
- 这些比较分别得到了477个和211个匹配项(补充表2.4),包括BRAF(天冬酰胺581丝氨酸)、PIK3CA(谷氨酸545赖氨酸和组氨酸1047精氨酸)、KRAS(甘氨酸12天冬氨酸)和NRAS(谷氨酰胺61精氨酸)等基因中的突变。
- 这些突变已被证实具有转化活性,因此我们认为这些突变虽然罕见但在高级别浆液性卵巢癌中是重要的驱动因素。
- 我们结合了蛋白质家族和整个脊椎动物基因组序列比对中的进化信息、预测的局部蛋白质结构以及人类SwissProt蛋白质特征(补充方法,第3节),在训练已知致癌基因和肿瘤抑制基因突变的基础上,使用CHASM19,20来识别潜在的驱动突变。
- CHASM鉴定出了122个预测为致癌的错义突变(补充表3.1)。
- 通过比较蛋白质家族序列比对和已知或基于同源性的三维蛋白结构中的残基位置,利用MutationAssessor分析所有已确认的体细胞错义突变,推断出由突变引起的蛋白质功能变化(补充方法,第4节)。
- 预测有27%的错义突变会影响蛋白质功能(补充表2.1)
Copy number analysis
- 识别并比较了489个高分级别浆液性卵巢癌(HGS-OvCa)基因组中的体细胞拷贝数改变(SCNAs),并与多形性胶质母细胞瘤的数据进行了对比(图1a)。
- SCNAs被分为影响广泛染色体区域的区域性异常和影响较小的焦点性异常(补充方法,第5节)。
- 对区域性异常进行的统计分析(补充方法,第5节)发现了8种重复增益和22种缺失,这些之前均有报道(图1b和补充表5.1)。
- 其中5种增益和18种缺失在超过50%的肿瘤中出现。
Figure 1: Genome copy number abnormalities.
- a, 将489例高级别浆液性卵巢癌(HGS-OvCa)与197例多形性胶质母细胞瘤(GBM)肿瘤的拷贝数谱进行比较47。沿着正常基因组的距离(垂直轴,按染色体划分),将拷贝数增加(红色)和减少(蓝色)绘制出来。
- b, 显著且局灶性扩增(红色)和缺失(蓝色)区域沿基因组绘制。注释包括20个最显著的扩增和缺失区域、包含8个或更少基因的精确定位区域以及已知癌症基因或全基因组失活筛选鉴定出的基因所在区域。每个区域所含基因的数量用括号表示。FDR,假发现率。
- c, 显著扩增(红色)和缺失(蓝色)的染色体臂。PowerPoint幻灯片
- 我们使用了GISTIC来识别反复出现的焦点SCNAs。
- 这产生了63个焦点扩增区域(图1c;补充方法,第5节;和补充表5.2),其中包括26个编码了八个或更少基因的区域。
- 最常见的焦点扩增编码了CCNE1、MYC和MECOM,每个基因在超过20%的肿瘤中高度扩增。
- 在HGS-OvCa中发现的新紧密定位的扩增峰编码了激活C-激酶受体ZMYND8、p53靶基因IRF2BP2、DNA结合蛋白抑制因子ID4、胚胎发育基因PAX8以及端粒酶催化亚单位TERT。
- 我们使用了三个数据来源——Ingenuity Systems(http://www.ingenuity.com/)、ClinicalTrials.gov(http://clinicaltrials.gov)和DrugBank(http://www.drugbank.ca)——来确定可能的治疗性抑制剂,针对扩增和过度表达的基因。
- 从这次搜索中,我们发现至少在10%的病例中扩增的22个基因是治疗目标,包括MECOM、MAPK1、CCNE1和KRAS(补充表5.3)。
- GISTIC 还识别出了 50 个焦点缺失(图 1c)。
- 已知的肿瘤抑制基因 PTEN、RB1 和 NF1 在至少 2% 的肿瘤中位于纯合缺失区域。
- 值得注意的是,RB1 和 NF1 也位列显著突变基因之中。
- 其中一个缺失仅包含三个基因,其中包括细胞周期调控关键基因 CREBBP,该基因有五个非同义突变和两个移码突变。
mRNA and miRNA expression and DNA methylation analysis
- 我们结合了来自三个不同平台(Agilent、Affymetrix HuEx 和 Affymetrix U133A)的11,864个基因的表达测量数据,用于亚型识别和预后预测。
- 单个平台的测量数据受到有限但统计学上显著的批次效应的影响,而综合数据集则没有这种影响(补充方法,第11节,以及补充图11.1)。
- 对综合数据集的分析确定了大约1,500个固有可变基因(补充方法,第6节),这些基因被用于非负矩阵分解共识聚类。
- 这一分析产生了四个聚类(图2a和补充方法,第6节)。
- 将相同的分析方法应用于一个公开可用的数据集也产生了四个聚类。
- 比较这两组四个聚类显示出了明显的相关性(补充方法,第6节,以及补充图6.3)。
- 因此,我们认为至少存在四种稳健的表达亚型存在于高级别浆液性卵巢癌中。
Figure 2: Gene and miRNA expression patterns of molecular subtype and outcome prediction in HGS-OvCa.
- 根据基因表达,来自TCGA和参考文献25的肿瘤被分为四个簇。
- 使用训练数据集定义了一个预后基因特征,并将其应用于测试数据集。
- 对四个独立的表达谱数据集进行Kaplan-Meier分析,比较预测的高风险患者与低风险患者的生存情况。包括风险指数的单变量Cox P值。
- 根据miRNA表达,肿瘤被分为三个簇,如所示与基于基因的簇有所重叠。D表示分化;I表示免疫反应性;M表示间质性;P表示增殖(红色字体表示高度重叠)。
- 基于miRNA的三个簇之间的患者生存差异。
- 我们根据聚类中的基因含量(补充方法,第6节)以及先前的观察,将高级别浆液性卵巢癌的四个亚型分别命名为‘免疫反应型’、‘分化型’、‘增殖型’和‘间质型’。
- T细胞趋化因子配体CXCL11和CXCL10以及受体CXCR3定义了免疫反应型。
- 转录因子如HMGA2和SOX11的高表达、卵巢肿瘤标志物(MUC1和MUC16)的低表达以及增殖标志物如MCM2和PCNA的高表达界定了增殖型。
- 分化型与MUC16和MUC1的高表达及分泌型输卵管标记SLPI的表达相关,这表明了一个更为成熟的发育阶段。
- 间质型的特点是HOX基因的高表达以及提示增加间质成分的标记物如肌成纤维细胞(FAP)和微血管周细胞(ANGPTL2和ANGPTL1)的高表达。
- 与输卵管对照相比,在高级别浆液性卵巢癌样本中,168个基因因DNA甲基化增加和肿瘤表达减少而被认为是表观遗传沉默。
- 在整个样本中,DNA甲基化与基因表达降低相关(补充方法,第7节)。
- AMT、CCL21和SPARCL1特别值得注意,因为它们在绝大多数肿瘤中显示出启动子高甲基化。
- 出乎意料的是,先前报道在卵巢癌中被扩增和过表达的RAB25似乎也在一部分肿瘤中表观遗传沉默。
- BRCA1启动子在489个肿瘤中的56个(11.5%)中被高度甲基化并沉默,这与先前报道一致(补充图7.1)。
- 根据肿瘤中的可变DNA甲基化进行共识聚类分析确定了四种亚型(补充方法,第7节,和补充图7.2),这些亚型与年龄差异、BRCA失活事件及生存率显著相关(补充方法,第7节)。
- 然而,这些簇群仅表现出适度稳定性。
- 在TCGA数据集中,转录亚型的生存期并无显著差异。
- 增殖组显示MYC扩增和RB1缺失的比例下降,而免疫反应亚型则显示出3q26.2 (MECOM)扩增频率增加。
- DNA甲基化聚类与基因表达亚型之间存在适度但显著的重叠(P小于2.2×10的-16次方,卡方检验,调整后的Rand指数为0.07;补充方法部分7及补充表7.6)
- 利用来自215个样本的整合表达数据集,定义了一个预测总生存期的193基因转录特征。
- 经过单变量Cox回归分析后,我们发现108个基因与较差的生存相关,而85个基因与较好的生存相关(P值截断点为0.01;补充方法,第6节,以及补充表6.4)。
- 我们在一个独立的255个TCGA样本集(图2b)以及三个独立的表达数据集上验证了这一基因表达特征的预测能力。
- 每个验证样本都被赋予了一个预后基因评分,反映了其表达谱与预后基因特征之间的相似性(补充方法,第6节)。
- 对这一特征进行的Kaplan-Meier生存分析显示,在所有验证数据集中均存在与生存显著相关的关联(图2c和补充方法,第6节)。
- 对miRNA表达数据进行非负矩阵分解一致性聚类识别出了三种亚型(补充图6.5)。
- 值得注意的是,miRNA亚型1与mRNA增殖亚型重叠,而miRNA亚型2与mRNA间质亚型重叠(图2d)。
- 不同miRNA亚型之间的生存期存在显著差异:miRNA亚型1肿瘤患者的生存时间显著更长(图2e)。
Pathways influencing disease
- 几项分析整合了来自316个完全分析病例的数据,以确定对高级别浆液性卵巢癌(HGS-OvCa)产生贡献的生物学机制。
- 通过分析已知与癌症相关的通路中出现一个或多个突变、拷贝数变化或基因表达变化的频率,结果显示RB1和PI3K/RAS通路分别在67%和45%的病例中受到调控失常(图3a及补充方法,第8部分)。
- 利用HOTNET33在一个大型蛋白质-蛋白质相互作用网络32中搜索改变的子网络,识别出了几个已知的通路(补充方法,第9部分),其中包括在22%的HGS-OvCa样本中发生变化的NOTCH信号传导途径34(图3b)。
Figure 3: Altered pathways in HGS-OvCa.
- 通过精心分析确定的a、b、RB和PI3K/RAS途径(a),以及通过HOTNET分析确定的NOTCH途径(b)常常发生改变。这些改变包括体细胞突变、DNA拷贝数变化或在某些情况下与二倍体肿瘤表达相比显著上调或下调。改变频率以所有病例的百分比表示;激活基因显示为红色,失活基因显示为蓝色。
- 同源重组(HR)途径中的基因在高达51%的病例中发生改变。BRCA1/2状态的生存分析表明,BRCA1/2突变病例(具有更高的总生存率)与BRCA1/2野生型相比有不同结局,并且BRCA1表观遗传沉默的病例预后较差。FA,范可尼贫血。
- FOXM1转录因子网络在84%的病例中被激活。每个基因被描绘为一个多环圆圈,其中其拷贝数(外环)和基因表达(内环)被绘制出来,使得环中的每一条‘辐条’代表一个单独的患者样本,样本按FOXM1表达增加的顺序排列。从美国国家癌症研究所途径交互数据库获取的兴奋性相互作用(红色箭头)和抑制性相互作用(蓝色线)。
- 虚线表示转录调控。PowerPoint幻灯片
- 已发表的研究表明,BRCA1突变或甲基化以及BRCA2突变的细胞具有同源重组缺陷,并对聚ADP核糖聚合酶(PARP)抑制剂高度敏感。
- 图3c显示,在我们研究的高级别浆液性卵巢癌(HGS-OvCa)样本中有20%存在BRCA1/2的种系或体细胞突变,11%通过DNA高甲基化丢失了BRCA1表达,并且BRCA1的表观遗传沉默与BRCA1/2突变是相互排斥的(P = 4.4 × 10^-4,费舍精确检验)。
- BRCA1/2状态的单变量生存分析(图3c)表明,BRCA1/2突变病例比BRCA1/2野生型病例有更好的总生存期。
- 值得注意的是,表观遗传沉默的BRCA1病例的生存期与BRCA1/2野生型HGS-OvCa肿瘤相似(各自的中位总生存期分别为41.5个月和41.9个月,P = 0.69,对数秩检验;补充方法,第8节,及补充图8.13b)。
- 这表明BRCA1通过基因组和表观基因组两种相互排斥的机制失活,并且患者的生存期取决于失活机制。
- 本研究中发现的可能使细胞对PARP抑制剂敏感的其他同源重组基因的基因组改变包括EMSY(也称为C11orf30)的扩增或突变(8%),PTEN的焦点缺失或突变(7%),RAD51C的高甲基化(3%),ATM或ATR的突变(2%),以及范可尼贫血基因的突变(5%)。
- 总体而言,大约一半的所有HGS-OvCa病例可能存在同源重组缺陷,这为针对这些与同源重组相关的异常的肿瘤开展PARP抑制剂临床试验提供了理论依据。
- 将BRCA失活事件的完整集合与所有反复改变的拷贝数峰进行比较,结果显示,在BRCA失活病例中CCNE1扩增的发生频率意外地低(BRCA改变病例中有8%存在CCNE1扩增,而BRCA野生型病例中有26%存在;Q = 0.0048,已对假发现率进行了调整)。
- 正如先前报道的那样,总体生存期倾向于在CCNE1扩增的患者中比在所有其他病例中的患者更低(P = 0.072,日志秩检验;补充方法,第8节,以及补充图8.14a)。
- 然而,在仅观察BRCA野生型病例时,并未显示出CCNE1扩增病例存在生存劣势(P = 0.24,日志秩检验;补充方法,第8节,以及补充图8.14b),这表明先前报告的CCNE1生存差异可以通过BRCA突变病例的较高生存率来解释。
- 最后,我们使用了一种概率图模型(PARADIGM)来搜索美国国立癌症研究所通路交互数据库中的改变途径,并发现FOXM1转录因子网络在87%的病例中显著改变(补充方法,第10节,以及补充图10.1–10.3)。
- FOXM1及其与增殖相关的靶基因AurB(AURKB)、CCNB1、BIRC5、CDC25和PLK1始终过表达,但并未因DNA拷贝数变化而改变,这表明存在转录调控。
- TP53在DNA损伤后抑制FOXM1,提示HGS-OvCa中TP53突变率高可能是导致FOXM1过表达的一个因素。
- 在其他数据集中,FOXM1途径相对于邻近上皮组织在肿瘤中显著激活(补充方法,第10节,以及补充图10.4),并且与HGS-OvCa相关(补充方法,第10节,以及补充图10.5)。
Discussion
- 这项TCGA研究提供了HGS-OvCa中异常情况的大规模综合视图。整体而言,突变谱出乎意料地简单。
- TP53中的突变占据主导地位,出现在至少96%的HGS-OvCa样本中;BRCA1和BRCA2在22%的肿瘤中发生突变,这归因于种系和体细胞突变的组合。
- 另外识别出了七个显著突变基因,但仅出现在2-6%的HGS-OvCa样本中。
- 相比之下,HGS-OvCa显示了显著的基因组紊乱程度。
- SCNA的发生频率与先前TCGA在胶质母细胞瘤中的发现形成了鲜明对比,在胶质母细胞瘤中,有更多频繁突变的基因,而染色体臂水平或焦点SCNA的数量却少得多(图1a)。
- 潜在DNA修复基因(包括同源重组成分)中的高发突变和启动子甲基化可能是SCNA高发的原因。
- 突变谱使HGS-OvCa与其他卵巢癌组织学亚型完全不同。
- 例如,透明细胞卵巢癌肿瘤中很少有TP53突变,但ARID1A和PIK3CA突变更频繁。
- 子宫内膜样卵巢癌肿瘤中CTNNB1、ARID1A和PIK3CA突变更常见,而TP53突变率较低。
- 黏液性卵巢癌肿瘤中KRAS突变更普遍。
- 这些卵巢癌亚型之间的差异可能反映了病因和血统效应的结合,并代表了通过亚型分层护理改善卵巢癌预后的机遇。
- 识别新的治疗策略是TCGA的核心目标之一。大约50%的高级别浆液性卵巢癌肿瘤存在同源重组缺陷,可能从PARP抑制剂中获益。
- 除此之外,通常失调的途径,如RB、RAS/PI3K、FOXM1和NOTCH,为治疗提供了机会。
- 最后,针对复发性扩增区域中的22个基因已经存在抑制剂(补充方法,第5节,及补充表5.3),对于这些目标基因扩增的高级别浆液性卵巢癌病例值得进行评估。
- 总体而言,这些发现为针对高级别浆液性卵巢癌的治疗方法奠定了基础,在这种方法中,检测到异常的基因或网络,并选择有效的疗法针对这些特定的异常进行治疗。
Methods Summary
- 所有样本均来自患者,并已获得相关机构审查委员会的适当同意。
- 使用Allprep试剂盒(Qiagen)从样品中收集DNA和RNA。
- 我们采用商业技术捕获并测序全基因组扩增肿瘤DNA和正常DNA的外显子组。
- DNA序列与人类基因组NCBI Build 36比对;重复读取被排除在突变调用之外。
- 突变验证是在同一肿瘤DNA的单独全基因组扩增上进行的。
- 通过将显著突变基因与基于确切测定的特定序列损伤率的预期模型进行比较来识别它们。
- 使用CHASM20和MutationAssessor(补充方法,第4节)来识别功能突变。
- 通过对Agilent 1M特征拷贝数的循环二进制分割数据进行GISTIC分析,并将其结果与其他平台的结果进行比较,以识别复发峰,并确定可能的平台特异性伪影。
- 共识聚类方法用于分析mRNA、miRNA和甲基化亚型以及使用先前方法预测结果。
- 使用HOTNET33来识别蛋白质-蛋白质相互作用网络中事件发生概率超过偶然发生的部分。
- 对具有显著可能性为有效的网络进行了已知注释比例增加的评估。
- 使用PARADIGM41来估计整合途径活性,并识别高分级卵巢癌(HGS-OvCa)中网络模型的不同激活部分
Accession codes
Data deposits
数据沉积
- 此处报告的序列信息已提交至dbGaP,登录号为PHS000178。
本文由mdnice多平台发布
共有 0 条评论