肿瘤突变位点临床解读数据库:CIVIC、JAX CKB、My Cancer Genome
作者,Evil Genius
最近听美国人指挥,构建临床解读数据库,当然之前分享过数据库,文章在NGS基因测序(panel)报告解读数据库汇总
从工作的态度上看,我现在理解为什么科研人员都喜欢待在美国了。
美国对中国的封锁也越来越紧了,很多数据库国内已经访问不到了,而且大部分都要花钱了,而在美国内部很多事开放的。
和美国人开会多了,感觉自己的英语口语也有了很大的提升。
其中美国博士强调了这几个医学数据库,包括CIVIC、JAX CKB、My Cancer Genome,我们来看一下。
1、CIVIC:免费开源的肿瘤突变位点临床解读数据库
CIViC数据平台的全称是:Clinical Interpretation of Variants inCancer。翻译成中文就是癌症基因序列变化的临床解释。CIViC是一个由肿瘤基因解码专家共同搭建的一个开放的网络平台。建立CIViC平台的目的,就是集中基因信息解码生态圈的资源,共同对癌症中的基因序列变化进行注释、讨论、和应用。并且通过这个平台传播基因对癌症的发生、治疗的知识。推进精准医学的发展。
我们重点看临床意义证据这块:
-
(1)EID,DIS,DRUGS,DESC分别是证据ID,癌种,药物和证据描述。提示了针对这个基因变异,哪些癌种中有对应的靶药。
-
(2)如果要确认,对靶药是敏感的还是耐药的话,可以看后面的证据详情:“EL”,“ET”,“ED”,“CS”,“VO”,“ER”(分别表示“Evidence Level”,“Evidence Type”,“Evidence Direction”,“Clinical Significance”,“Variant Origin”,“Evidence Rating”)。
下面是关键字的解释:
关键字 | 解释 |
---|---|
证据等级(EL) | 指示用药证据强弱,由A至E依次较低 |
证据类型(ET) | 指示该位点具有诊断,用药还是预后意义 |
证据方向(ED) | 指示证据是支持性的还是否定性的 |
临床意义(CS) | 指示该变异的临床意义(比如对该药物是敏感的还是耐药的) |
变异来源(VO)和证据星级 (ER) | 分别指示变异是胚系或者体系,文献证据强弱 |
CIViC 是免费数据库,但是同时具有超高更新频率,点点鼠标即可下载。
包括
- (1)“GeneSummaries.tsv”:肿瘤相关的基因列表和基因介绍。
- (2)“VariantSummaries.tsv”:变异位点列表和变异位点介绍。
- (3)“ClinicalEvidenceSummaries. tsv”:里面包含了变异位点对应的靶药,以及证据等级。
- (4) “VariantGroupSummaries. tsv”和“AssertionSummaries. tsv”分别是 CIViC 将变异归类和用其它相关指南标准进行分级的信息。
大家如果用心整理会得到类似下面的结果
Gene | HGNC_ID | Variant_type | Alteration | Normalized alteration | gene2 | GENE2_id | Special_rule_logic | Cancer Type | Drugs_and_combinations | evidence_direction | evidence_level | significance | source | evidence_statement |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ABL1 | HGNC:76 | Fusion | BCR-ABL1 | NULL | BCR | HGNC:1014 | NULL | Acute Lymphoblastic Leukemia | Dasatinib | Supports | C | Sensitivity/Response | PMID: 16775234 | Prior to dasatinib treatment, one imatinib-resistant patient with acute lymphoblastic leukemia had the BCR-ABL1 fusion with no secondary variants in at least ten bacterial clones generated using peripheral blood RNA. They had NEL (no evidence of leukemia) best hematologic and minor best cytogenetic responses to dasatinib. |
ABL1 | HGNC:76 | Fusion | BCR-ABL1 | NULL | BCR | HGNC:1014 | ABL1 E255K | Acute Lymphoblastic Leukemia | Dasatinib | Supports | C | Resistance | PMID: 16775234 | Prior to dasatinib treatment, one imatinib-resistant patient with acute lymphoblastic leukemia had the BCR-ABL1 fusion with the E255K secondary variant in 3/12 bacterial clones generated using peripheral blood RNA. They had no best hematologic and no best cytogenetic responses to dasatinib which were worse compared to responses in patient with unmutated BCR-ABL1. |
其中我们需要重点关注的是证据是否支持、证据等级、耐药/敏感、来源等,这是肿瘤报告中C类D类证据等级的重要来源。
2、JAX CKB
这个数据库非常的严谨,不是有钱就可以的。购买之前会和对方的工作人员进行视频会议,聊用这个数据库的目的是什么,如果是科研,美国要求传递数据到JAX数据库,对方会给出结果,但是如果用于商业,是严格把关的,费用相当高。
跟美国JAX数据库人员聊的时候发现确实美国科研人员十分的严谨,绝对是在完全掌握用处目的之后才会考虑是否将数据库提供给我们服务。
当然了,我们这边主要是爬取数据库信息用于商业,这是对方严厉禁止的。
顺便提一句,对接我的那个美国人是个女的,长得真是太漂亮了,我一个中国人都心动了。
JAX CKB 全称是JAX-Clinical Knowledgebase。 可以用来搜寻和靶药相关的信息。 可以按基因、位点、药物的分组、肿瘤类型来查找。 比如要找EGFR T790M这个位点的相关药物研究信息。 只要通过查找EGFR基因,再找到T790M变异,其中还有这个位点的解释以及文献出处,以及这个位点的用药证据说明。
这个数据库封锁最严重,很难通过外部手段爬取所有的内容。CKB知识库包含基因/变异注释、治疗、诊断/预后信息以及与肿瘤相关的临床试验,不仅收录了有关体细胞基因变异对蛋白功能影响的最新信息,还通过循证医学证据将变异与靶向治疗联系起来。此外,CKB整理了临床试验患者包括基因组改变(基因型特异性)的入组标准,日前CKB的公共访问版本包含85个常见驱动基因。
CKB分子谱包含一个或多个基因变异,包括任何单核苷酸变异、插入、缺失、重复、拷贝数变异和/或表达变化。单核苷酸变异、小插入或缺失以及重复的命名遵循HGVS命名法。CKB还包含了higherordervariants”以适应未指定的变异,如EGFRmut、EGFRactmut(用于EGFR激活突变)和EGFRexon19deletion。另外更复杂的分子谱可以包含来白多个基因的变异,如KRASG12D+PTENdecexp+TP53R306”
这些分子谱通过“分子档案反应”链接到有效的证据注释,这些注释由已发表的文献整理而成。可以清晰地查询到复杂分子谱与治疗反应之间的关系。尤其是复杂分子谱的概念的引入,使治疗效果数据与多个基因组变化同时关联,可以快速注确地评估复杂的癌症相关数据。可能有助于简化临床决策。例如EGFRE746_A750de和MET扩增,在一项临床研究(证据来源)中被证明具有该突变的肺癌(肿瘤类型)患者对奥希替尼(治疗)具有耐药性(反应类型)。
3、My Cancer Genome数据库
数据库提供了癌症相关基因及特定癌症相关基因突变和临床相关性的最新信息,以及相关抗肿瘤药物类别、靶点和名称等信息,并且还收录了FDA批准或正在进行的临床试验,美国人特别推崇这个数据库。
特点优势:
- 为医生、病人、相关研究者提供了一个精准的肿瘤医学知识库
- 实时更新肿瘤形成和发展的关键突变信息,以及相关治疗影响,包括目前的临床试验
- 快捷搜索、匹配肿瘤突变和治疗的信息,辅助临床治疗
数据来源:
查询方面包括临床试验、疾病、分子靶标、药物、通路
共有 0 条评论