TCGAplot在线版:输入基因,一键绘制TCGA基因表达与MSI相关性雷达图

1.  TCGA简介

TCGA(The Cancer

Genome Atlas)收集了大量癌症样本的数据,涉及33种不同癌症、超过20000个样本,包括外显子组测序、RNA测序、microRNA 测序、拷贝数变异、蛋白质组和甲基化组,临床信息等数据,研究者可以利用各种生物信息学工具和统计方法来挖掘数据中的有用信息,推动癌症研究的进展。

2.  TCGAplot简介

华科同济医院的王雄老师课题组利用TCGA数据库,开发了一个TCGA多组学数据泛癌分析和可视化R包TCGAplot[1]。用于泛癌表达以及基因表达与 TMB、MSI、TIME和启动子甲基化之间相关性等分析。

该包整合了配对和未配对的TPM矩阵,Meta、TMB、MSI、启动子甲基化、免疫细胞比率和免疫评分等数据,极大地方便了我们进行泛癌分析,堪称泛癌分析的“神器”。

3.  MSI简介

微卫星不稳定性(Microsatellite

instability,MSI)指在DNA复制过程中,重复的DNA序列片段(即微卫星)增加或减少,引起微卫星长度发生改变,通常由错配修复机制(DNA

mismatch repair,MMR)功能缺陷引起的。根据程度可分为3类:微卫星高度不稳定性(MSI-high,MSI-H),微卫星低度不稳定性(MSI-low,MSI-L)和微卫星稳定(Microsatellite

stable,MSS)。MSI的检测对于肿瘤的早期诊断、预后判断、化疗敏感性判断以及高危人群的圈定等具有重要意义。例如,在结直肠癌中,MSI-H(微卫星高度不稳定)的患者通常具有较好的预后。此外,MSI状态也与免疫治疗反应相关,MSI-H的肿瘤由于具有更多的新生抗原,可能对PD-1/PD-L1抑制剂等免疫治疗药物有更好的反应。

4.  一键在线绘制基因表达与MSI的相关性雷达图

然而,由于TCGAplot R包安装与使用需要相关专业知识。为了更好地帮助大家挖掘TCGA,经与王老师沟通,我们推出了在线版TCGAplot供大家免费使用。

今天,给大家带来的第5个函数:某个基因的表达与MSI的相关性雷达图。

4.1 打开微生信在线作图网站

 4.2  填写感兴趣的基因,选择参数并提交

将感兴趣的基因symbol粘贴到输入框,由于基因名会更新(见:基因名坑你没商量--避免踩坑),所以提交的基因symbol必需在所提供的基因列表里边。例如这里填写基因KLF7,即Kruppel-like factor 7,它是一种转录因子,在生物体内各组织中广泛表达,并参与调控细胞的增殖、分化、再生以及肿瘤发生等重要的生理功能。

我们提供了统计方法,字体等参数供大家选择使用。选择好参数后,点击提交按钮。

4.3 下载图片及数据

由于需要从上万个样品中调取数据并绘图,约40秒后,会出来雷达图。我们提供了pdf、svg两种矢量图,png、tiff两种标量图供大家下载使用。同时也提供了图片对应的数据供下载。

图片说明:

雷达图中最外圈是33种癌症,按字母顺序顺时针排布。名字上的星号表示显著性水平:*表示p<0.05,**表示p<0.01,***表示p<0.001,****表示p<0.0001。这个雷达图包括5个圈,12点位置的刻度是每个圈对应的相关性大小,其中最外圈是0.1,最内圈是-0.4。此图中,距离外圈越近表示正相关越大,距离内圈越近表示负相关性越大。径向的轴对应具体某癌症,以ACC为例,其相关性约为0.04。共33个点连起来围成了一个N边型。这个图的关键在于看准刻度,最大值多少,最小值多少,0点在哪里,有没有星号,N边型的峰和谷对应的都是哪种癌症。

数据说明:

数据包括4列:

Caseid:TCGA数据库的ID,由-分割。

Cancer:肿瘤类型

KLF7:该基因的log2(TPM+1)值,由于存储空间及精度原因,这里仅保留了2位小数。

MSI:微卫星不稳定性值

相关性表格:

数据包括3列:

Cancer:肿瘤类型

Corr:相关性

Corr(p):显著性

注:这个表格是根据上个表格重新计算的,精度可能跟原图略有差异,供参考。

5. MSI计算

王老师的GitHub网站提供了MSI源码,数据似乎来自cbioportal。有兴趣的小伙伴可以参考一下

参考文献:

[1] Liao C, Wang X. TCGAplot: an R package for

integrative pan-cancer analysis and visualization of TCGA multi-omics data. BMC

Bioinformatics. 2023 Dec 17;24(1):483. doi: 10.1186/s12859-023-05615-3. PMID:

38105215; PMCID: PMC10726608

版权声明:
作者:倾城
链接:https://www.techfm.club/p/123119.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>