文献阅读:NCI-60细胞外囊泡的蛋白质组学分析揭示了常见的蛋白质和癌症类型特异性生物标志物
文献信息
标题:Proteomic profiling of NCI-60 extracellular vesicles uncovers common protein cargo and cancer type-specific biomarkers
DOI(url): https://www.oncotarget.com/article/13569/text/
日期及杂志:Oncotarget, November 24, 2016
作者及单位:Stephanie N, Department of Biomedical Sciences, Florida State University College of Medicine, Tallahassee, FL 32306, USA
文献概述(这篇文献的结论是什么?)
本文讨论了来自美国国家癌症研究所(NCI-60) 60种不同细胞系的细胞外囊泡(EVs)的特征。该研究旨在提供EV的全面蛋白质组学概况,并确定常见的蛋白质货物以及癌症类型特异性生物标志物。研究人员在EV中发现了6071种独特的蛋白质,其中213种蛋白质是所有细胞系共有的。这些蛋白包括已建立的EV标记和囊泡运输蛋白。蛋白质的差异表达分析揭示了癌症诊断和预后的潜在生物标志物。网络分析确定了与囊泡分泌相关的EV成分。EV蛋白质组与全细胞分子图谱的整合显示出相似性,这表明EV反映了它们的祖细胞含量,可以作为疾病的指标。该研究强调了EV在癌症诊断和治疗方面的生物标志物发现和临床应用的潜力。
文献结果(每个结果的图片详细解读)
1、癌细胞衍生的EV含有核心囊泡机制
从60个细胞系(NCI-60)中以图1A的方式收集了EV蛋白。为了检查已知EV蛋白之间的重叠,将NCI-60 的EV蛋白与Vesiclepedia数据库中的蛋白进行比较(图1B),为了增加数据严谨性,只有在至少2/3细胞系中发现的蛋白被定义为[NCI-60]stringent,并与数据库进行比较,与数据库有97%以上的重叠(图1B)。60个细胞系被分类为9个具有代表性的组织学起源:乳腺癌、脑癌(CNS)、结肠癌、肾脏、白血病、肺癌、黑色素瘤、卵巢癌和前列腺癌。在所有组织类型中,每个细胞系平均鉴定出近1900个蛋白质(图1C)。除了前列腺外,各组组织中发现的EV蛋白总数相似(图1D),这可能是由于该组织类型的细胞系较少(n=2)。值得注意的是,165种蛋白质仅在白血病来源的ev中发现,而在其他组织类型中发现的独特蛋白质较少。
2、富集分析强调了癌细胞EV蛋白的亚细胞定位和功能
对[NCI-60]stringent中的蛋白进行功能和通路富集,在数据集中发现了富含蛋白质定位、运输和囊泡功能的蛋白质(图2A)。通路分析显示,在RNA加工和蛋白水解过程以及细胞骨架和内吞过程中,蛋白质富集(图2B)。利用FunRich进行亚细胞定位富集。经BH校正后,所有项均显著(p < 0.001)(图2C)。图2D比较了NCI-60细胞系ev中常见EV maker的数目分布。
3、EV蛋白质组按组织类型聚集,其包含癌症类型特有的蛋白质
图3A.基于不同组织类型的囊泡蛋白的PCA图。图3B.基于EV蛋白质组谱的细胞系无监督分层聚类。Agrin (AGRN)仅在白血病源性ev中不存在(图3C)。粘附分子ICAM3主要存在于白血病细胞系分泌的EV中(图3D)。黑色素前体蛋白PMEL存在于所有黑色素瘤细胞类型分泌的囊泡中(图3E)。Tenascin XB (TNXB)仅在高级别前列腺腺癌细胞系PC-3细胞中发现丰富水平(图3F)。
4、保守的囊泡蛋白与EV分泌相关
蛋白质的分层聚类(图4A)展示了相互关联的表达模式,并产生了15个高度相关的蛋白质模块。含有88个蛋白的黄色模块与性状分泌的相关性最显著(图4B)。在黄色模块中,蛋白质显著性和模块membership呈正相关(p = 0.006)(图4C)。黄色模块的富集分析表明,在细胞粘附和生长、GTPase活性和细胞表面受体信号传导方面,蛋白质显著富集(图4D),包括CD63、CD81、VAMP3、syntenin-1和SEC22B等EV蛋白。
5、肿瘤囊泡蛋白质组反映了祖细胞的分子组成
图5A.通过NCI-60 panel对细胞蛋白质组和转录组进行共惯性分析。标记代表细胞系在各自蛋白质组或转录组空间中的相对位置,其中数据集的差异通过连接向量来描绘。驱动组织依赖性聚类的分子被绘制为相同方向上重叠的蛋白质(细胞和囊泡)和RNA转录数据(图5B)。特征值的直方图(图5C)表明,第一个和第二个共惯性轴代表了在所绘制的数据集中所看到的总方差(特征值之和)的49%,分别占方差的31%和18%。还检查了三个数据集,以考虑每个数据集贡献了多少特征值的方差(图5D),没有一个单独的数据集对两个共惯性轴都有贡献。比较整个细胞和囊泡蛋白的表达水平发现,囊泡或细胞中有一些外围蛋白富集(图5E-5H)。
文献方法(使用的生物信息学方法)
1、使用数据
60个细胞系(NCI-60)中获得的EV蛋白,包括6071种蛋白,其中213种蛋白是所有细胞系共有的
细胞蛋白质组数据来自http://proteomics.wzw.tum.de/nci60
转录组基因表达数据下载自NCBI gene expression Omnibus的GSE32474
2、分析方法
从MaxQuant软件导出原始count数据,使用DeSeq2进行差异表达分析并进行归一化,进一步使用VST函数进行转换。对前500个变异蛋白进行PCA分析。
使用R进行加权基因共表达网络分析(WGCNA)分析,步骤包括:1)生成蛋白质表达的共表达矩阵,2)将蛋白质相关性转化为邻接矩阵用于网络构建,3)将显示高相关的蛋白质(模块)分组在一起,4)将特征蛋白(每个模块的第一个主要成分)与感兴趣的生物性状相关联。
共惯性分析,用于检测NCI-60细胞系中EV蛋白质组、细胞蛋白质组和转录组的相似性。使用R omicade4软件包,通过共惯性分析显示样品与分子分析之间的差异。
使用DAVID v6.7进行功能和通路富集,使用FunRich v3分析cellular compartment的富集。
文章亮点(这篇文献的优点在哪?)
-
扩充了已知的EV蛋白列表近20%
-
在这些鉴定的蛋白质中,213种是所有细胞系共有的。这个核心EV蛋白质组可能代表了囊泡的保守结构和信号成分,以及参与囊泡生物发生和分泌的分子因子,213种蛋白质中有25种被发现与EV分泌水平呈正相关
我的疑问(这篇文献的不足在哪?)
- 无法准确定义EV亚型,对解释EV异质性成果有限
和我相关(我从这篇文献里学到了什么?)
- 协惯量分析(co-intertia anaysis ,CoIA)是一种多元统计方法和排序方法,它计算两个数据集内变量交叉的协方差矩阵,找出两种数据集空间中存在的协同结构,并将这两种数据集的变量投影到同一空间(也叫协惯量平面,Co-incritia plane)。CoIA用于衡量两组数据集之间的一致性,它所分析的两数据集之间无解释变量与响应变量之分,二者无解释与被解释关系。CoIA分析与偏最小二乘回归相关联,是经典回归的可靠替代方法,对于物种-环境关系的确立,CoIA无需考虑对环境变量数量的限制。CoIA分析在生物学领域的多组学研究中应用广泛,如物种-环境的交互(微生物群落)、确定两组环境变量的相关性或者物种间的共变(微生物群落)、物种组成与功能的关系以及群落功能的一致性等。
共有 0 条评论