蛋白质互作网络PPI的可视化
一、力导向布局(Force-directed Layout):
力导向布局可以通过模拟物理力(例如斥力和引力)来摆放节点,使得相互作用较强的蛋白质会被拉得更近,反之则相隔更远。这种布局能够清晰地展示网络的整体结构和蛋白质之间的关联性。
二、层次布局(Hierarchical Layout):
适用于展示蛋白质的功能模块或层级结构,可以通过该图发现某些蛋白质是否处于信号通路的上游或下游。层次布局可以突出显示PPI网络中的层次关系。
三、比较
1、力导向布局与层次布局的区别:
① 力导向布局(Force-directed layout):力导向图(如 layout = 'fr')是根据节点间的“力”来安排位置的,节点之间通过“弹簧”连接,试图将相互关联的节点拉近,而不相关的节点则推得较远。它适用于表示没有明确层级结构的数据关系,图的形状通常比较松散,视觉上会根据关联程度自适应调整位置。它主要依赖于节点之间的关系强度来确定图的形状。
② 层次布局(Hierarchical layout):层次布局(如 layout = 'dendrogram' 或 layout = 'tree')适用于有明确父子关系或层次结构的数据。例如,分类树、家谱等。层次布局的节点排列通常遵循从上到下、从左到右的层级方式,节点与节点之间的连接顺序反映了它们之间的层级关系。
2、树形布局与力导向布局的视觉差异:
① 力导向布局:节点的位置更为自由,形成较为松散的结构。相邻节点会被拉得较近,而不相邻的节点则较远,节点的布局看起来更为“散开”,适合展示图中节点间的相互关系强度。适用场景:当你关注的是节点之间的关联强度(如基因相互作用、蛋白质网络等)时,力导向布局更加直观。
② 树形布局:节点一般会垂直或水平对齐,形成类似树状的结构,每一层的节点之间较为有序,显示的是基于层次关系的分布。适用场景:当你需要表示基因、蛋白质或其他数据的层次关系时,例如,表示基因家族、进化树等。
3、总结:
① 力导向布局图:更侧重节点之间的相互作用,节点之间的布局由力学模型决定,通常适用于较为复杂且没有严格层级关系的数据。在力导向布局图中,观察节点的相互关系强度,根据节点之间的接近程度可以判断它们的相互关联是否强。
② 层次布局图:侧重展示层级结构,便于观察数据之间的关系和顺序。在树形布局图中,观察节点的层级结构,看哪些基因或蛋白质属于同一层级,哪个是根节点或起始节点。
四、K-Core 分解图(K-Core Decomposition):
可以通过K-Core分解法,识别出PPI网络中的核心结构。这种方法通过移除节点及其相关边,逐步逼近最强的子网络,揭示在整个网络中最具影响力的核心蛋白质。
K-Core 分解图展示了图中不同核心层级的结构。K-Core是一个子图,其中每个节点至少与k个其他节点连接。换句话说,K-Core 图显示的是图中“核心”部分的节点和边。通过这种方式,K-Core 能帮助我们识别哪些节点在网络中处于中心位置,哪些是外围的、边缘的节点。
当你选择k = 3时,图中每个节点至少与3个其他节点有连接,这就是所谓的 K-3 核心。你通过core_numbers > 3过滤出这些节点,从而得到这个核心子图。
五、为什么与力导向布局相似?
1、力导向布局(Force-Directed Layout) 是一种算法,通常用于展示网络中节点间的相对关系。在力导向图中,节点之间的连接力作用和推斥力作用会使得图像尽量平衡,节点彼此之间的距离是基于它们的连接关系来决定的。
2、K-Core 分解图和力导向布局图的相似性,主要体现在以下几点:
① 节点之间的相互联系:1)力导向布局通过物理力的模拟让节点在空间中根据连接关系自动排列,从而也能呈现出结构上的紧密关系。2)K-Core 图通过筛选核心节点,这些节点之间的连接关系会显得更为紧密,类似力导向图中的密集区域。
② 布局和美学:在力导向图和 K-Core 分解图中,节点都通过空间布局进行展示,而且两个图通常都会进行边的颜色编码和节点的大小调整。由于核心节点通常具有较高的度数,它们可能会集中在图的中央部分,从而与力导向布局的中央密集区域相似。
3、区别
① 核心性质:K-Core 图通过计算图中每个节点的核心值,筛选出具有较高连接度的核心部分。这些节点通常在网络中占据重要位置,并且在图中位置通常较为紧密。
② 布局方式:力导向布局更侧重于视觉上的平衡和力学模拟,节点会根据连接关系自动调整位置,呈现出力学上的“稳定”状态。虽然核心节点通常会在图中形成紧密结构,但力导向布局的重点在于图的视觉效果,而非核心层次的结构。
4、总结
虽然 K-Core 分解图 和 力导向布局图 可能看起来相似(都展示了节点之间的连接关系),它们的重点是不同的:
① K-Core 分解图重点是揭示图中重要节点的结构(核心节点)。
② 力导向布局图重点是以力学方式呈现图的视觉结构。
六、社区发现图(Community Detection):
通过社区发现算法(如Louvain算法),可以识别出PPI网络中的模块或群体。每个模块代表一组在生物学上可能相关的蛋白质。
(社区发现图通常通过 社区检测算法(如 Louvain 或 Infomap)来识别网络中紧密连接的子图。我们可以使用 igraph 包的 cluster_louvain 函数来进行社区检测,并绘制社区图。)
这个图是基于之前的 PPI 网络图 的基础上,通过 Infomap 算法 进行社区发现得到的。Infomap 是一种基于信息流的算法,适用于有向图,用来将图中的节点划分到不同的社区中,目的是使得社区内的节点之间的连接密度最大,而社区间的连接密度最小。
我们之前已经创建了 PPI 网络图,这个图展示的是基于节点之间的相互作用(combined_score)生成的网络结构。而通过 Infomap 算法进行社区划分,可以帮助发现网络中的模块或子结构,这些模块或子结构内的节点更加密切相关。这张 社区发现图 是对之前构建的 PPI 网络图 进行进一步分析和可视化的结果。
生物信息学领域非常广泛,难以一次说尽。我们下次继续更新,一起深入学习生物信息学的内容!
喜欢的宝子们点个赞吧~码字不易,且行且珍惜~
共有 0 条评论