数据库分享 | 从人类和小鼠组织在正常状态和疾病状态下的单细胞RNA测序中构建的细胞-细胞通讯网络图

Basic Information

  • 英文标题: CellCommuNet: an atlas of cell–cell communication networks from single-cell RNA sequencing of human and mouse tissues in normal and disease states
  • 中文标题:CellCommuNet:从人类和小鼠组织在正常状态和疾病状态下的单细胞RNA测序中构建的细胞-细胞通讯网络图集
  • 发表日期:18 October 2023
  • 文章类型:Na
  • 所属期刊:Nucleic Acids Research
  • 文章作者:Qinfeng Ma | Jianbo Pan
  • 文章链接:https://academic.oup.com/nar/article/52/D1/D597/7321072

Abstract

  1. 细胞间通讯作为多细胞生物的基本特征,对于维持细胞、器官和整个生物体的生物学功能及微环境稳态至关重要。
  2. 细胞间通讯的变化与多种疾病相关,包括癌症。
  3. 单细胞RNA测序(scRNA-seq)通过使我们能够分析配体-受体相互作用,为研究细胞间通讯提供了一种强有力的方法。
  4. 在此,我们介绍CellCommuNet(http://www.inbirg.com/cellcommunet/),这是一个全面的数据资源库,用于探索人类和小鼠组织正常状态和疾病状态下单细胞RNA测序数据中的细胞间通讯网络。
  5. 目前,CellCommuNet包含了来自多个来源的376个单一数据集,以及118组比较数据集,这些数据集来源于同一研究中的疾病和正常样本之间的对比。
  6. CellCommuNet提供了关于细胞间通讯强度及其相关信号通路的信息,并有助于探索健康状态与疾病状态之间细胞间通讯的差异。
  7. 用户还可以搜索特定的信号通路、配体-受体对以及感兴趣的细胞类型。
  8. CellCommuNet提供了交互式图形来展示不同状态下的细胞间通讯,使得能够对疾病样本与对照样本之间的通讯强度进行差异分析。
  9. 这个综合数据库旨在成为研究细胞间通讯网络的生物学家们宝贵的资源。

Introduction

Para_01
  1. 多细胞生物体的生物学活性依赖于体内细胞间的协作,而这又取决于各种细胞之间的通讯。
  2. 细胞间通讯与合作的动态网络对于维持细胞、器官和微环境的稳态至关重要。
  3. 细胞通讯的中断或异常可能导致功能障碍,在严重的情况下甚至导致疾病乃至癌症的发展。
  4. 例如,红细胞岛内巨噬细胞与红细胞生成细胞之间的相互作用有助于正常的红细胞生成。
  5. 特定配体-受体相互作用的发生程度与调节性T细胞浸润及肿瘤生长的程度有着显著的相关性。
  6. 正常的细胞通讯主要依赖于体内一系列分子,包括配体、受体、离子、激素、神经递质和细胞因子。
  7. 传统研究通常通过酵母双杂交筛选和共免疫沉淀等技术在体外实验中专注于研究特定的细胞类型和信号分子。
  8. 虽然这些方法可以精确测量特定细胞类型之间的相互作用,但它们忽略了细胞通讯是在多种细胞类型和大量信号分子的背景下发生的这一事实。
  9. 随着单细胞技术的兴起,研究人员能够获得单细胞分辨率的基因表达谱,从而更全面地探索细胞-细胞通讯网络。
  10. 此外,单细胞技术在识别复杂组织内的细胞异质性方面具有优势,有助于发现新的或罕见的细胞类型。
  11. 这有助于更好地理解细胞通讯网络。
Para_02
  1. 近年来,已开发出多种计算工具来根据单细胞RNA测序(scRNA-seq)数据预测细胞间通信网络,包括celltalker、CellPhoneDB、NicheNet和CellChat等。
  2. 尽管所有这些工具都是基于受体和配体的表达模式来推断细胞间的信号传递关系,但每种工具都有其独特之处,因为它们采用了不同的细胞信号网络计算建模方法。
  3. Celltalker采用基于阈值的方法进行推断,利用超过预定义阈值的配体和受体的表达水平。
  4. CellPhoneDB采用基于细胞类型标签置换的方法来推断细胞之间的相互作用。
  5. 简而言之,它首先计算各自细胞类型内配体和受体的平均表达值。
  6. 然后,通过反复随机置换细胞类型标签,计算交互作用的零分布。
  7. 最后,它使用实际丰富度得分超过计算得到的丰富度得分的比例作为配体-受体对的交互得分。
  8. NicheNet是一种基于网络的代表性工具,用于推断细胞间的相互作用。
  9. 它利用定制的PageRank算法来衡量配体-受体途径相互作用预测下游途径靶点的能力。
  10. CellChat采用共表达策略,将信号调节剂(如可溶性激动剂和拮抗剂)整合到其专有的CellChatDB数据库中,并将交互信息融入信号传导途径,从而能够可视化更复杂的细胞间通信网络。
  11. 最近的一项研究中,研究人员系统地比较了16种资源和7种细胞间通信分析工具。
  12. 他们整合了所有这些分析资源和工具,开发了一个名为LIANA的分析框架。
  13. 该框架有助于评估各种分析工具的一致性。
  14. 随着单细胞RNA测序数据的不断增加以及细胞间通信分析工具的发展,整合多个数据源进行细胞间通信分析并构建可以直接访问和探索的研究人员数据库变得至关重要。
  15. 虽然存在包含细胞间通信分析结果的现有数据库,例如癌症单细胞表达图谱(CancerSCEM)、CellMarker 2.0、SPEED、ABC门户、HTCA和AgeAnno等,但这些数据库仅为其各自领域内的个别数据集提供细胞间相互作用信息。
  16. 它们缺乏分析通信网络的工具以及比较不同组之间细胞间通信网络的能力
Para_03
  1. 在这里,我们介绍 CellCommuNet,这是一个全面的数据资源库,利用单细胞RNA测序(scRNA-seq),探索正常和疾病状态下人类和小鼠组织中的细胞-细胞通讯网络。
  2. 鉴于 CellChat 工具在比较数据集、生成综合分析结果以及提供丰富的可视化方面的优势,CellCommuNet 在分析流程中采用 CellChat 作为主要工具,并以源细胞-靶细胞-配体-受体-信号通路结构的形式向用户提供细胞-细胞通讯网络结果。
  3. 用户可以自由访问数据集中各种细胞类型之间通讯强度的信息,以及这些相互作用与信号通路之间的关联。
  4. 为了增强数据库的全面性,我们在数据库的某些部分纳入了来自 CellPhoneDB 的结果作为补充。
  5. CellCommuNet 还提供了正常和疾病条件下细胞-细胞通讯的差异分析,使用户能够识别出哪些通讯在疾病状态下发生了改变。
  6. 当前版本的 CellCommuNet 包含了从 376 个单一数据集中整理出的超过 430 万个细胞的数据,覆盖了 82 种疾病类型和 35 种组织类型,这些数据来源于 CancerSCEM、癌症单细胞状态图谱(CancerSEA)、单细胞表达图谱(SCEA) 和基因表达全览(GEO)。
  7. 此外,我们还组织了 118 组在同一单细胞 RNA 测序研究中分析的疾病与正常样本之间的比较数据集。
  8. 因此,我们推断出了每种配体-受体对及信号通路的 514,463 个细胞-细胞通讯网络,其中 329,174 个网络显示了疾病与正常样本之间的差异。
  9. 简而言之,CellCommuNet 以交互式图形格式呈现细胞-细胞通讯分析结果,使用户能够在疾病和正常样本间进行通讯强度的差异分析。
  10. 这使得用户能够深入探索不同状态下细胞间信息的传递。
  11. 作为目前最全面的细胞-细胞通讯网络数据库,我们希望 CellCommuNet 能够成为生物学家们宝贵的资料资源。

Materials and methods

Data collection and curation

数据收集与管理

Para_04
  1. CellCommuNet中的单细胞RNA测序数据集及其相关的元数据信息(包括数据集ID、物种、疾病类型、器官/组织、治疗方案、测序平台等)来源于CancerSCEM、CancerSEA、SCEA和GEO。
  2. 与转移性癌症相关以及来自接受药物治疗患者的那些数据集被排除在外。
  3. 在对表达谱数据进行标准化处理并对低质量细胞进行质量控制后去除后,总共收集了来自人类和小鼠的376个数据集中的4,327,804个细胞到CellCommuNet中。
  4. 这些数据集覆盖了35种组织类型和82种疾病类型。
  5. 根据这些数据集的元数据信息,我们从同一单细胞RNA测序研究中组织了118个疾病样本与正常样本之间的比较数据集,以便能够比较这些配对之间的细胞-细胞通讯。

Data processing pipeline

数据处理管道

Para_05
  1. 单细胞RNA测序数据的分析流程基于Seurat(版本4.1.1)。
  2. 所使用数据分析工具的关键功能和参数显示在补充表S1中。
  3. 简而言之,每个样本中RNA特征数(nFeature_RNA)超出200到最大值90%范围的细胞被排除在下游分析之外。
  4. 整合过滤后的样本后,我们应用了SCTransform(版本0.3.5)函数来标准化独特的分子标识符(UMI)数据。
  5. 随后,利用Harmony(版本0.1.1)去除样本间的批次效应。
  6. Seurat中的‘RunTSNE’和‘RunUMAP’函数实现了识别不同细胞群体聚类的聚类算法,然后使用‘FindAllMarkers’函数来确定每个亚群的标记基因。
  7. 在细胞类型注释中,CellCommuNet使用ScType方法确定每个细胞群体的细胞类型。
  8. 为了全面注释多种组织,我们将CellMarker 2.0与ScType的标记基因参考集相结合,以扩展注释的组织类型,例如乳腺、脂肪等。
  9. 此外,如果可用,我们还结合了原始文章中每组数据的细胞注释标签元数据,以确保我们的分析具有更高的准确性水平。
Para_06
  1. 使用基于配体、受体、可溶性激动剂和拮抗剂表达的群体作用模型,通过CellChat(版本1.5.0)软件包推断和分析细胞间通讯。
  2. 这些配体-受体对(L-R对)信息被整合到跨人类和小鼠物种的CellChatDB中,并进一步分为三种相互作用模式,即分泌信号传导、ECM-受体和细胞-细胞接触。
  3. 对于每个单细胞数据集,分析流程从提取Seurat对象中的表达矩阵和元数据开始,然后利用‘createCellChat’函数生成一个CellChat对象。
  4. 在对高变异性基因和途径进行计算后,我们采用‘computeCommunProb’函数来推断细胞-细胞通信概率。
  5. 在此过程中,我们指定了参数‘type = ‘triMean’’来定义每个细胞组内基因表达平均值的计算方法,旨在捕捉更少但更强的相互作用。
  6. 随后,我们使用CellChat提供的系列可视化函数来展示结果。
  7. CellCommuNet提供了每种细胞类型的通讯强度,识别了连接细胞类型与信号通路的全局通讯模式,并利用网络分析中的中心度测量来计算每条信号通路对角色(发送者、接收者、中介、影响者)的贡献。
  8. 对于每个比较数据集,我们首先整合来自不同组的多个样本。
  9. 随后,我们对每个单细胞数据集分别执行Seurat工作流程和CellChat工作流程分析。
  10. 然后,我们使用CellChat软件包中的‘liftCellChat’函数更新S4对象的插槽,以合并疾病和对照组的CellChat对象。
  11. 使用‘rankNet’函数来比较每条信号通路的整体信息流。
  12. 同时,利用‘netVisual_bubble’函数来确定差异调节的信号配体-受体对
Para_07
  1. 也利用了CellPhoneDB(V4.0.0)工具来推断细胞间的相互作用。
  2. 首先,我们从Seurat对象中提取了计数矩阵和细胞注释标签,分别生成了‘count.txt’和‘meta.txt’文件。
  3. 随后,在构建的CellPhoneDB虚拟环境中,我们使用了‘method’命令中的‘statistical_analysis’模式来计算细胞间通讯强度值。
  4. 考虑到导出的表达矩阵使用基因符号作为行标识符,因此将‘–counts-data’参数设置为‘gene_name’。
  5. 一旦创建了‘means.txt’和‘pvalues.txt’文件,我们就使用了‘CellPhoneDB plot’命令来生成可视化输出。
  6. 所有产生的文件都被处理和组织好后,再被纳入数据库中。

Database construction

数据库构建

Para_08
  1. CellCommuNet 可以在 http://www.inbirg.com/cellcommunet/ 免费获取。该在线数据库框架使用 Django(v2.2.5)构建,并在 centOS 环境下的 NGINX 和 uWSGI 上部署。
  2. 所有 CellCommuNet 数据集均使用 MySQL(v8.0.26)服务器和文件系统进行存储和管理。
  3. 为了展示结果的可视化呈现,前端采用了 jQuery(v1.10.2)、DataTables(v1.10.21)和 Highcharts(v10.0.0)等软件包。
  4. 统计分析采用 Python 的 pandas(v1.4.1)和 numpy(v1.23.1)等软件包完成。

Results

Overview of CellCommuNet

CellCommuNet概述

Para_09
  1. CellCommuNet是一个数据库,专注于收集各种组织在正常和疾病状态下细胞间通讯分析的结果,为用户提供从多个角度探索细胞间相互作用的资源(图1A)。
  2. 在当前版本的CellCommuNet中,共收集了来自376个数据集的4,327,804个单细胞RNA测序(scRNA-seq)样本,包括331个人类数据集和45个鼠类数据集,覆盖了82种疾病和35种组织类型,总共包含397种非冗余的细胞类型,其中包括原始出版物中标注的细胞类型。
  3. 这些数据集中最常出现的疾病类型包括胶质母细胞瘤、胰腺导管腺癌、急性髓性白血病、肺腺癌和特发性肺纤维化,最常见的组织类型是大脑、胰腺、骨髓和肺。
  4. 基于这些收集的数据集,我们组织了118个比较数据集,这些数据集来自同一scRNA-seq研究中的疾病与正常样本。
  5. CellCommuNet通过CellChat构建了一个由源细胞-靶细胞-配体-受体-信号通路组成的细胞间通讯网络,CellChat是一种利用scRNA-seq数据定量推断细胞间通讯的工具,并使用网络分析和模式识别方法来预测细胞和信号通路如何协调实现特定功能。
  6. 目前,在CellCommuNet中共推断出514,463个每个配体-受体对及每个信号通路的细胞间通讯网络。
  7. 最常见的相互作用出现在自然杀伤细胞通过不同的配体受体和信号通路进行的自分泌网络中。
  8. 在比较数据集中,鉴定了329,174个疾病组与健康组之间存在差异的网络,最常见的差异网络出现在自然杀伤细胞和内皮细胞的自分泌网络中。
  • 图 1. CellCommuNet 概览。(A) 数据库的数据来源和工作流程,显示关于数据的基本统计信息。(B) CellCommuNet 的主要页面,包括‘首页’、‘搜索’、‘帮助’、‘浏览与下载’、‘分析’和‘统计’。

Features and utilities of CellCommuNet

CellCommuNet的特性和实用工具

Para_10
  1. CellCommuNet 提供了一个用户友好的网络服务,包括六个主要页面:‘主页’、‘搜索’、‘浏览与下载’、‘分析’、‘统计’和‘帮助’(图 1B)。
  2. ‘主页’页面提供了 CellCommuNet 基本概述和功能的简要介绍。
  3. ‘搜索’页面包含四种查询模式,即基于通路的、配体-受体对的、来源-目标细胞的以及配体-受体基因表达水平的查询,以便用户根据其特定研究需求探索细胞间通讯分析结果。
  4. 在‘浏览与下载’页面上,用户可以获取所有收集的数据集的基本信息。
  5. 此页面为用户提供下载链接,以获取对应数据集的分析结果。
  6. 通过点击项目 ID,用户可以查看每个数据集的详细分析结果。
  7. ‘分析’页面允许用户上传他们自己的处理过的 CellChat 对象来探索和可视化细胞间通讯分析的结果。
  8. 该功能还提供了一份 CellCommuNet 数据集列表及与用户数据集具有共同非冗余细胞间通讯网络的数量。
  9. ‘统计’页面展示了 CellCommuNet 中可用数据的统计信息。
  10. ‘帮助’页面提供了一个详细的用户指南,帮助用户快速开始使用 CellCommuNet。
  11. 下面将详细介绍‘搜索’和‘浏览与下载’页面。

Search function

搜索功能

Para_11
  1. 基于单细胞RNA测序(scRNA-seq)数据的细胞通讯分析依赖于编码配体和受体基因的表达水平。
  2. CellChat工具利用质量作用定律来根据L-R对及各种复合物的表达推断细胞间通讯的可能性,并将通讯结果与信号传导途径相关联。
  3. 因此,CellCommuNet允许用户查询感兴趣的数据库中的信号传导途径、L-R对以及源-目标细胞间的相互作用,并提供了访问感兴趣的数据集内配体-受体基因表达水平的能力(图2A)。
  • 图 2. CellCommuNet 中的搜索功能。 (A) 途径搜索标签包含五个选择框:生物体、研究类型、组织类型、条件和途径。点击帮助按钮可以显示或隐藏教程。 (B) 单一数据集的搜索结果表格,包含与查询标准相关的细胞间通讯结果,每种通讯提供了三种可视化展示。 (C) 弦图展示了通过特定途径个体细胞间的通讯强度;气泡图提供了具体的通讯信息,其中大小代表通讯概率,颜色表示 P 值;热图揭示了个别细胞类型在通讯中的主要作用。 (D) 比较数据集的搜索结果表格展示了疾病样本与正常样本之间通讯的差异。P 值 = ‘3’ 表示 P 值 < 0.01,P 值 = ‘2’ 表示 0.01 < P 值 < 0.05,P 值 = ‘1’ 表示 P 值 > 0.05。 (E) 个体通讯强度的比较。 (F) 细胞亚群中配体或受体基因的表达。大小代表表达该基因的细胞百分比,颜色表示平均表达值
Para_12
  1. ‘SEARCH’页面上的Pathway Search模式允许用户查询感兴趣的特定信号传导途径。
  2. 标签目前包含五个选择框:生物体、研究类型、组织类型、状态(包括各种疾病状态和‘正常’)以及途径(图2A)。
  3. 用户需要依次选择相关信息来选定数据集,并最终选择要查询的途径。
  4. 值得注意的是,除了研究类型选项,用户需要在‘Single’和‘Comparison’之间做出选择外,所有其他选项均可从所有可用项目中进行选择(例如‘所有生物体’)。
  5. 然而,选择所有选项可能会导致查询结果过多;因此,我们将最大结果数量限制为50,000条。
  6. 此外,该标签当前提供了一个帮助按钮,简要概述了页面的功能和使用方法。
  7. 在选择感兴趣的内容后,用户可以点击提交按钮获取分析结果,其中不同的研究类型选择对应不同的结果。
  8. 对于单个数据集选项,我们提供了一个细胞-细胞通讯结果表格(图2B),使用户能够获取每个通讯所属数据集的基本信息、源细胞和目标细胞的细胞类型及L-R对,以及通过查询途径介导的通讯的概率和P值。
  9. 此页面还提供了来自CellChatDB的相应配体-受体相互作用的证据。
  10. 此外,使用三种可视化方式来展示通讯结果(图2C)。
  11. 弦图展示了细胞-细胞通讯的整体强度,气泡图显示了查询信号途径在相应数据集中每种通讯的概率。
  12. 热图显示了由查询途径介导的细胞间通讯网络中的主要发送者、接收者、中介和影响者。
  13. 最后,用户可以通过点击项目ID导航至数据集的详细分析结果页面,该页面将在后续部分进行描述。
  14. 对于比较数据集,除了前述基本数据集信息、源细胞和目标细胞类型、L-R对等外,页面还以比较形式(疾病与对照组)呈现了疾病和对照组中的通讯概率及P值,其中P值=‘3’表示P值<0.01,‘2’表示0.010.05(图2D)。
  15. 此外,根据概率的比较,显示了在疾病条件下通讯是否减少或增加。
  16. 使用气泡图来可视化不同样本之间的通讯比较(图2E),同时提供了弦图来展示所选条件下疾病组与对照组之间通讯强度的差异(补充图S1A)。
  17. 同样地,点击项目ID可以导航到详细的成果页面
Para_13
  1. "L–R对搜索"模式和"细胞类型搜索"模式在‘搜索’页面上与上述类似,允许用户查询感兴趣的配体-受体对或来源或目标细胞类型。
  2. 然而,这两个标签提供了六个选择框,包括生物种类、研究类型、组织类型、条件(包括各种疾病和‘正常’)、配体(或来源)和受体(或目标)。
  3. 此外,这两个模块还使用CellPhoneDB工具提供分析结果,并且用户可以切换分析工具以获得相应的结果。
  4. 值得注意的是,在使用CellPhoneDB工具时,物种和研究类型对于人类数据仅限于单一数据集。
  5. 对于这两种模式的查询结果,在单个数据集中,仅使用气泡图进行可视化,这与之前的描述一致。
  6. 而对于比较数据集,可视化的形式与上述相同。
Para_14
  1. "SEARCH"页面上的L–R表达搜索模式允许用户查询相关数据集中感兴趣的配体-受体基因的表达水平。
  2. 标签包含六个选择框和一个输入框。
  3. 用户需要使用选择框来确定所需的研究和细胞聚类的分辨率。
  4. 最后,用户需要在输入框中输入想要查询的基因名称,确保多个基因名称之间用分号隔开。
  5. 然后,CellCommuNet提供气泡图显示所查询基因在相应数据集中的表达水平(图2F)。
Para_15
  1. 下面展示了一个单一数据集的案例研究,用户在路径搜索模式中选择生物体:'人类', 研究类型:'单一', 组织类型:'大脑', 条件:'阿尔茨海默病' 和 途径:'APP', 以获取与人类通过 APP 信号通路介导的阿尔茨海默病(AD)相关的细胞-细胞通讯分析结果。
  2. 结果中的 CCN0291 数据集来源于一项探索阿尔茨海默病免疫环境的研究,在该研究中,细胞-细胞通讯分析揭示了单核细胞是 APP 途径的主要信号传递者,并与其他免疫细胞相互作用。
  3. 先前的一项研究表明,单核细胞在循环血液中与其他细胞相互作用,并观察到阿尔茨海默病患者与治疗组之间关键配体-受体如 APP 的差异表达。
  4. 与这一发现一致,CellCommuNet 提供的结果表明,单核细胞可能在阿尔茨海默病发展中发挥至关重要的调节作用。
Para_16
  1. 另一项针对比较数据集的案例研究如下进行:生物体:‘人类’,研究类型:‘比较’,组织类型:‘肺’,条件:‘肺腺癌’,来源:‘巨噬细胞’,目标:‘CD8+ T细胞’,在细胞类型模式下。
  2. CellCommuNet提供了结果,展示了肺腺癌和正常样本之间细胞通讯的差异。
  3. 来自数据集CCN0340的结果表明,在肺腺癌中,巨噬细胞与CD8+ T细胞之间的细胞-细胞通讯通过SPP1(SPP1-CD44)增强(图2E),这一现象也在Hu等人(30)的研究中被观察到。
  4. 这表明肿瘤样本中巨噬细胞向M2样肿瘤相关巨噬细胞的转化,通过与CD8+ T细胞的相互作用影响预后。

Browse & download interface

浏览并下载界面

Para_17
  1. "BROWSE & DOWNLOAD"页面利用数据表格列出了CellCommuNet收集和分析的所有数据集。
  2. 左侧的筛选面板使用户能够根据特定标准快速找到感兴趣的研究。
  3. 表格呈现了每个数据集的关键信息,包括数据来源、生物体、组织、细胞数量等。
  4. 此外,CellCommuNet为每个数据集提供了下载链接,用于下载相应的表达矩阵、细胞注释元数据以及细胞间通信分析结果。
  5. 通过点击项目ID,用户可以访问详细的成果页面,如下所述。

Detailed information

详细信息

Para_18
  1. 数据集元数据显示在‘浏览与下载’页面的表格中,更多详细信息可在详细信息页面的数据集信息标签中找到,包括与该数据集相关的研究描述以及有关出版物和PMID链接的信息。
  2. 此外,还提供了数据来源链接(CancerSCEM、CancerSEA、SCEA 和 GEO)。
  3. 对于单一数据集,我们提供了样本来源ID;而对于比较数据集,我们分别为疾病样本和正常样本提供了独立的CellCommuNet ID,以便用户能够获取各组对应的数据集。
Para_19
  1. 单个数据集的结果分为两部分。
  2. 第一部分包括单细胞聚类和细胞注释结果。
  3. 用户可以通过修改不同的参数来定制这些结果的显示,包括分辨率(默认为可发布时的设置)、细胞着色方法(默认为推断的细胞类型)以及降维方法(t-SNE 或 UMAP)。
  4. 重要的是,分辨率参数的选择也会影响细胞间通信的结果。
  5. 此外,用户可以查询特定基因的表达水平。
  6. 另外,我们为每个细胞亚群提供了标记基因表(图 3A)。
  7. 第二部分展示了细胞间通信分析的结果(图 3B)。
  8. 使用弦图来展示该数据集中各种细胞类型之间的通信强度。
  9. 用户可以选择查看来自 CellChat 或 CellPhoneDB 的分析结果。
  10. 通过网络分析和模式识别方法来预测细胞的主要信号输入和输出,以及这些细胞如何与信号通路协调。
  11. 结果用桑基图进行可视化。
  12. 此外,用户可以根据通信概率值过滤细胞间通信网络的结果(默认显示通信强度最高的前 50%)。
  13. 最后,我们为用户进一步研究和分析提供了所选分辨率下细胞间通信分析的结果表。
  • 图 3. 每个数据集的详细信息。(A) 单个数据集的基本信息和单细胞聚类分析。(B) 单个数据集的细胞-细胞通讯分析。弦图展示了每个细胞群体的总通讯强度,桑基图显示了通讯模式,并使用网络图和表格呈现了细胞-细胞通讯网络。(C) 比较数据集的详细页面。条形图比较了疾病状态和正常状态下的总通讯强度,热图显示了细胞群体间通讯的增加或减少情况,堆叠条形图比较了每条途径的相对信息流。
Para_20
  1. 为了进行比较,CellCommuNet 专注于展示细胞间通讯差异分析的结果(图 3C)。
  2. 同样地,用户可以自定义参数来查看不同分辨率下的结果。
  3. 我们首先使用条形图来展示不同条件下细胞间通讯总体强度的差异。
  4. 热图被用来可视化个体细胞间通讯的差异。
  5. 此外,我们还展示了不同信号通路信息流的差异。
  6. 在 CellChat 中,特定信号通路的信息流被定义为推断出的通讯网络中所有细胞组对之间的通讯概率之和,相对信息流则通过堆叠条形图来可视化。
  7. 类似地,我们为用户提供了一个表格,以进一步探索所选分辨率下细胞间通讯的差异(补充图 S1D)。

Case studies

案例研究

Case study for a Single dataset

单个数据集的案例研究

Para_21
  1. CCN0001 数据集来源于 CancerSCEM,包含了肺腺癌的数据。
  2. 该数据集中共检测到 1493 个细胞,在默认分辨率下,识别出了 11 种不同的细胞类型,包括基底细胞、纤毛细胞、树突状细胞、内皮细胞、纤维母细胞、肺泡Ⅱ型细胞以及多种免疫细胞。
  3. 从细胞间通讯强度的结果来看,很明显纤维母细胞在细胞间通讯网络中作为主要信号发送者扮演了重要角色,并与其他细胞相互作用(图 3B)。
  4. 这一观察结果可能归因于纤维母细胞产生多种生长因子和促炎因子,这些因子有助于招募免疫抑制细胞。
  5. 此外,Sankey 图显示纤维母细胞主要参与向外的通讯模式,与内皮细胞和肺泡Ⅱ型细胞呈现出相似的模式。
  6. 这种模式涉及的主要信号通路包括 FN1、CXCL 等

Case study for a comparison dataset

用于比较数据集的案例研究

Para_22
  1. CCN0421是一个与透明细胞肾细胞癌(ccRCC)相关的比较数据集,来源于GEO数据库(图3C)。
  2. 疾病和正常数据集的CellCommuNet编号分别为CCN0331和CCN0329。
  3. 总共比较了14140个细胞,从柱状图可以看出,ccRCC中的细胞-细胞通讯更加活跃。
  4. 热图结果显示,与正常样本相比,内皮细胞在传出和传入信号方面与其他细胞的相互作用增加。
  5. 这一发现表明内皮细胞可能在肿瘤发展中发挥调节作用。
  6. 就信息流而言,几乎所有与肿瘤相关的信号通路相比于正常样本都显示出增强的激活,包括VEGF、FN1和FGF途径。
  7. 这些结果突出了ccRCC中细胞-细胞通讯活动的增强以及特定信号通路的激活,这可能有助于理解肿瘤进展,并识别潜在的治疗靶点。

Discussion and future directions

Para_23
  1. CellCommuNet是一个用户友好的、交互式的数据库,它基于CancerSCEM、CancerSEA、SCEA和GEO数据库中的单细胞转录组测序(scRNA-seq)数据,提供细胞间通讯分析结果,重点关注人类和小鼠的数据与疾病。
  2. 在CellCommuNet中,用户可以自由探索不同疾病状态下细胞之间的相互作用。
  3. 随着转录组学的进步,特别是单细胞转录组学的发展,对细胞通讯的研究获得了极大的促进,现在许多研究集中于介导细胞间通讯的信号通路、相关的配体-受体对以及参与组织或器官互动的细胞类型。
  4. 因此,CellCommuNet在搜索页面上提供了四种搜索模式,使用户能够探索特定的信号通路、配体-受体对、细胞类型以及配体或受体基因的表达水平。
  5. 通过使用下拉框中提供的关键词,用户可以访问相应的细胞间通讯分析结果,为后续实验验证提供数据支持。
  6. 此外,由于细胞通讯在生物体内维持稳态方面发挥着至关重要的作用,预计在疾病状态下会发生细胞通讯的变化。
  7. CellCommuNet包含了118组疾病与正常样本的比较数据,以提供差异化的细胞间通讯分析,有助于进一步探索疾病的进展。
  8. CellCommuNet的另一个亮点是利用了非负矩阵分解算法和基于CellChat的网络分析,向用户提供细胞间通讯模式,并将它们与信号通路整合起来,帮助研究人员探索复杂的细胞间通讯网络。
  9. 现有的数据库并未提供如此全面的分析。
  10. 例如,ABC门户数据库利用CellPhoneDB 2.0专门针对血液和免疫细胞进行细胞间通讯分析,增强了对造血和血液/免疫系统疾病的理解,但缺乏信号通路的整合。
  11. 同样地,SPEED数据库利用CellChat进行细胞间通讯分析,但它侧重于泛物种图谱,并且对于人类和小鼠疾病的数据集有限;此外,它没有提供不同状态下细胞间通讯的比较分析。
  12. 因此,据我们所知,CellCommuNet是目前唯一一个专注于人类和小鼠在疾病和正常状态下细胞间通讯网络的综合性数据库。
  13. 未来,我们将继续维护和更新CellCommuNet。
  14. 新数据可以通过我们的标准化分析流程无缝添加到CellCommuNet中。
  15. 我们计划每六个月对四个数据来源进行一次审查,以纳入新的数据集
Para_24
  1. 然而,仍有改进的空间:(i) 细胞间的通信不仅仅由信号分子介导,细胞的空间信息同样至关重要。整合单细胞空间组学数据来探索细胞间通信将是我们的未来研究方向之一。
  2. (ii) 目前,CellCommuNet 主要基于 CellChat 软件,并依赖于 CellChatDB 作为参考数据库,尽管我们已经纳入了使用 CellPhoneDB 进行分析得到的部分结果。但我们认识到全面覆盖数据库结果仍是一个挑战。
  3. 未来,我们将努力收集和整合更多信号分子的数据,并将更多的细胞通信推断工具集成到我们的数据库中,以提供更全面的细胞间通信网络信息。
  4. (iii) 在单细胞 RNA 测序分析中的细胞类型误注会导致产生不正确的细胞-细胞通信网络信息。在当前版本中,我们提供了两种细胞注释方法:一种来自原始出版物,另一种来自 ScType。未来,我们将整合更多的细胞类型标记来改善细胞类型的注释。
  5. (iv) 当前细胞通信分析工具的关注主要集中在检测细胞自身发出的信号上,往往忽视了源自周围环境的外部信号。鉴于这些外部信号对细胞活动和命运的影响显著性,我们计划在未来对 CellCommuNet 进行增强。这包括识别细胞通信网络中的外部信号,并探究激活转录因子及下游靶基因的配体-受体对。通过这样做,我们旨在丰富细胞通信网络内的下游信息,从而进一步提高 CellCommuNet 的全面性。我们相信 CellCommuNet 将有助于研究人员理解细胞-细胞通信,并为疾病发展机制提供见解。

Data availability

Para_25
  1. 所有数据,包括结果和元数据,均可在http://www.inbirg.com/cellcommunet/获取,无需登录,且可视化结果可以PNG、JPEG、PDF和SVG格式下载。

Supplementary data

Para_26
  1. 补充数据可在 NAR 在线获取。

本文由mdnice多平台发布

版权声明:
作者:倾城
链接:https://www.techfm.club/p/144818.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>