Signac 单细胞|ATAC-seq Call peak

引言

本文将向您展示如何利用MACS2软件,在单细胞ATAC-seq的基因组数据中识别基因调控区域的峰值。

实战

在使用Signac进行峰值检测之前,您需要先安装MACS2。您可以通过pip或conda安装它,或者从源代码自行编译。

本次演示以人类外周血单核细胞的单细胞ATAC-seq数据为例。首先,请加载必要的软件包和预先处理过的Seurat数据对象。

library(Signac)
library(Seurat)

pbmc <- readRDS("../vignette_data/pbmc.rds")
DimPlot(pbmc)

使用 CallPeaks() 函数可以进行峰值检测,这可以针对不同的细胞群体单独进行,或者综合所有细胞的数据来完成。若要在每个已标记的细胞类型上识别峰值,我们可以通过 group.by 参数来实现。

peaks <- CallPeaks(
  object = pbmc,
  group.by = "predicted.id"
)

结果以 GRanges 对象的形式返回,并带有一个附加元数据列,列出了每个峰在其中识别的细胞类型:

要计算每个峰值区域的计数,您可以利用 FeatureMatrix() 函数来实现。

通过 CoveragePlot() 函数,我们可以将特定于细胞类型的 MACS2 峰值检测结果与 10x Cellranger 的峰值检测结果(目前 pbmc 对象中正在使用的)进行可视化对比。在图中,Cellranger 的峰值以灰色表示,而 MACS2 的峰值则以红色标注。

CoveragePlot(
  object = pbmc,
  region = "CD8A",
  ranges = peaks,
  ranges.title = "MACS2"
)

## Warning: Removed 1 row containing missing values or values outside the scale range
## (`geom_segment()`).

未完待续,欢迎关注!

动动您发财的小手点个赞吧!欢迎转发!

版权声明:
作者:cc
链接:https://www.techfm.club/p/148790.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>