Seurat对象数据结构
1、标准流程里面的过滤三步骤,也可以用 SCTransform 代替
Seurat基本教程
seurat对象结构
单细胞转录组分析中的各种数据结构
2、Seurat 每一步处理类似流水线传送带上的容器(Container),每个函数会依次进行处理。每个函数输入一种数据都会输出另外一个数据,并且把输出数据也存放在这个容器中。 需要时可以提取某一步骤的数据。 还有一类函数,不参与数据转换,类似质检员(Inspector),在每一个数据转换后,查看容器中的内容,帮助判断质量、评估处理后的效果。
3、Seurat 流程第一步就是创建 Seurat 对象,首先要明白 Seurat 对象的构成。Seurat 对象进一步细分为: Assay Object 对象 和 DimReduc Object 对象。
Assay Object 对象存放的多组学的表达数据, DimReduc Object 对象存放的是对 Assay Object 对象进行降维分析后的结果。
4、专门下载和管理 Seurat示例数据对象的软件包:SeuratData
SeuratData 先把 datasets 变成 Seurat 对象,再把 Seurat 对象以软件包的形式分发和管理。
5、以pbmc为例,展开Seurat流程。
在Seurat对象后面加个@ 可以查看Seurat对象的内容。弹出小窗口,可以查看里面的内容。
5.1 mata.data
Seurat对象中的mata.data 是一个用来对所有细胞做注释的数据框。每一行代表一个细胞,每一列代表细胞的属性。当需要根据细胞的属性和类型对细胞进行筛选的时候,经常会用到mata.data。当然也可以把分析得到的结果,添加到mata.data中。
5.2 assay
一个Seurat对象可以包括多个assay对象,但是在某个时刻,只有一个assay对象是默认激活的。可以通过函数 active.assay 查询当前默认激活的是哪个assay对象。也可以用 DefaultAssay 来设置默认的 assay。
5.3 ident
可以理解为细胞的类型,在Seurat对象中,细胞可能有好几种不同方法注释的类型,但是在某一时刻,只有一种细胞类型是默认激活的。可以用active.ident来查询当前默认的细胞类型是什么。
5.4 reduction
和assay一样,reduction返回的也是一个列表。里面包含的是一个或多个 DimReduc object 对象。 每个DimReduc object 对象对应的是 assay 对象进行某种降维分析后得到的结果。降维也就是PCA 、tsen 、umap 三种。 下面这个例子里面的列表中,有两个DimReduc object 对象,分别是PCA 和umap
5.5 version
是创建这个对象时,所使用的Seurat版本。
5.6 commands
是一个列表,里面保存的是workflow中每个步骤所使用的命令和参数。还有命令执行的日期和时间。
5.7 Assay Object 的内部结构
counts 保存的是未经处理的原始数据。适合存放稀疏矩阵。
原始数据经过标准化后,会存放在@data中,和counts 一样也是一个特殊的 Matrix 对象。
当数据进行scale后,存放在名为scale.data中
key : 每个active对象都有一个key值,可以用fetch函数来获取。。。没声音这里
var.features : 是一个普通的向量,里面存放的是高表达变异的基因名。可以用函数VaribleFeatures来获得这个向量。
meta.features : Seurat对象中的mata.data 是对所有细胞做注释的数据框。 而在assay对象中,meta.features 是对每个 features 做的注释。 如果要对 features 的功能进行注释、打分、筛选都需要用到meta.features。对于不同的assay来说,每个features的含义是不同的。
5.8 DimReduc Object 的内部结构
和assay对象一样,也是存放在一个列表中。
6、正式开始Seurat流程的workflow的每一个步骤
看视频,讲的挺详细的。这里只记录一些关键的细节。
%>% 是管道的意思
dplyr包:grpup_by top_n
patchwork 包 可以整合成一个图
画图函数的特点比较
共有 0 条评论