Seurat对象数据结构

1、标准流程里面的过滤三步骤,也可以用 SCTransform 代替

Seurat基本教程
seurat对象结构
单细胞转录组分析中的各种数据结构




image.png

2、Seurat 每一步处理类似流水线传送带上的容器(Container),每个函数会依次进行处理。每个函数输入一种数据都会输出另外一个数据,并且把输出数据也存放在这个容器中。 需要时可以提取某一步骤的数据。 还有一类函数,不参与数据转换,类似质检员(Inspector),在每一个数据转换后,查看容器中的内容,帮助判断质量、评估处理后的效果。

image.png

3、Seurat 流程第一步就是创建 Seurat 对象,首先要明白 Seurat 对象的构成。Seurat 对象进一步细分为: Assay Object 对象 和 DimReduc Object 对象。

Assay Object 对象存放的多组学的表达数据, DimReduc Object 对象存放的是对 Assay Object 对象进行降维分析后的结果。

Seurat Object

Assay Object

DimReduc Object

4、专门下载和管理 Seurat示例数据对象的软件包:SeuratData

SeuratData 先把 datasets 变成 Seurat 对象,再把 Seurat 对象以软件包的形式分发和管理。

image.png

5、以pbmc为例,展开Seurat流程。

在Seurat对象后面加个@ 可以查看Seurat对象的内容。弹出小窗口,可以查看里面的内容。

Seurat对象组成
image.png

5.1 mata.data
Seurat对象中的mata.data 是一个用来对所有细胞做注释的数据框。每一行代表一个细胞,每一列代表细胞的属性。当需要根据细胞的属性和类型对细胞进行筛选的时候,经常会用到mata.data。当然也可以把分析得到的结果,添加到mata.data中。

mata.data

5.2 assay
一个Seurat对象可以包括多个assay对象,但是在某个时刻,只有一个assay对象是默认激活的。可以通过函数 active.assay 查询当前默认激活的是哪个assay对象。也可以用 DefaultAssay 来设置默认的 assay。

image.png

5.3 ident
可以理解为细胞的类型,在Seurat对象中,细胞可能有好几种不同方法注释的类型,但是在某一时刻,只有一种细胞类型是默认激活的。可以用active.ident来查询当前默认的细胞类型是什么。

image.png

5.4 reduction
和assay一样,reduction返回的也是一个列表。里面包含的是一个或多个 DimReduc object 对象。 每个DimReduc object 对象对应的是 assay 对象进行某种降维分析后得到的结果。降维也就是PCA 、tsen 、umap 三种。 下面这个例子里面的列表中,有两个DimReduc object 对象,分别是PCA 和umap

image.png

5.5 version
是创建这个对象时,所使用的Seurat版本。

5.6 commands
是一个列表,里面保存的是workflow中每个步骤所使用的命令和参数。还有命令执行的日期和时间。

image.png
5.7 Assay Object 的内部结构
image.png

counts 保存的是未经处理的原始数据。适合存放稀疏矩阵。

image.png

原始数据经过标准化后,会存放在@data中,和counts 一样也是一个特殊的 Matrix 对象。

image.png

当数据进行scale后,存放在名为scale.data中

image.png

key : 每个active对象都有一个key值,可以用fetch函数来获取。。。没声音这里

image.png

var.features : 是一个普通的向量,里面存放的是高表达变异的基因名。可以用函数VaribleFeatures来获得这个向量。

image.png

meta.features : Seurat对象中的mata.data 是对所有细胞做注释的数据框。 而在assay对象中,meta.features 是对每个 features 做的注释。 如果要对 features 的功能进行注释、打分、筛选都需要用到meta.features。对于不同的assay来说,每个features的含义是不同的。

image.png
5.8 DimReduc Object 的内部结构

和assay对象一样,也是存放在一个列表中。

image.png
image.png

6、正式开始Seurat流程的workflow的每一个步骤

看视频,讲的挺详细的。这里只记录一些关键的细节。

image.png
image.png

%>% 是管道的意思
dplyr包:grpup_by top_n

image.png

patchwork 包 可以整合成一个图

image.png
image.png

画图函数的特点比较

image.png

版权声明:
作者:cc
链接:https://www.techfm.club/p/44352.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>