知识积累—空间数据结合图像分割实现单细胞级解卷积分析
作者,Evil Genius
今日参考文献
中国人发表的,但是,
这里多说一句,大家有条件多支持一下正版,盗版如果横行,说实话没有动力做下去了,这是大多数原创者的心声,当然了,我做学生的时候,也没钱,资料很多也是盗版,工作了以后也买卖过盗版, 现在不过不再跟盗版打交道了,知道了其中的辛酸。
当然了,量力而行,别跟我读书似的一个月就500的补贴,还非要买几千上万块钱的资料,家里条件很好,这可以,否则就叫败家。
花了钱的,好好学习,变成自己的,才是目的。
知识积累
- 对空间转录组而言,在固定位置获取的相同大小的spot不能精确捕获随机位置的单细胞,因此本质上不能在单细胞水平上描述转录组(无论是10X Visium 、HD、华大、百迈客都有这样的问题)。
最佳的解决方案:将空间转录组与其匹配的基于组织学图像的形态对齐,恢复缺失的细胞,从而实现真正的单细胞水平和全片尺度的反卷积、卷积和聚类低分辨率和高分辨率spot。
- 目前可用的空间分辨转录组学技术有两大类:(i)原位杂交或原位测序技术,如seqFISH、MERFISH、STARmap和FISSEQ;(ii)原位捕获技术,如空间转录组学(ST)、SLIDE-seq、ZipSeq和HDST。
- 迄今为止,最主要的商用测序技术是10X Visium,这是一种基于spot的空间转录组学,在2018年从ST技术进一步发展而来。
基于spot的空间转录组学的主要技术限制之一在于spot的低分辨率,它通常覆盖多个细胞。目前的10X Visium spot尺寸为直径55 μm,spot覆盖细胞的数量根据生物组织的不同在1到30之间。为了提高分辨率,BayesSpace提出利用贝叶斯统计绘制空间转录组数据中的邻域结构,将分辨率提高到subspot水平。xfuse的方法使用深度生成模型将空间转录组与组织学图像数据相结合,可以在微米分辨率下表征解剖特征的转录组。还有一些方法,如stLearn和SpaGCN,将组织学图像整合到空间上平滑基因表达,并改善了连续空间模式的聚类。除了计算加强之外,空间转录组学技术的分辨率也在不断提高,例如,新版本的10X Visium HD,达到了2um 的精度。
然而,细胞大小的spot分辨率不等于单细胞水平。与单细胞测序技术不同的是,相同大小和固定位置的spot无法精确捕获实际大小不同、位置随机的细胞,仍然可以部分覆盖同时接近的多个细胞,这使得基于spot的空间基因表达无论spot大小如何,本质上都无法达到单细胞水平。这种单细胞水平的缺乏不能通过目前的方法来解决,仅通过计算或技术上提高spot分辨率,阻碍了空间转录组学中单个细胞空间组织和细胞类型特异性基因表达变异的表征。此外,在Visium平台上,在面积为6500 × 6500μm2的载玻片上分布了4992个直径为55 μm的spot,两个spot中心之间的距离为100 μm,在~70%的面积内未测量基因表达。
与新鲜冷冻组织相比,FFPE组织的染色图像更好地保留了细胞形态,因此可以更准确地分割细胞核。
将空间转录组数据与匹配的基于组织学图像的细胞核形态信息相结合,以弥合spot分辨率和单细胞水平之间的差距。
结果1、单细胞分辨率不等于单细胞水平
在10X Visium平台上,将组织切片放置在载玻片上,在载玻片上用条形码逆转录物(RT)引物在固定坐标上分析相同大小的spot。在组织渗透过程中,mRNA分子垂直向下扩散到固体表面,并在原位spot内与RT引物局部杂交。进一步提取cDNA mRNA复合物用于文库制备和测序读出。与单细胞RNA测序(scRNAseq)不同的是,单细胞技术可以精确地单独捕获每个细胞并描绘整个细胞的基因表达,而预定位置的spot极有可能同时部分覆盖近距离的多个细胞。然而,这些空间数据不能仅仅通过计算或技术上将spot大小缩小到单细胞大小来解决,即单细胞分辨率不是单细胞水平。
10X HD数据仍然有很大的机会部分覆盖多个细胞(这个在课程上已经讲过了)。一个spot,即使在非常小的尺寸上,仍然很可能同时覆盖多个细胞,每个细胞覆盖的很小一部分,使得spot仍然捕获细胞类型的混合基因表达。
因此,spot分辨率和单细胞水平之间的上述差距提出了新的计算挑战:分别针对低分辨率和高分辨率spot的“单细胞反卷积”和“单细胞卷积”。其中的区别在于单细胞反卷积是指将大的低分辨率spot分裂成单个细胞,而单细胞卷积是指将相邻的高分辨率spot覆盖的小块组装成一个完整的单个细胞。
结果2、STIE工作流程概述
-
spot水平的基因表达和基于匹配组织学图像的细胞核分割。
共有 0 条评论