CUT&Tag 数据处理和分析教程(1)
引言

本系列 将开展全新的CUT&Tag 数据处理和分析专栏。想要学习更多内容可以添加文末的学习交流群或客服QQ:941844452。
CUT&Tag 简介
在真核细胞的核里,DNA 上发生的所有动态活动,比如基因表达调控,都离不开一个由核小体(包括它们的化学修饰)、转录因子和相关蛋白复合物组成的染色质环境。不同的染色质特征会标记出激活或抑制基因表达的调控区域,以及那些在细胞类型间有差异、在发育过程中会变化的染色质区域。
过去,科学家们通常用染色质免疫沉淀(ChIP)技术来定位这些染色质特征的全基因组分布。ChIP 的做法是先把染色质交联固定并溶解,然后用针对特定蛋白或修饰的抗体把相关的 DNA 片段“捞”出来(见图 1a)。这项技术自35年前问世以来,基本操作方式没太大变化,但问题在于信号和噪声不好区分,还容易出现干扰结果的伪影。后来出现了一种替代方法——体内酶锚定技术,通过抗体或融合蛋白锁定目标染色质蛋白或修饰,再对下面的 DNA 进行标记或切割。这类方法在过去20年里不断发展,其中一种叫 Cleavage Under Targets & Tagmentation(简称 CUT&Tag)的技术用到了 protein-A-Tn5(简称 pA-Tn5)转座酶融合蛋白(见图 1b)。在 CUT&Tag 中,先把细胞或细胞核透化处理,然后加入针对特定染色质蛋白的抗体,再让带着镶嵌末端接头的 pA-Tn5 附着到抗体结合的地方。接着,通过添加镁离子激活转座酶,把接头插入附近的 DNA 上,最后扩增这些接头来构建测序文库。这种基于抗体锚定 Tn5 的方法灵敏度很高,因为样本在 pA-Tn5 附着后会经过严格清洗,而且接头插入效率也很高。相比传统的 ChIP-seq,CUT&Tag 的信噪比大大提高,绘制染色质特征所需的测序量减少了十倍左右。这使得我们可以把多个样本(一般最多90个)混在一起,通过给文库加上条形码并用 PCR 扩增后,在 Illumina NGS 测序仪上进行双端测序。

目标
这个教程是为了指导大家如何处理和分析按照 Bench top CUT&Tag V.3 协议生成的 CUT&Tag 数据。我们用来说明的例子是人类淋巴瘤 K562 细胞系中组蛋白修饰的分布数据,不过这个教程的适用范围很广,可以用来分析任何染色质蛋白,比如转录因子、RNA 聚合酶 II,还有带表位标签的蛋白。
数据处理和分析概述

依赖
- Linux system
- R (versions >= 3.6)
- dplyr
- stringr
- ggplot2
- viridis
- GenomicRanges
- chromVAR
- DESeq2
- ggpubr
- corrplot
- ChIPseqSpikeInFree [Optional]
library(dplyr)
library(stringr)
library(ggplot2)
library(viridis)
library(GenomicRanges)
library(chromVAR) ## For FRiP analysis and differential analysis
library(DESeq2) ## For differential analysis section
library(ggpubr) ## For customizing figures
library(corrplot) ## For correlation plot
- FastQC(version >= 0.11.9)
- Bowtie2 (version >= 2.3.4.3)
- samtools (version >= 1.10)
- bedtools (version >= 2.29.1)
- Picard (version >= 2.18.29)
- SEACR (version >= 1.3)
- deepTools (version >= 2.0)
数据下载
本教程中使用的数据来自 Kaya-Okur 等人(2020年),可以从 GEO 上下载。
wget -O $projPath/data/IgG_rep2/IgG_rep2_R1_001.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR875/001/SRR8754611/SRR8754611_1.fastq.gz
wget -O $projPath/data/IgG_rep2/IgG_rep2_R2_001.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR875/001/SRR8754611/SRR8754611_2.fastq.gz
wget -O $projPath/data/IgG_rep2/IgG_rep2_R1_002.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR875/002/SRR8754612/SRR8754612_1.fastq.gz
wget -O $projPath/data/IgG_rep2/IgG_rep2_R2_002.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR875/002/SRR8754612/SRR8754612_2.fastq.gz
本文由mdnice多平台发布
版权声明:
作者:lichengxin
链接:https://www.techfm.club/p/193828.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。
共有 0 条评论