CRISPR/Cas9脱靶分析
1 总体思路
由于CRISPR/Cas9编辑系统的脱靶常表现为在错配位点引入小片段的插入、缺失或碱基替换,即SNP位点与indel。因此使用SNP分析软件,分析编辑菌株相较于出发菌株的全基因组SNP与indel,并与潜在脱靶位点进行比较,即可初步检测编辑菌株在潜在脱靶位点是否发生脱靶。
2 潜在脱靶位点预测
使用Cas-OFFinder(http://www.rgenome.net/cas-offinder/)在线预测网站,选定PAM type 为SpCas9 fromStreptococcus pyogenes:5'-NGG-3',在Query Sequences 中 填入20 bp 靶位点序列,Mismatch Number设置为5、DNA Bulge Size和RNA Bulge Size均设为0 (也可根据需要放宽阈值,将Mismatch Number、DNA Bulge Size和RNA Bulge Size数值调高),Target Genome、Organism Type选定为others、选择Genomes 为Escherichia coli K-12 MG1655,点击submit。也可下载本地版Cas-OFFinder 进行分析。打开snps.txt 结果如下:
#Bulge type crRNA DNA ChromosomePosition Direction MismatchesBulge Size
XTTGCCCTGCTGCTACAAAACNGG TcttCCTGaTGCTACcAAACTGG chr8 5020960 -5 0
XTTGCCCTGCTGCTACAAAACNGG TTtCCtTaCTGCTACAAAcaCGG chr8 6972501 -5 0
XTTGCCCTGCTGCTACAAAACNGG TTtCCtTaCTGCTACAAAtaCGG chr8 7010764 -5 0
XTTGCCCTGCTGCTACAAAACNGG TTtCCtTaCTGCTACAAAtaCGG chr8 6991661 -5 0
预测结果有潜在脱靶序列(小写字母为错配碱基),在基因组位置,错配碱基数目和凸起数目。
3 全基因组snp分析
Snippy 软件可用来查找单倍体参考基因组和 NGS 序列读数之间的SNP 和插入/缺失 (indel),一行命令行即可搞定:
(snippy): snippy --reference 出发菌株.fasta --ctgs 编辑株.fasta --cpus 10 --outdir SNPS
--reference fasta 格式的参考基因组
--ctgs fasta 格式的编辑株基因组
--cpus 运算使用的cpu 数目
--outdir 运算结果输出文件夹名称
打开 snps.txt 文件,看到文件格式如下,重点关注位置序号pos
4 结果分析
将2 中分析出的每一个潜在脱靶位点与3 中snp 为位点比对, 若snp位点处于潜在脱靶位点位置序号±20bp 的范围,进一步进行序列比对,查看是否脱靶。若snp位点处于潜在脱靶位点位置序号±20bp 的范围之外,则可初步判定该位点未发生脱靶。
以上是我脱靶分析的初步尝试,欢迎大家批评指正,一起交流。
共有 0 条评论