CRISPR/Cas9脱靶分析

1     总体思路

        由于CRISPR/Cas9编辑系统的脱靶常表现为在错配位点引入小片段的插入、缺失或碱基替换,即SNP位点与indel。因此使用SNP分析软件,分析编辑菌株相较于出发菌株的全基因组SNP与indel,并与潜在脱靶位点进行比较,即可初步检测编辑菌株在潜在脱靶位点是否发生脱靶。

 2     潜在脱靶位点预测

       使用Cas-OFFinder(http://www.rgenome.net/cas-offinder/)在线预测网站,选定PAM type 为SpCas9 fromStreptococcus pyogenes:5'-NGG-3',在Query Sequences 中 填入20 bp 靶位点序列,Mismatch Number设置为5、DNA Bulge Size和RNA Bulge Size均设为0 (也可根据需要放宽阈值,将Mismatch Number、DNA Bulge Size和RNA Bulge Size数值调高),Target Genome、Organism Type选定为others、选择Genomes 为Escherichia coli K-12 MG1655,点击submit。也可下载本地版Cas-OFFinder 进行分析。打开snps.txt 结果如下:

#Bulge type   crRNA   DNA    ChromosomePosition   Direction    MismatchesBulge Size

XTTGCCCTGCTGCTACAAAACNGG   TcttCCTGaTGCTACcAAACTGG    chr8   5020960  -5  0

XTTGCCCTGCTGCTACAAAACNGG   TTtCCtTaCTGCTACAAAcaCGG    chr8   6972501  -5  0

XTTGCCCTGCTGCTACAAAACNGG    TTtCCtTaCTGCTACAAAtaCGG    chr8   7010764  -5  0

XTTGCCCTGCTGCTACAAAACNGG    TTtCCtTaCTGCTACAAAtaCGG    chr8   6991661  -5  0

         预测结果有潜在脱靶序列(小写字母为错配碱基),在基因组位置,错配碱基数目和凸起数目。

3     全基因组snp分析

       Snippy 软件可用来查找单倍体参考基因组和 NGS 序列读数之间的SNP 和插入/缺失 (indel),一行命令行即可搞定:

      (snippy):  snippy --reference  出发菌株.fasta --ctgs  编辑株.fasta   --cpus 10   --outdir  SNPS 

--reference      fasta 格式的参考基因组

--ctgs               fasta 格式的编辑株基因组

--cpus              运算使用的cpu 数目

--outdir           运算结果输出文件夹名称

       打开 snps.txt 文件,看到文件格式如下,重点关注位置序号pos

4  结果分析

       将2 中分析出的每一个潜在脱靶位点与3 中snp 为位点比对, 若snp位点处于潜在脱靶位点位置序号±20bp 的范围,进一步进行序列比对,查看是否脱靶。若snp位点处于潜在脱靶位点位置序号±20bp 的范围之外,则可初步判定该位点未发生脱靶。    

       以上是我脱靶分析的初步尝试,欢迎大家批评指正,一起交流。

      

      

版权声明:
作者:Mr李
链接:https://www.techfm.club/p/156089.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>