NGS分析-二代测序结果分析
一 NGS是什么
NGS(Next Generation Sequencing,下一代测序技术),又称高通量测序,是相对于传统的桑格测序(Sanger Sequencing)而言的。
Sanger测序法一直以来因可靠、准确,可以产生长的读长而被广泛应用,但是它的致命缺陷是慢。NGS以高输出量和高解析度为主要特色,能一次并行对几十万到几百万条DNA分子进行序列读取,在提供丰富的遗传学信息的同时,还可大大降低测序费用、缩短测序时间。NGS是现行最主要的测序技术。
NGS是一个强大的功能平台,它可以同时给数以万计的DNA分子进行测序。NGS在基因组学研究领域是一个具有里程碑意义的事件。
目前二代测序的主要平台代表有罗氏公司(Roche)的454测序仪(Roch GS FLX sequencer)、Illumina公司的Solexa基因组分析仪(Illumina Genome Analyzer)、ABI的SOLiD测序仪(ABI SOLiD sequencer)和Thermo Fisher的基因测序仪。
GS类型
1. 全基因组测序
测整个基因组的序列,并提供最全面的数据。
2. 杂交捕获测序
杂交捕获测序是常用的目标基因多位点检测方案之一,该方案通过设计合成有效的特异性探针集Panel,与基因组DNA进行杂交,将目标区域序列进行捕获并富集后,使用主流的测序平台进行高通量测序。
3. 扩增子测序
扩增子测序是一种高靶向性方法,用于分析特定基因组区域中的基因变异。扩增子的超深度测序可以有效地识别变异并对其进行特征分析。
二代测序流程:样品准备、文库构建、上机测序。
其中,文库构建是上机测序前最重要的步骤之一。将DNA片段化后(若是构建RNA文库,则先将RNA反转录为cDNA),末端修复加上接头,成待测状态。
文库构建步骤:
1. 待测序DNA片段化;
2. 末端修复,形成平末端;
3. 加A尾,预备做TA连接;
4. TA连接短接头;
5. PCR连接长接头。
二 NGS流程-全外显子测序分析记录
检查md5,查看数据是否完整
cat md5.txt | while read id
do
arr=($id)
md5=${arr[0]}
filename=${arr[1]}
echo `md5sum $filename`
done >md5.check
diff -b -y md5.txt md5.check
去接头
这一步在raw目录下进行
所有的数据都是原始的,没有去接头,随便展示一个:
接头里面包含了illumina universal adapter,这里用trimmomatic去掉
构建config批量处理
ls *1.fastq.gz > 1
ls *2.fastq.gz | while read id ; do echo ${id%%.*}; done > 0
paste 0 1 2 >config
rm 0 1 2
版权声明:
作者:dingding
链接:https://www.techfm.club/p/141292.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。
共有 0 条评论