NGS分析-二代测序结果分析

一 NGS是什么

NGS(Next Generation Sequencing,下一代测序技术),又称高通量测序,是相对于传统的桑格测序(Sanger Sequencing)而言的。

Sanger测序法一直以来因可靠、准确,可以产生长的读长而被广泛应用,但是它的致命缺陷是慢。NGS以高输出量和高解析度为主要特色,能一次并行对几十万到几百万条DNA分子进行序列读取,在提供丰富的遗传学信息的同时,还可大大降低测序费用、缩短测序时间。NGS是现行最主要的测序技术。

NGS是一个强大的功能平台,它可以同时给数以万计的DNA分子进行测序。NGS在基因组学研究领域是一个具有里程碑意义的事件。

目前二代测序的主要平台代表有罗氏公司(Roche)的454测序仪(Roch GS FLX sequencer)、Illumina公司的Solexa基因组分析仪(Illumina Genome Analyzer)、ABI的SOLiD测序仪(ABI SOLiD sequencer)和Thermo Fisher的基因测序仪。

GS类型

1. 全基因组测序

测整个基因组的序列,并提供最全面的数据。

2. 杂交捕获测序

杂交捕获测序是常用的目标基因多位点检测方案之一,该方案通过设计合成有效的特异性探针集Panel,与基因组DNA进行杂交,将目标区域序列进行捕获并富集后,使用主流的测序平台进行高通量测序。

3. 扩增子测序

扩增子测序是一种高靶向性方法,用于分析特定基因组区域中的基因变异。扩增子的超深度测序可以有效地识别变异并对其进行特征分析。

二代测序流程:样品准备、文库构建、上机测序。

其中,文库构建是上机测序前最重要的步骤之一。将DNA片段化后(若是构建RNA文库,则先将RNA反转录为cDNA),末端修复加上接头,成待测状态。

文库构建步骤:

1. 待测序DNA片段化;

2. 末端修复,形成平末端;

3. 加A尾,预备做TA连接;

4. TA连接短接头;

5. PCR连接长接头。

接头

二 NGS流程-全外显子测序分析记录

检查md5,查看数据是否完整

cat md5.txt | while read id

do

arr=($id)

md5=${arr[0]}

filename=${arr[1]}

echo `md5sum $filename`

done >md5.check

diff -b -y md5.txt md5.check

去接头

这一步在raw目录下进行

所有的数据都是原始的,没有去接头,随便展示一个:

带接头

接头里面包含了illumina universal adapter,这里用trimmomatic去掉

构建config批量处理

ls *1.fastq.gz > 1

ls *2.fastq.gz | while read id ; do echo ${id%%.*}; done > 0

paste 0 1 2 >config

rm 0 1 2

版权声明:
作者:dingding
链接:https://www.techfm.club/p/141292.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>