全基因组 – 人类基因组变异分析(PacBio) (1)

破解人类基因密码的三代测序技术:

2022 年 4 月 1 日,赶在愚人节当天,《科学》杂志(Science)刊登系列文章,发表了国际 T2T 联盟攻克的首个人类基因组完成图(CHM13-T2T)研究成果,填补了此前几十年人类基因组研究留下的空白:大约 8% 的人类基因组序列「黑洞」,这些区域因为序列复杂性,一直无法被破译,尽管 2003 年国际人类基因组计划(HGP)曾经号称已经「完成了」人类基因组图谱绘制的工作。

Science 封面文章:人类基因组完成图|Science 杂志

而在这项宏伟的计划背后,以 PacBio、ONT 为代表的第三代基因测序技术,以及同时发展起来的三代测序生物信息学技术,也走入人们的视野,作为破解人类基因组奥秘的最新武器,其在解决人类遗传性疾病、罕见病和肿瘤等领域的巨大潜力,也让第三代基因测序赛道逐渐成为投资关注的热点和创业新方向。

经过测序技术的不断发展,相比于上一代测序技术,第三代基因测序技术在读长方面拥有绝对优势,突破了过去技术上无法突破的高重复区域和高多态性区域,为人类「生命密码」的真正完整的解锁提供了全新解决方案。

全基因组版块先主要以人类重测序分析为主,后期陆续加入小鼠,动植物(挖坑,思路和使用软件类似)。

人类基因组变异分为单核苷酸或单碱基变异SNV/SNPs (single nucleotide variation,SNV; single nucleotide polymorphisms, SNPs),小片段的插入缺失,结构变异(大片段的插入缺失,到位,易位等)。如下图所示:

人类基因组变异

短读长测序(二代测序)数据对于SNV/SNPs 或者小片段的插入缺失在难以比对和串联重复区域有些变异是无法测到的(技术本身原因)。

NGS, next generation sequecing

短读长测序(二代测序)数据对于50-80%的结构变异是无法测到的(测序技术本身原因)。

NGS, next generation sequecing

三代测序本身因为长读长,能够改善二代测序难以检测或者准确检测的突变区域和类型。

三代测序能够改善二代测序的不足

因此,三代测序技术(长度长)能解决基因组上二代测序无法解决的痛点,以下是一些三代测序在人类遗传学和疾病方向的应用场景(有待进一步完善):

  1. 复合免疫基因对疾病相关研究的影响( MHC基因复合物含有大量拷贝数变异)。

  2. 癌症基因组还包括大规模结构变异,例如大的插入、缺失、逆转、重复、易位和基因融合, 使得三代测序及分析能够提供有关癌症基因组复杂性最全面的观点。

  3. 神经系统、神经肌肉和神经退行性疾病,如重复扩增,拷贝数变异区域。

本次以人类基因组重测序变异分析为引,先分享PacBio的分析流程,然后是ONT平台的分析流程,还会加入串联重复序列,染色体分型,拷贝数变异,融合基因以及基因组甲基化修饰的分析。先放一张PacBio人类基因组变异分析的流程图,我们会根据流程图的顺序讲解每个软件的具体使用方法,最后串联成 pipeline 进行数据的批量分析,我们下节见!

人类基因组变异分析流程

版权声明:
作者:lichengxin
链接:https://www.techfm.club/p/135612.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>