衣被天下、无棉不安—3个现代品种棉花高质量基因组组装和结构变异挖掘
文章信息
发表期刊:Nature Plants
影响因子:15.8/Q1
研究背景
棉花是全球重要的可再生纤维作物,但由于基因型特异性以及品种、管理时间和环境因素之间的复杂相互作用,其产量和纤维品质表现出了高度可变性。由于初始基因库的狭窄,现代育种可能会限制未来棉花产量的增长。依赖准确的品种特异性数据,精确育种和生物技的应用为上述问题提供了潜在的解决方案。因此,作者通过生成三个现代棉花品种(“UGA230”、“UA48”和“CSX8308”)的高质量参考基因组并更新“TM-1”棉花基因组来满足这一需求。分析结果显示在四个基因组中观察到相当大的序列和结构变异,这些变异与“Pima”棉花的基因组渗入、基因调控机制以及表型性状分化有关。这些基因组和比较分析为未来提高全球棉花产量和可持续性的基因研究提供了宝贵的基础。
研究结果
TM-1高质量基因组的组装
目前,TM-1 V2版本的参考基因组被广泛应用于棉花育种和遗传学分析,但其具有一定的局限性,V2组装版本无法准确区分棉花基因组中着丝粒周围大量且高度重复的序列,从而导致组装较为碎片化(包含5,723个contigs)。作者使用116.7× PacBio CLR数据, 55.0× Illumina 数据和172× HI-C数据对TM-1进行了重新组装和注释。由此产生了TM-1 v3 版本高质量参考基因组,该新版本参考基因组只有 91 个contigs(平均每个染色体 2.1 个gap,contig N50 为 40.0 Mb),与 v2版本相比,基因组组装连续性提高了 63 倍(图1a)。
TM-1 基因组具有很高的重复性,重复序列占比70.8%,10.9% 是蛋白质编码转录本,其中34.3%重复序列都是由 Ty3 重复组成的。两个棉花亚基因组(“A”和“D”)表现出高度分化:A亚基因组较大(1,429.26 Mb)和 D亚基因组更紧凑(835.92 Mb)。亚基因组大小近两倍的差异主要是由重复序列导致的,其中 A 亚基因组上重复序列是D亚基因组的2.1 倍(1,076.2 Mb 对 501.6 Mb),Ty3 重复多近三倍(577.0 Mb 对 196.2 Mb),但 Ty1 重复几乎相同(48.7 Mb 对 47.7 Mb)(图 1b)。
3个现代棉花品系的基因组组装
改良品种和现代品种的基因组序列(图 2b、c)和纤维性状(图 2d)与 TM-1 有明显差异。由于棉花基因组较大、重复序列占比高,现代棉花与 TM-1 之间的表型和序列差异足够大,以至于难以确定与作物改良相关的性状目标。因此作者选取了3个具有代表性的棉花品系,作为目标参考基因组,UGA23纤维细腻,产量潜力高,适应生长季节长的地区;UA48成熟早,纤维强度高,长度长;CSX8308轧棉机产量极高,对细菌性枯萎病具有极好的抗性。作者使用与 TM-1 V3 相同的方法对这三个品系的棉花基因组进行组装,得到的基因组具有相似的完整性、准确性和连续性(图 3a、表 1)。作者进一步对四种品系的棉花进行了完整的基因注释,发现了大量基因存在PAV和CNV,此次新发现的基因PAV和CNV为棉花改良提供了新的遗传多样性目标。
4个棉花品种比较基因组分析和变异分析
作者对四个棉花品种做了比较基因组分析,这四个基因组具体很好的共线性,没有发生大的易位,只有一些大的倒位,每对基因组之间 98.4% 以上的序列都是完全共线的(图3a、b)。这些大倒位可能与栽培棉花的性状变异有关,如之前发现的与纤维长度相关的QTL与 A08 染色体上的大倒位重叠。基因组家族扩张与收缩结果显示,这些扩张的基因家族与生殖相关的功能有关,UGA230 中与花粉细胞分化有关、UA48 中与微管蛋白复合物组装和生长素运输功能有关,以及 CSX8308 中与表皮细胞分裂、毛状体分化、甲基化和染色质修饰功能有关,这些都会影响纤维细胞数量和纤维长度。
基因存在与缺失变异分析(PAV)分析中,作者发现了 15,472 个同源基因家族不存在与TM-1 中,但存在于一个或多个现代品种基因组中(图3c)。作者将 UA48 基因投射到其他三个基因组上,揭示了非编码序列进化和注释支持是基因PVA的主要驱动力(图3d)。
综上,这些结果证明了开发品种特异性基因组的重要性:如果没有新的基因组,现代种质中发现的 25,326 个(8.32%,平均每个基因组 6,331 个)基因将无法识别。
种间基因渗入影响纤维品质
作者进一步研究了现代棉花品种与皮马棉之间的基因渗入现象,三个现代栽培品种的基因组包含少量(n = 37–51)中等大小(50 kb 至 2.05 Mb)且通常是共享的皮马棉共同祖先区域(图4a),这表明许多基因渗入发生的时间相当近,并且发生在现代品种的共同祖先中。皮马棉纤维质量在所有棉花品系中最高,因此作者证实了基因渗入序列在转录水平上具有功能活性,这表明基因渗入序列保留了部分功能效应。同过对渗入基因的GO分析发现,渗入基因在纤维生产相关的一系列关键生物过程中被富集(图 4b),这表明皮马棉的基因渗入对现代棉花纤维品质改良具有潜在影响。
研究结论
本研究中,作者更新了TM-1参考基因组并组装出3种具有代表性棉花品系的高质量基因组,分析结果显示,四个基因组之间存在相当大的序列和结构变异,这些变异证明与棉花性状息息相关,这表明了开发和利用特定品种基因组的重要性。作者的研究为未来通过精准育种和生物技术手段提升全球棉花产量和可持续性提供了重要的基因基础。
版权声明:
作者:congcong
链接:https://www.techfm.club/p/173901.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。
共有 0 条评论