文献分享18:栽培辣椒和野生辣椒的基因组为辣椒驯化和群体分化提供了基因组学见解
文献
2023
Nature Communications
Genomes of cultivated and wild Capsicum species provide insights into pepper domestication and population differentiation
课题背景
(1)辣椒属于茄科,包括35个种。C. annuum var. annuum是世界上最普遍种植的辣椒,包含辛辣和非辛辣(甜)的辣椒果实。辛辣果实不仅是一种宝贵的食物和保健资源,也可以作为止疼药和抗癌药。
(2)早在公元前7000年左右,辣椒就在中美洲和/或南美洲被驯化,是最古老的驯化作物之一。现在栽培的五种辣椒分别是从C. annuum var. glabriusculum 驯化而来的C. annuum var. annuum,从C. baccatum var. baccatum 驯化而来的C. baccatum var. pendulum, C. chinense, C. frutescens和C. pubescens. 五个栽培种又可以分成3个分支。
(3)栽培辣椒的性状
C. pubescens具有紫色花冠和深棕色或近乎黑色的种子。
C. baccatum var. pendulum具有白色花冠并带有黄色或金色斑点以及米色或淡褐色的种子。
C. baccatum var. baccatum的花冠是白色或近乎白色的,带有花冠斑点。
C. frutescens和C. chinense的花冠通常是近乎白色,但更常见的是淡绿色。
C. annuum var. annuum的花冠是白色的(很少是紫色的)。
C. chinense在果实的形状、大小和颜色方面具有多样性,而C. frutescens的果实通常较小且呈椭圆形。C. chinense的果实通常非常辛辣,具有浓烈的水果味道和独特的香气。C. frutescens的果实也具有辛辣的特点。
(4)有人提出辣椒的驯化可能发生在多个起源中心。然而,先前的大规模辣椒群体研究主要集中在单一的栽培种C. annuum var. annuum上。因此,对于各种栽培辣椒和野生辣椒之间的系统发育关系、遗传多样性、种群分化、趋同和趋异选择以及基因渐渗等研究仍然有限。
亮点
本研究中,作者首先利用PacBio长读长数据和Hi-C数据,组装了三个辣椒(分别来自Annuum分支, Baccatum 分支和 Pubescens 分支)的高质量基因组,并且对这三个参考基因组构建了一个图形泛基因组,然后对涵盖五个栽培种以及近缘野生种的500份辣椒种质资源进行了全基因组重测序。
通过群体水平的分析,作者提供了辣椒属物种的群体分化、趋同和趋异驯化以及基因渐渗的基因组学见解,并确定了与重要农艺性状(如果实形状和风味、开花时间以及生物/非生物胁迫应答)相关的候选基因。
这项研究为未来的功能研究和辣椒属物种的分子育种提供了全面而有价值的基因组资源。
结论1 番茄群体水平的DNA甲基化图谱
Fig S3
本研究选取了3种辣椒用于组装参考基因组,分别是来自annuum分支的C. annuum var. Zhangshugang, 来自baccatum分支的C. bacaccatum var. pendulumpi 632928和来自Pubescens分支的C. Pubescens Grif1614。这三个基因组整体上显示出高度共线性,尽管它们之间存在一些大的倒置和基因组重排(Fig S3)。
为了给辣椒属物种的遗传多样性提供更全面的参考,作者对三份参考基因组构建了图形泛基因组。把“632928”和“Grif1614”比对到“Zhangshugang”参考基因组上去鉴定InDel和结构变异,这些从“632928”和“Frif1614”鉴定出的变异被整合到“Zhangshugang”基因组上形成一个图形泛基因组。
结论2 辣椒属的系统发育和种群结构
Fig 1a
作者对来自9个辣椒种的1296份材料进行了低深度全基因组重测序(深度约为1×)。利用浅全基因组重测序数据检测SNP,然后使用GenoCore创建了一个核心集合,该集合包括500份材料,捕获了1296份辣椒材料总遗传多样性的97.5%,这些核心材料主要来自中美洲和南美洲(Fig 1a)。对这500份材料进行了进一步的重测序,深度约为14.7×,共22.3Tb数据。通过把这些序列比对到图形泛基因组,共鉴定出100,111,632个高质量SNPs和5,306,979个InDels。
经过分类学修正之后,这500个样本被分为七个辣椒属物种,分别是C. pubescens(n=38)、C. chacoense(n=17)、C. baccatum(n=118)、C. annuum(n=112)、C. galapagoense(n=1)、C. frutescens(n=99)和C. chinense(n=115)。
Fig 1b-c
C. annuum 进一步分为栽培种(C. annuum var. annuum;n=90,包括10个可能的野生样本)和野生种(C. annuum var. glabriusculum;n=22)两种形式。C. baccatum 也分为栽培种(C. baccatum var. pendulum;n=109)和野生种(C. baccatum var. baccatum;n=9)两个群体(Fig 1a-b)。
这七个种在进化树中的位置与先前报道的一致。C. pubescens(Pubescens clade)位于其他六个物种的姐妹群的位置,向内依次是C. chacoense、C. baccatum var. baccatum 和 C. baccatum var. pendulum,它们形成了 Baccatum clade。而C. galapagoense、C. frutescens、C. chinense、C. annuum var. glabriusculum 和 C. annuum var. annuum 形成了 Annuum clade(Fig 1b)。
PCA显示出三个主要的群集,代表着Pubescens、Baccatum 和 Annuum 分支(Fig 1c-d)。其中PC2清晰地将Annuum 分支中的四个群体分开,包括C. frutescens、C. chinense、C. annuum var. annuum 和 C. annuum var. glabriusculum。
在这些辣椒样本中共鉴定出了38个可能的杂交种,它们都来自Annuum 分支,其中包括5个来自C. annuum var. annuum,3个来自C. annuum var. glabriusculum,10个来自C. chinense,以及20个来自C. frutescens。这些可能的杂交种和10个可能的C. annuum var. annuum 野生样本被排除在下游种群分析之外。
结论3 辣椒属物种的群体分化
Fig 2a-c
作者利用群体分化指数Fst研究了五个栽培亚群(C. pubescens、C. baccatum var. pendulum、C. frutescens、C. chinense 和 C. annuum var. annuum)以及三个野生亚群(C. chacoense、C. baccatum var. baccatum 和 C. annuum var. glabriusculum)之间的全基因组分化。
C. baccatum var. baccatum 和 C. baccatum var. pendulum 具有最低水平的全基因组分化(Fig 2a)。其他所有的比较,Fst都大于0.37,说明辣椒属物种之间存在较强的群体分化,并且不同栽培种具有独立的驯化历史。
这五个栽培种分布在特定的环境中,具有明显香气差异,并表现出广泛的生物和非生物胁迫耐受性差异。为了更好地理解这些独特特征的遗传基础,作者确定了高度分化的基因组区域(Fst前1%的窗口)。高度分化的基因组区域的总大小在不同的两两物种比较之间相似(Fig 2b),但在C. pubescens 和 C. annuum var. annuum 之间的分化区域中发现了更多的基因(Fig 2c)。
Fig 2d
虽然大多数基因在两两比较中都是特异的,但是涉及生物/非生物应答的基因常常在多个比较中被检测到(Fig 2d)。
开花时间是一个复杂的特征,反映了植物对它们各自生长环境的适应性。开花时间在五种栽培辣椒中存在差异。C. pubescens 需要最长的开花时间,其次是 C. baccatum var. pendulum、C. chinense 和 C. frutescens,而 C. annuum var. annuum 需要最短的时间。与开花时间相关的基因在栽培辣椒之间高度分化的区域中被发现,如SUF4、FLX3以及FY。
辣椒素对辣椒的辛辣味贡献很大。在五种栽培辣椒的两两比较中,与辣椒素生物合成有关的基因被鉴定出位于高度分化的基因组区域,如CCR在C. frutescens 和 C. pubescens 以及 C. chinense 和 C. pubescens 之间的分化区域被发现(Fig 2d)。
挥发性化合物是重要的与风味相关的化合物,影响消费者的喜好。如醇类和醛类化合物常常存在于辣椒属植物中,包括C. annuum var. annuum、C. chinense和C. frutescens,但它们的特征在不同物种之间有所变化。调节醇和醛类生物合成的基因,如编码醇脱氢酶的基因,被发现位于明显分化的基因组区域(Fig 2d)。非挥发性化合物(如糖类),也与辣椒的风味高度相关,并在辣椒属中显示出种内和种间的变异。
结论4 辣椒的种群历史
Fig 2e-g
有效群体大小 (Ne) 的动态变化可以深入了解环境因素和人类驯化事件对种群历史的影响。经历Last Glacial Maximum (LGM)时期后辣椒所有种的有效群体大小急剧下降,当进入到Meghalayan时期,Ne迅速恢复到稳定期(Fig 2e)。
C. annuum var. annuum的Ne一直以来是所有群体中最低的,直到1000年前开始逐渐增加,特别是在哥伦布发现美洲后。对C. annuum var. annuum进行强烈的驯化和选择可能导致其LD衰减速度相对较慢(Fig 2f),并且相对于其他栽培种,其遗传多样性更低(Fig 2g)。
结论5 辣椒属物种的趋同和趋异驯化
Fig 3a-b
栽培辣椒的育种目标包括果提高实产量和品质、改善植株结构以及提高对生物和非生物胁迫的抗性。
两种栽培辣椒,C. annuum var. annuum 和 C. baccatum var. pendulum 的果实明显较长、较宽,与其野生祖先相比,两者的形态更具多样性(Fig 3a-b),这表明C. annuum var. annuum 和 C. baccatum var. pendulum 可能经历了趋同驯化,导致果实更大和形态更多样化。
Fig 3c-d
作者将栽培辣椒C. annuum var. annuum和C. baccatum var. pendulum与它们的野生祖先C. annuum var. glabriusculum和C. baccatum var. baccatum进行比较以鉴定全基因组的受选择信号。分别从C. annuum var. annuum(Fig 3c)和C. baccatum var. pendulum(Fig 3d)找到了529个和615个受选择区域。
Fig 3e-h
值得注意的是,只有11.17Mb的基因组区域(包含68个基因)在C. annuum var. annuum和C. baccatum var. pendulum两者中都被选择(Fig 3e),而分别在C. annuum var. annuum和C. baccatum var. pendulum中特有的选择区域为165.34Mb(1553个基因)和170.78Mb(890个基因)。
果实大小和重量是辣椒育种中最重要的目标之一。在C. annuum var. annuum的受选择区域中检测到的与果实大小和重量相关的基因和QTL在很大程度上与C. baccatum var. pendulum中检测到的不同(Fig 3c-d)。在C. annuum var. annuum中检测到的最强的驯化信号之一位于Chr3上,其中包含果实重量的QTL Han3.1 32,而在C. baccatum var. pendulum中,最强的信号包括Chr2的Han2.1 32和Chr9的果实大小/重量QTLs Fwd/Fwg。这些结果表明,C. annuum var. annuum和C. baccatum var. pendulum果实大小和重量的增加,可能是通过独立的受选择导致的。
在C. annuum var. annuum的受选择区域发现了两个编码OVATE家族蛋白的基因(Caz06g07310和Caz09g04240),这些基因在番茄中已被报道参与果实形状的调控,但在C. baccatum var. pendulum中没有发现。这些结果表明,与果实重量类似,C. annuum var. annuum和C. baccatum var. pendulum中果实形状的驯化也主要是通过选择不同的基因组区域实现的(Fig 3a)。
对C. annuum的果实形状指数的进行GWAS分析,鉴定到一个显著的关联信号,位于Chr2的160,915,869bp到161,006,859bp之间,包含五个基因(Fig 3f)。在C. baccatum中的果实形状指数的GWAS分析发现了两个极显著的信号,一个在Chr2的172,704,945bp到172,706,325bp之间,另一个在Chr10的120,586,110bp到122,585,250bp之间(Fig 3g)。在Chr2的关联区域中没有注释的基因,而在Chr10上的区域包含四个基因,其中包括一个(Caz10g08850)编码OVATE家族蛋白的基因。与C. baccatum var. baccatum相比,Caz10g08850基因组区域的核苷酸多样性在果实形状指数>4(纤维形)和果实形状指数<1.2(钟形)的C. baccatum var. pendulum群体中都要低得多(Fig 3h),表明在辣椒育种过程中不同辣椒类型中Caz10g08850基因的不同等位基因被固定以满足消费者的喜好。
野生辣椒通常具有辛辣味。在辣椒的驯化历程中,已经选择了不同程度的辛辣味,以满足不同的烹饪需求。在C. annuum var. annuum和C. baccatum var. pendulum的受选择区域找到了36个和14个与辣椒素合成有关的基因(Fig 3c-d),其中只有两个基因(Caz03g22890和Caz07g10470)重叠。这些结果表明,C. annuum var. annuum和C. baccatum var. pendulum中的辛辣差异主要是通过在独立的驯化过程中选择辣椒素合成途径中的不同基因来实现的。
结论6 从Baccatum分支向Annuum分支的基因渐渗
Fig 4a-b
将抗性基因从近缘物种中引入是一种常见的育种手段。在辣椒属植物中,通过TreeMix检测到了从Baccatum分支到Annuum分支(包括C. frutescens和C. chinense)的基因流动事件(Fig 4a)。ABBA-BABA 检验也进一步支持了这一基因流动事件(Fig 4b)。
Fig 4c-d
通过fd计算全基因组的平均基因渐渗强度为1.71%,基因组渐渗比例为1.51%,在Chr6-Chr7-Chr12上检测到最强的基因渐渗强度(Fig 4c)。
Chr6末端存在强渐渗区域(前1%fd),包含了72个基因,其中包括17个与抗性相关,其中15个基因聚成了两个基因cluster(Fig 4d)。第一个cluster中的Caz06g28230基因,与番茄Mi-1同源,被证实与抗性相关。
Fig 4e-f
进一步对Annuum分支中所有的物种进行基因组区域的扫描,寻找与Baccatum分支相似的区域。作者发现了Baccatum基因渐渗主要存在于C. chinense和C. frutescens中,而在C. annuum中很少见(Fig 4e)。这种渐渗导致了这一区域在C. chinense和C. frutescens中相对于C. annuum var. annuum具有更高的遗传多样性(Fig 4d)和更强的连锁不平衡(Fig 4f),这可能是缺乏重组导致的。
在Chr7和Chr12上的基因渐渗区域还发现了有助于生物和非生物胁迫抗性的基因。这些结果共同表明,从Baccatum分支到C. chinense和C. frutescens的基因渐渗可能帮助了抗性的提高。
本文使用 文章同步助手 同步
共有 0 条评论