文献分享20: 基于高密度600K SoySNP芯片解析大豆的重组图谱
文献
2022
Plant Biotechnology Journal
Global dissection of the recombination landscape in soybean using a high-density 600K SoySNP array
背景
(1)减数分裂重组是生物体的基本生物过程,其发生受多种基因组特征和表观遗传修饰的影响。例如,一些特定的DNA 基序,如多聚A、CTT重复和CNN重复,在植物的重组位点上频繁出现,被认为是调控重组的顺式作用元件。在许多哺乳动物中,重组热点主要由PRDM9决定,它作用于特定的DNA序列,在周围区域沉积H3K4me3和H3K36me3。虽然在植物中尚未发现PRDM9的同源基因,但越来越多的研究表明,表观遗传修饰和染色质可及性在重组形成中起着至关重要的作用。
(2)重组对作物育种至关重要,因为它可以破坏有利和有害等位基因之间的连锁阻力,产生新的等位基因组合。大豆是我国主要的经济作物,但是目前仍缺乏对大豆重组模式的全基因组高分辨率的研究,重组图谱及其驱动因素在很大程度上未知。
亮点
作者构建了高密度的600K大豆SoySNP芯片,对八个大豆重组自交系(RIL)群体进行了基因型分析。
通过构建了高分辨率的重组图谱,揭示了重组事件在基因区域显著富集,基因组特征和表观遗传修饰在很大程度上影响了重组。
结论1高密度600KSoySNP芯片
Fig 1a-d
作者利用先前发表的具有代表性的854份大豆重测序数据的600,009个SNP构建了高密度600K SoySNP芯片(Fig 1a-b)。每对标记之间的间隔约为1.6kb,间隔距离大于5kb的仅占2.4%(Fig 1c)。
Fig 1e-g
与基因间的SNP相比,位于基于区域的SNP更有可能影响功能。在该芯片中,大约47%的SNP位于基因上(Fig 1d),特别是外显子区域和剪接位点(Fig 1e)。编码区区域的SNP中,85,438个位于非同义位点,34,695个位于同义位点,其余2458个SNP被预测对基因功能有重要影响(Fig 1f)。另外,在自然重测序群体中,76.0%的SNP具有大于0.05的此等位基因频率 (MAF, Fig 1g),表明在两份大豆材料之间可以检测到足够多的多态性标记。
结论2 大豆重组自交系群体的构建与基因分型
Fig 2a
Fig 2b
为了全面的了解大豆重组格局,作者利用13个大豆品种(包括1份野生种、4份地方种和8份栽培种)杂交构建了8个RIL群体(Fig 2a),利用高密度600K SoySNP芯片进行基因分型。
由于该芯片中缺失数据和基因型调用错误的比例较小,所以作者利用相对较大的侧翼基因型块来纠正基因型错误或推断缺失基因型,以进一步提高重组断点预测的准确性。基于这些重组断点,作者构建了8个RIL群体的重组图谱(Fig 2b)。
Fig S4
为了减少冗余的基因型信息,作者为每个群体绘制了一个bin 图, 群体中bin 的数量在2625到5700之间。大多数bin(77.1%)的长度都小于200 kb(Fig S4a),59.4%的bin 中包含不超过10个基因(Fig S4b),这表明bin 图具有很高的分辨率。
Fig S5
使用bin作为标记,作者进一步估计了每个bin图的遗传距离。与之前的研究结果类似,每个RIL群体的遗传图谱长度在2212.6cM-2840.5cM(Fig S5),相邻bin之间的平均距离为0.7cM。
重组率定义为估计的总遗传距离与Williams 82参考基因组的物理长度之比。平均重组率在不同RIL群体中的变化范围为2.3cM/Mb-3.0cM/Mb,平均为2.6cM/Mb。
结论3 大豆重组图谱的构建
Fig 2c
根据基因分型,8个RIL群体共检测到64 912.5个重组事件,平均每个群体8114.1个重组事件。与染色体臂相比,在中心点周围区域的重组明显受到抑制(Fig 2c)。
Fig S7
对着丝粒和端粒区域的进一步研究表明,染色体上从端粒到着丝粒的重组率呈下降趋势 (Fig S7a),这与之前在其他物种中的发现一致。此外,重组率与TE密度和GC含量呈负相关,与基因密度呈正相关(Fig 2c, Fig S7b-d)。
据报道,在一些植物中,重组事件的数量与染色体大小有关,如拟南芥、水稻、玉米和马铃薯。然而,本研究没有观察到重组事件的数量与染色体大小之间存在明显的线性关系(Fig S7e)。
在大豆中,大约一半的染色体长度被中心点周围区域占据。为了消除大中心点周围区域对重组的抑制作用,作者计算了重组事件与染色体臂长之间的相关性,发现两者呈正相关,但不显著(Fig S7f)。
Fig 3a-b
大多数物种中,重组集中在特定的基因组区域,被称为重组热点。本研究中,在20条染色体上检测到132个重组热点(Fig 3a)。在这132个热点中,只有2个热点为所有种群共有,46.2%的热点仅属于一个种群(Fig 3b),表明这些热点具有种群特异性或基因型特异性。
Fig 3c-d
进一步作者检测了与重组热点相关的QTL,在两个群体中只检测到一个QTL(Fig 3c)。这些结果表明,大豆RIL群体的重组活性可能受特定基因型背景的影响。通过适当的大豆组合之间的杂交,可以提高特定基因组区域的重组率,从而通过打破连锁阻力促进育种进程。
据报道,结构变异可以影响重组事件的分布。为了确定结构变异对重组的影响,作者鉴定了8个RIL群体亲本之间的SV,发现平均每对亲本的结构变异数是5867。作者发现每对亲本中存在结构变异的区域重组事件比预期要少(Fig 3d),这表明重组事件往往不发生在结构变异区。
结论4 减数分裂重组优先发生在高表达基因的启动子区域
Fig 4a-b
通过对重组热点进行注释,作者发现75.5%的重组事件与基因区域重叠(包括基因侧翼6k及gene body,Fig 4a)。为了测试这种重叠是否偶然,作者通过随机模拟计算了重组事件与基因组元件的重叠率,发现与基因间区相比,重组事件更倾向发生在基因区(Fig 4a)。为了更详细的研究重组与基因区域的关闭,作者将基因区域分成6类:基因上游3kb、5’-UTR、CDS、内含子、3‘-UTR、基因下游3kb,分析发现5’-UTR的重组频率更高,然后依次是基因上游3kb、基因下游3kb、3‘-UTR、CDS以及内含子(Fig 4a)。
在转录起始位点观察到一个明显的重组峰(Fig 4b),这表明在大豆中,基因启动子附近更倾向发生重组。
Fig 4c
作者将gene body及侧翼3kb存在重组位点的基因称为重组相关基因。为了确定这些基因的潜在功能,作者进行了GO富集分析,并没有鉴定到显著富集的GO term。
随后,作者利用之前收集的不同组织的28份大豆转录组数据,研究了这些与重组相关基因的转录活性,发现转录基因的比例远高于预期(Fig 4c),这表明重组更有可能针对大豆中的转录活跃基因。
Fig 4d-e
基因区域通常是高度保守的,因此推测与重组相关的基因处于净化选择。作者利用之前发表的302份具有代表性的大豆的重测序数据研究了SNP在重组位点上的分布,发现重组位点的SNP密度远低于侧翼区域(Fig 4d)。此外,重组位点附近的基因组区域具有较低的遗传多样性(Fig 4e)。
这些结果表明,大豆中重组位点相对保守,处于净化选择状态。
结论5 Poly-A和AT-rich基序与启动子区域的重组频率相关
Fig 5a-b
重组事件与不同物种中的特定DNA序列有关。为了研究大豆中重组位点是否富集了特定的DNA motif,作者使用MEME对重组事件鉴定了motif,共鉴定到两个显著富集的motif:poly-A和AT-rich(Fig 5a)。这两个motif在全基因组上都表现出在常染色质区域优先分布(Fig 5b),类似于重组事件。
Fig 5c-d
另外,作者还发现这两个显著富集的motif更倾向分布在基因的启动子区域(Fig 5c-d),这与基因启动子区域观察到更高的重组频率一致。这些结果表明,ploy-A和AT-rich很可能在一定程度上促进了启动子区域的重组。
结论6 染色质可及性促进了大豆的重组
Fig 6
植物染色质可及性与基因表达密切相关,而重组事件往往发生在基因表达活跃的区域,这暗示了重组可能与染色质可及性相关。作者利用ATAC-seq检测了重组位点的染色质可及性,发现重组事件与染色质可及性有很强的相关性(Fig 6a-b)。
Fig 7a-b
染色质可及区域(ACRs)是核小体占有率显著降低的区域,作者共确定了35,865个ACRs,发现ACRs与重组位点有显著的重叠(Fig 7a)。
Fig 7c-d
此外,重组位点与ACRs之间的距离远小于随机预期(Fig 7b-c),表明重组事件发生在靠近核小体缺失区域的地方。
为了去顶染色质可及性状态是否与重组显著相关,作者计算了重组位点和随机位点侧翼10kb区域的ATAC-seq信号,发现重组位点的ATAC-seq信号更强(Fig 7d)。
Fig 7e-f
重组位点的ACAT-seq信号显著高于侧翼区域(Fig 7e),表明核小体占有率的降低与重组的发生密切相关。因此,作者认为染色质可及性对大豆减数分裂重组有显著的影响。
结论7 减数分裂重组的表观遗传特征
每个RIL中的ACRs数量远远大于重组事件的数量,因此作者推测染色质可及性可能是重组形成的必要条件,但不是充分条件,推测其他表观因素也可能参与了大豆的重组。
H3K4me3是一种激活型组蛋白修饰,在之前的研究中被认为与重组事件密切相关。为了准确的确定大豆中H3K4me3与重组的关系,作者利用CUT&TAG技术研究了大豆中的H3K4me3富集情况。在整个染色体水平,重组与H3K4me3水平正相关(Fig 6)。进一步研究发现,共69,040个H3K4me3峰与重组位点显著重叠,与重组位点的距离较随机更短(Fig 7a-c),并且重组位点的H3K4me3水平较高(Fig 7d)。综上所述,这些结果表明H3K4me3水平与局部的重组呈现强的正相关。
与H3K4me3相反,DNA甲基化作为一种经典的抑制型表观修饰,可能也影响了重组。通过全基因组范围的DNA甲基化测序,作者发现DNA甲基化与重组频率成负相关(Fig 6),重组位点的DNA甲基化水平更低(Fig 7f)。
另外,作者又做了H3K9me3的CUT&TAG,并收集了已发表的H2A.Z, H3K14ac, H3K27ac, H3K27me3, H3K56ac, H4K12ac, H3K36me3 和 H3K4me1的数据。在染色体水平,作者发现所有这些修饰与重组频率呈正相关(Fig 6)。在这些修饰中,H3K36me3和H3K4me1可能在精细尺度上对减数分裂重组的形成产生负面影响(Fig 7d,e),这与染色体尺度上的观察结果不同。
Fig S13
重组事件和表观遗传修饰倾向发生在基因区域,这表明重组和表观修饰之间的相关性可能是一种假阳性。为了排除这种可能性,作者只提取了位于基因间区域1382个重组位点,并调查了这些重组位点的染色质状态。作者发现,除了H3K4me1之外,基因间重组位点中的表观修饰与全部重组位点的分布相似(Fig S13),表明活跃的染色质状态和表观修饰是大豆重组位点的自然特征。
本文使用 文章同步助手 同步
共有 0 条评论