基因组育种,真的比传统育种更好么?

中国“十四五规划”提出种业振兴总目标:种业科技自强自立,种源自主可控。习近平总书记在海南考察时也说到:“中国人的饭碗要牢牢端在自己手中,就必须把种子牢牢攥在自己手里。要围绕保障粮食安全和重要农产品供给集中攻关,实现种业科技自立自强,种源自主可控,用中国种子保障中国粮食安全。”不论是总书记的讲话还是十四五的规划,都提出要振兴种业,振兴种业的核心就是“种”。那么怎么选好“种”,怎么培育优质“种”,如何育种就成了关键。

国际上将育种发展分为四个阶段:育种1.0时代,人类驯化了大量野生动植物进入农耕文明;育种2.0时代,育种家主要依赖经验并把统计学、数量遗传学和杂交育种策略应用到优良品种选育中;育种3.0时代,先进的生物技术包括分子标记辅助选择、基因工程在育种中广泛应用。而随着生命科学、应用统计学、人工智能算法等相关领域科学技术的发展,育种进入由前沿科学技术引领的“生物技术+信息技术+人工智能”育种4.0时代。

想要理解生物技术和信息技术结合的育种4.0时代模式,我们需要对生物遗传和基因调控过程有一定的认识。

01 遗传和基因

什么是遗传呢?百度百科这样说,“指亲代调控相应性状的基因通过无性繁殖或有性繁殖传递给后代,从而使后代获得其父母遗传信息的现象“,维基百科的解释是,”俗称随根,是指经由基因的传递,使后代获得亲代的特征”。

通俗来说就是,父母通过基因把自身的一些形态特征传递给子女的现象就是遗传。比如,爸爸带着脸蛋红,小宝宝也有很大概率有着脸蛋红,皮肤黝黑的妈妈生下来的女儿可能也会有相似的肤色。

基因和遗传的关系

既然遗传和基因有着千丝万缕的关联,那么基因又是什么呢?

历史上遗传学的发展大致分为三个阶段。首先是19世纪,达尔文提出自然选择学说,他认为生物的性状会主动适应环境,并按照环境的适应方向进化。第二阶段是,19世纪60年代,奥地利遗传学家格雷戈尔·孟德尔提出了生物的性状是由遗传因子控制的观点。第三阶段是近现代遗传学。在孟德尔定律被认可后,遗传因子的本质是什么,遗传因子如何变异、传递等问题成了遗传学研究领域的关键问题。

20世纪初期,遗传学家摩尔根通过果蝇的遗传实验,认识到基因存在于染色体上,并且在染色体上是呈线性排列,从而得出了染色体是基因载体的结论。1909年丹麦遗传学家约翰逊(W. Johansen,1859~1927)在《精密遗传学原理》一书中正式提出“基因”概念。

通过上述的介绍,我们可以把基因认为是生物细胞内,在染色体DNA链上,带有遗传信息的一个片段。

细胞内结构

基因组结构

基因组中除了蕴藏着大量决定性状的蛋白编码基因,更包含了大量调控相关基因表达的非编码区功能调控元件,其中既有DNA调控序列(如启动子、增强子、抑制子等),还包括一些蛋白质(及RNA)调节因子的编码基因,它们都是基因表达调控的执行者。因此,基因组上的,不论是编码区还是非编码区的遗传变异,都会直接或间接影响相关靶基因表达的过程和结果,例如:XXL基因缺失(遗传变异的一种类型)会导致XX果蝇变成雄性。

果蝇变异示意

02 表观遗传

但是随着遗传学的发展,人们发现即使没有基因序列的改变,基因表达的过程也会受到影响,这是为什么呢?这就是表观遗传关注的研究领域了。所谓表观遗传,指的是在DNA序列不改变的情况下,基因功能发生的可遗传的变异,最终可导致表型变化,包括DNA甲基化、组蛋白修饰、RNA介导的基因沉默等。

一个经典的例子就是小鼠毛色杂交实验,纯合黄色小鼠(AvyAvy)与纯合黑色小鼠(aa)杂交,F1代没有表现出黄色,反而呈现出介于黄、黑色的一系列过渡类型。

在1999年之前,科学家就已经知道小鼠毛色的深浅主要由Avy基因所决定。当Avy基因正常表达时,小鼠毛色呈现黄色,反之则为黑色。

科学家检测了不同毛色的F1小鼠,发现Avy基因的表达水平越高,其毛色越接近黄色亲本。

但同时也给科学家带来了新的困惑:为何基因型相同(Avya)的F1小鼠会产生不同的毛色性状?

首先,F1小鼠均处于相同的培养条件下,因此环境因素被排除;其次,测序结果显示不同F1小鼠的Avy基因完全一致,并无基因突变发生。难道除了基因和环境外,还存在其他调控基因表达的机制么?

小鼠毛发变化示意

这就要说到最早被鉴定出来的表观遗传学修饰——DNA甲基化。实际上,组成DNA的四种碱基中,只有部分胞嘧啶(C)能被甲基化,具体表现为在胞嘧啶的5′碳位上共价结合了一个甲基基团。这种看似微小的碱基修饰,虽然没有改变碱基排序,但的确影响着基因的表达。依据体外实验的结果,科学家曾提出过一种模型来解释甲基化的作用机制,如下图所示:当启动子区域的甲基化程度较高时,基因则处于“关闭”状态。形象点说,导致小车无法前行的因素可能仅仅只是路边的“指示牌”。

在环境和基因都一致的前提下,科学家们检测了F1小鼠的甲基化水平,发现不同F1小鼠的甲基化水平呈现出了差异。准确地说,是Avy基因上游调控序列的甲基化水平不同,间接影响了Avy基因的表达。调控序列的甲基化程度越低,Avy基因的表达量越高,小鼠毛色越黄。该结果证实了DNA甲基化在小鼠体内也发挥着调控作用,这意味着在基因序列不变的前体下,表观遗传也能导致性状的改变。

我们可以简单理解为基因组序列就像是一块蛋糕,而各类表观修饰就好比蛋糕上的裱花或是镶嵌在其中的水果,水果和裱花的样子或者位置的不同都会导致蛋糕最终的样子发生变化。不同表观修饰,决定了最后蛋糕的样子不同。

像蛋糕一样的表观遗传修饰

03找到目标基因存在的困难

虽然我们可以通过基因和表观修饰来预测疾病和改良物种,但是基因组很大,我们很难直接在其中找到我们想要研究的基因。以人类基因组研究为例,人类基因组包含约30亿个碱基,也就是3个G。如果一页A4纸打印5000个碱基的话,我们需要打印60万页,才能把一个人的基因组打印完。如果600页装订一本书,60万页可以装订1000本书。这样的一本书厚度大约在3厘米左右,那么1000本3cm厚的书摆在一起有30米长,比一节和谐号火车车厢还要长。

基因数据大小的示意

一个正常人体显然是没有和谐号列车那么大,那么这么大的基因组DNA是怎么存在于人体内的呢?DNA通过高度折叠实现把单个细胞内2m长的基因组DNA放置于微米级的细胞核内,这个过程是分四步完成的,这四个过程对应着四个结构:第一级结构是核小体,它是DNA双螺旋“绳子”缠绕在组蛋白上而形成的;第二级结构是核小体进一步螺旋化形成30nm螺线管,这里6个核小体组成一圈形成中空结构的管状螺旋体,即30nm染色质纤维;第三级结构是由螺线管再进一步螺旋化成为直径为0.4微米的筒状体,也称为超螺旋体;第四级结构就是可以在显微镜下看到的染色体,它是由超螺旋体进一步折叠盘绕成的。通过以上四步,DNA的长度被凝缩了8,400倍左右。

那么我们怎么在高度折叠且庞大的基因组里面找到哪些遗传信息是调控我们想要研究的表型,然后通过它们来实现品种改良呢?这就回到我们前面提到的育种发展的4个阶段。

04 育种的发展

育种1.0时代,人类驯化了大量野生动植物,进入传统的农耕畜牧时代,这个时代更多的是养殖,就是哪些动物和植物可以被人类所培育,并没有形成育种的理念。

育种2.0时代,人们依赖育种经验,筛选性状优异的个体(比如产量高的水稻品种,长得好的猪仔),结合统计学等方法对后代进行选择。但性状除了受遗传的影响,还会受环境的影响,所以直接对性状进行选择并不一定总能够选择到控制优良性状的基因,育成一个优良品种需要较长的时间。

育种3.0时代,人们已经了解性状的形成与基因组信息息息相关。要想高通量获取生物体基因组信息,就需要进行测序。但是由于早期基因组测序费用很高,所以人们从染色体上选择一些分子标记(分子标记:指能反映生物个体或种群间基因组中某种差异的特异性DNA片段),与性状进行连锁分析,找到一些与性状紧密连锁的分子标记,在选育时对这些标记进行分析,最后达到对目标性状进行定向选择的目的。但由于找到的分子标记不一定是直接影响控制优良性状的基因,而且有可能在后代发生重组,所以这种方法有时候也不是那么可靠。

育种4.0时代,是基因组选择育种的时代,即通过对群体进行高通量测序,结合生物信息分析技术,定位到控制某个性状的关键基因,直接通过转基因或对后代基因型进行选择的方法来选育生产高效的个体。基因组选择育种显著的缩短了育成一个优良品种的时间,同时,由于它是对全基因组进行分析,找到了直接控制某个性状的关键基因和突变,可靠性相比育种2.0时代有了质的提升,提高30%以上。

育种的四个时代

近十年来,随着生命科学技术的发展,“基因组选择”已经在动植物育种相关领域的流量非常大。

既然基因组选择育种这么好,我们是不是对想要改良品种的每个个体都进行全基因组测序,然后进行生物信息学分析就可以了呢?答案是否定的!

首先是时间和成本的问题,如果对每个个体都进行全基因组测序,不仅耗时,而且金钱的花费也将是一笔天文数字,要知道当年“人类基因组计划”的初步完成大约历时13年,耗资近30亿美元。其次,获取的数据量会非常大,而遗传的过程中,同一个品种里的不同个体的都会存在很大一部分高度保守的DNA序列,这些基因的序列基本都是相同的,检测这部分序列也会造成资源的浪费。

05 现代化育种模式

那么,21世纪的科学家们现在是如何进行物种改良的呢?科学家们针对想要改良的物种,选取具有代表性的个体和品种,搜集生物表型数据,然后对选择的个体(参考群体)进行全基因组测序,再根据已有的参考基因组序列,找到与育种目标性状显著相关的遗传变异位点,把他们设计成基因芯片(PS:这个和手机电脑的芯片可不一样哟,手机电脑中用到的芯片是一种集成电路的载体,表面是数不清的电阻,电容等电器元件,而基因芯片是将数以万计、乃至百万计的特定序列的DNA片段(基因探针)固定在硅片、玻片上的载体,表面是DNA片段)。

之后,研究人员把参考群体的基因芯片数据和表型数据传递给计算机,计算出每个遗传变异位点对应表型的效应值(效应值可以理解为某个基因序列的变异对生物表型发生变化做出的贡献大小);随后,对待选群体进行基因芯片检测,获取该个体每个遗传变异位点的基因分型结果,并结合位点效应值,可进行基因组育种值评估。

基于基因组育种值评估结果,选取评估结果好的个体进行留种,这个过程称为“选种”。同理,在留完种后,要想其下一代更好,我们也希望有一个好的个体与其强强联合,这个过程称为基因组选配。不论是基因组选种,还是基因组选配,在生物育种领域,其目的都是提升生产效率。

基因组选留过程

从上述可知,在进行基因组育种应用时不用对所有个体都进行全基因组测序检测,只需使用基因芯片检测调控育种目标表型的遗传变异位点,通过芯片检测结果,就可以提前预测该个体下一代的性状是否优良。这种方式,既不用对与育种目标性状无关的基因序列进行检测,降低检测成本;同时,还能缩短大量个体检测所需的时间,实现高性价比的快速选育。

功能位点基因芯片助力中国育种企业提升育种效率。在育种4.0时代的模式下,企业仅需完成表型数据搜集和样本采集,育种专家选择代表性群体和个体及其组织样本,进行全基因组测序和表观基因组测序。测序完成后,生物大数据研究中心将对物种的基因组进行功能研究,并根据功能研究结果挑选重要的功能突变位点,制备成“液相功能位点基因芯片”。液相芯片不仅可以帮助企业摆脱固相芯片海外企业的专利限制,而且可以按需定制,灵活升级,性能优异,同时性价比也更高。

芯片设计完成之后,对个体进行芯片检测,获取基因分型数据。之后,把获取的芯片数据和表型数据上传给HiBLUP(PS:HiBLUP是育种大数据处理平台核心算法,其不依赖任何第三方软件包,不受任何专利限制,功能涵盖基因组选种、选配全计算环节,能够高效处理百万群体、千万育种标记大数据),通过自主的基因组选种算法对每个个体进行基因组育种值评估,并选取目标性状育种值排名靠前的个体留为核心群或者扩繁群种用个体。同时,为了进一步提升后代的生产性能,我们也可以利用HiBLUP的基因组选配算法,不仅可以避免近交,还可以高效聚合优秀基因,发挥基因组育种的价值。

基因组+HIBLUP育种

版权声明:
作者:siwei
链接:https://www.techfm.club/p/165779.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>