关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

作物基因组学研究进展(二)

2020.4.20

⑵小麦基因组研究

小麦是全球最重要的粮食作物之一,小麦的稳产和增产对我国乃至全世界粮食安全的影响举足轻重。近年来由于全球气候变化、环境变化的影响,小麦生产面临严峻的挑战,对于小麦的育种和品种改良工作提出了新的要求。普通小麦(Triticum aestivum L.)是3个不同亚基因组形成的异源六倍体物种(AABBDD),由早期的野生二粒小麦与粗山羊草天然杂交而来。其基因组非常庞大且结构异常复杂,富含大量的重复序列,这些特点使得小麦基因组学的研究远远落后于水稻和玉米等二倍体植物,严重制约了小麦功能基因组学研究和育种工作的深入。

野生二粒小麦(T.turgidum subsp. dicoccoides(Körn.)Thell)是栽培小麦的四倍体祖先种。以色列等多国研究人员对野生二粒小麦种质Zavitan进行了全基因组鸟枪法测序,结合3DHi⁃C数据和遗传图谱信息将105Gb基因组序列组装到14条染色体中,其中101Gb序列能锚定到14条染色体上。同时,研究人员对野生二粒小麦不同发育阶段的各个组织进行了RNA测序。建立了65012个高可信度的基因模型并分析了相关基因的分布。同源性分析进一步表明,在亚基因组间的,有72.3%的基因都有其同源基因。全基因组中,有82.2%的序列注释为转座子序列,而且这个比例在不同亚基因组间大致相当,主要由长末端重复逆转录转座子组成。研究人员还对一个大麦关键驯化基因TtBtr1进行研究,在野生小麦驯化的过程中,麦穗变得不易破碎,从而表现为不易落粒。通过构建定位群体,研究人员发现了调控麦穗脆性表型的基因组区域,并最终推测驯化小麦含有的TtBtr1⁃A和TtBtr1⁃B等位基因变异可能引起蛋白质功能丧失,导致麦穗不易破碎。同时作者还检测了二粒小麦中可能受到选择的驯化区域,发现与野生二粒小麦相比,栽培二粒小麦间遗传多样性仅略微降低。

粗山羊草(Aegilops tauschii Coss.)是六倍体小麦D基因组的二倍体祖先,是小麦重要的遗传资源。美国加州大学等研究机构基于BAC序列结合全基因组重测序序列、PacBio技术以及遗传图谱并利用BioNano单分子光学图谱技术进行验证对粗山羊草基因组序列进行测序和组装,最终将约4Gb占基因组95.2%的序列组装到7条染色体上。这些染色体是由12条祖先染色体通过嵌套的染色体插入(NCI,nested chromosome insertion)引起非整倍体减少进化而来。粗山羊草的1D、2D、4D和7D染色体主要就是通过NCI这种形式形成的,5D染色体与可能起源于水稻9号染色体以及12号染色体对应的祖先染色体短臂融合,随后5DL的Os9部分与4DS的Os3部分相互易位形成。

粗山羊草基因组中转座子序列约占84.4%,其中主要是占65.9%长末端重复反转录转座子(LTR⁃RTs),Gypsy和CACTA分别是最丰富的RNA和DNA转座子超家族。而新发现的1113个TE家族中大多数的拷贝数较少。通过对基因组序列的分析,研究人员共注释了83117个基因,包括39622个高可信度的基因以及43495个低可信度的基因,其中38775个高可信度基因可锚定到染色体上,但这些基因中只有5050个是单拷贝基因。通过与短柄草、水稻、大麦、高粱以及拟南芥的基因组中注释的基因相比,粗山羊草的基因具有最长的平均外显子和转录本,而外显子平均数目却少于上述物种。同时研究人员还对小麦特异基因和抗病基因进行了分析,并研究了基因在染色体上的分布规律以及与重组率之间的关系,这些研究成果为小麦新基因的发掘和应用、小麦的品种改良、小麦的进化与多倍体研究以及比较基因组学研究都有着重要的意义。

对于粗山羊草的测序工作,中国农科院贾继增研究团队也在同时进行,他们利用最新的技术,对小麦D基因组的供体粗山羊草进行重新测序与组装,成功将92.5%基因组序列锚定到染色体上,完成了D基因组序列的测定。研究人员通过对粗山羊草基因组的序列进行分析,绘制了包括基因位点分布、基因表达、假基因分布、甲基化分布、重组率、microRNAs分布以及转座因子(TE)分布信息的基因组特征图,重点分析了TE对基因组进化、基因结构以及基因表达的影响。研究发现,粗山羊草基因组中有近1/2的基因中携带有TE,而TE通常还会抑制基因的正常表达。研究结果还表明在粗山羊草基因组中近期发生了一波基因复制事件。该研究还首次将小麦分子标记和之前检测到的重要农艺性状基因和QTL整合到小麦D基因组上,获得一个完整的高精度整合图谱。将极大促进小麦基因克隆和分子育种工作。

2018年,小麦结构基因组学取得了长足的进步和发展,相关研究成果为小麦的功能基因组学和蛋白组学的研究奠定了坚实的基础,将对小麦的分子生物学研究以及分子设计育种工作产生巨大的影响。

⑶大麦基因组研究

大麦(Hordeum vulgare L.)是世界上驯化最早的饲料和粮食作物,也是遗传学研究的模式植物之一。作物全球第四大禾谷类作物,大麦在我国国民经济发展中具有很重要的地位。大麦结构基因组学研究是大麦功能基因组学和遗传育种研究取得突破性成果的重要前提。但是大麦基因组非常庞大,结构复杂并富含转座因子,因此全基因组测序工作难度很大。李承道和张国平等人,综合运用包括BAC测序、Hi⁃C及BioNano等多种最先进的测序和组装技术,组装完成了一个目前最为完整的包含479Gb的大麦Morex高质量参考基因组序列,其中94.8%的组装序列被定位到大麦的各染色体上。通过分析鉴定了39734个高置信度基因,预测了19908个长链非编码RNA和792个microRNA前体基因位点,并利用Hi⁃C技术对大麦染色体特征及行为规律进行探索和验证。大麦基因组主要由高拷贝重复序列组成,约808%的序列为转座因子,作者同时解析了重复元件以及基因在染色体上分布的特点,重点分析大麦麦芽品质相关基因家族的特点,明确了相关基因的变异类型,通过对现代核心种质资源的SNPs进行剖析,指出了大麦基因组中易受遗传侵蚀的区域,为拓宽栽培大麦日趋狭窄的基因库提供了相应的策略。高质量的大麦基因组参考序列的发表,为大麦优质基因资源的克隆和利用提供了强有力的工具,也为高品质大麦育种指明了方向。

大麦是有稃大麦(皮大麦)和裸大麦的统称,我们习惯所说的大麦是指皮大麦,而裸大麦在各地称谓不同,在青藏高原则被称作青稞,青稞具有广泛适应性和强抗逆性等特点,是青藏高原地区主要的粮食作物。浙江大学张国平课题组利用第三代测序技术PacBio对藏区种植面积最大的青稞品种藏青320进行测序分析,从头组装出484Gb的基因组,其中459Gb可锚定到大麦7条染色体上。分析表明该基因组共有46787个具有高可信度的基因,其中31564个基因信息在39个野生和栽培大麦RNA测序数据库以及NCBI非冗余蛋白数据库中获得了验证。此外,研究人员以青稞作为参考基因组,比较皮大麦(Morex)和裸大麦(藏青320)基因组间的差异,显示二者亲缘关系较近。藏青320的参考序列的公布填补了大麦Morex基因组序列的部分缺口。相关结果对于大麦的遗传改良具有重要意义。

⑷玉米基因组研究

玉米(Zea mays L.)是世界上分布最广的农作物之一,自2009年玉米自交系B73的测序完成以来,参考基因组版本不断更新,但是由于玉米基因组结构非常复杂,存在高密度的重复序列以及高活性的转座子,这为玉米功能基因组的测序和组装提出了新的挑战和提升空间。2018年,美国研究人员使用先进的单分子实时测序和高分辨率光学制图技术对玉米近交系B73进行测序,从头组装出2106Mb大小的参考基因组。与之前的测序组装技术相比,新技术增加了重叠群长度,改进了基因间隔与着丝粒区域的组装质量,更新的基因注释。玉米基因组主要由转座元件构成,本研究共鉴定出130604个结构完整的逆转录转座子(1268Mb),有助于我们理解玉米转座子的发生进化史。通过比较最新的B73基因组图谱与另外两个自交系Ki11系和W22系基因组图谱,发现后两个品系的基因组与B73的基因组序列差异巨大,分别只有32%和39%的序列能匹配到B73基因组序列上。表明玉米不同自交系之间基因组变异很大,具有良好的可塑性,为其不断适应新的环境提供遗传基础和可能。

现代栽培玉米是大约9000多年前由生长在低海拔地区的野生大刍草驯化而来。众所周知,驯化过程对作物来说,意味着优异的基因资源丢失以及遗传多样性丧失。利用野生资源进行作物的遗传改良越来越受到育种学家的重视。而大刍草(Zea mays ssp. mexicana Iltis)可以与现代栽培玉米进行自由杂交。从而实现优异基因渗透,为现代栽培玉米育种和改良提供了一条新途径。华中农大严建兵等课题组利用玉米Mo17与大刍草类蜀黍的回交重组自交系群体,结合二代和三代测序技术,组装出了较高质量的玉米Mo17和mexicana基因组,基因组大小分别为204Gb和120Gb。预测的高可行度基因为40003个和31387个。通过比较发现同属玉米属的Mo17、B73以及mexicana三者基因组存在较大的结构变异,研究人员进一步调查了895个近交系,发现10.7%的玉米基因组与mexicana基因组存在基因渗透,暗示了大刍草可能为玉米的环境适应性提供了基因资源。本研究可深入挖掘来自野生玉米材料中的优异基因,为玉米的遗传改良提供了宝贵的基因资源。

推荐
关闭