Science:新的基因从何而来,为何而来?

2014-4-03 09:15 来源: 生物探索
收藏到BLOG

  近日来自加州大学戴维斯分校的研究人员发现了在6株果蝇株系中全部或部分表达的142个转录子,对应于果蝇参考基因组(reference genome)中基因间序列,这第一次利用群体遗传学的方法,尝试探索从头起源的基因在群体中扩散、尚未固定之前的表达和结构,以及这些基因受到的选择和调控情况。

  这一研究成果公布在Science杂志上,来自德国马普研究所的进化生物学Diethard Tautz点评道,“这项研究展示了群体遗传学水平上(基因从头起源)的过程,确实是一个不错的研究成果,说明基因能从无到有。 ”

  为了深入了解这项重要的研究成果,探讨新的基因产生的方式,解析这项研究背后的意义,记者联系了文章的第一作者,赵莉博士,就读者感兴趣的问题请教了她。

  新的基因的产生方式

  随着基因组学的发展,研究人员发现不同生物在基因组大小和基因数目上存在巨大的差异。人类有二万多基因,而有的细菌只有几百个基因。这种差异不仅仅在远缘物种中体现,即使在进化关系很近、分歧年代很近的近缘物种中,基因的种类和数目也不尽相同,这说明生物在进化过程中伴随着基因组大小和基因数目的变化。

  赵莉博士介绍说,近年来,研究人员研究并总结新的基因产生的方式有基因重复(gene duplication),逆转座(retroposition),外显子重排(exon shuffling),基因分裂与融合(gene fission and fusion)以及基因水平转移(gene lateral transfer)等。

  “上述这些机制都是基于已有基因而产生的,直到2006年,加州大学戴维斯分校David Begun研究组(也就是我现在所在的实验室)在果蝇中发现基因可以从头起源(de novo origination),也就是基因片段在外群中是非编码序列,而在新的物种中随着突变和进化选择产生了可以翻译成蛋白的新基因。”

  随后,研究人员在酵母,小鼠,水稻和人类等物种中也发现了从头起源的基因的存在。这支持了基因可以从头起源(从外群的非编码序列到内群的编码蛋白的基因)。上述的这些工作都来自于物种间的比较,因此尽管近缘物种间的分歧时代很短(比如黑腹果蝇和拟果蝇的分歧年代约2-3百万年,人和大猩猩分歧年代约4.76百万年),但是这样比较的的基因已经产生并且固定在种群中,我们对基因产生的过程,尤其是最初的阶段还一无所知。“我们的这个工作通过对黑腹果蝇群体进行研究,对基因产生的过程进行了探索。”

  首次通过群体遗传学解析从头起源基因演化过程

  为了完成这一探索,赵莉博士与她的同事对模式生物黑腹果蝇进行研究。他们对果蝇6个果蝇品系mRNA测序拼装,同时对外群物种进行测序拼装,然后通过一系列的参数比较鉴定了可能的在群体中扩散的从头起源基因。

  赵莉博士说,“我们发现了142个在群体中扩散但是没有固定的可能的从头起源基因。这些基因的表达量中等,约一半的基因属于低频率,但是~30%左右的基因至少的频率至少50%。我们发现基因的表达和在群体中的频率正相关。大部分基因拥有简单的读码框,~40%左右的基因具有多个外显子(exon),还有一部分基因拥有可变剪切的方式,暗示了这些基因可能被复杂的机制调控转录。

  为了了解可能的转录机制,我们对亲本杂交,对子代也进行了测序。通过对子代的基因表达,以及表达的子代的SNP向亲本追溯分析,我们发现基因的表达绝大多数通过顺式调节(cis regulation),也就是可能是基因上游的突变导致可能产生了转录结合序列等原因而激活了转录。”

  通过对这些从头起源的基因的上游序列分析,研究人员还发现了几个可能是转录结合因子的序列。同时,他们对表达de novo基因和不表达的品系进行了序列比对,发现表达从头起源基因的品系在基因的位置有38%左右的杂合度减小。对基因组的序列的模拟也显示从头起源基因和随机的基因组非编码序列受到的选择程度显著不同,这都暗示了从头起源基因可能在这个阶段受到了自然选择

  这项工作是第一次利用群体遗传学的方法,尝试探索从头起源的基因在群体中扩散、尚未固定之前的表达和结构,以及这些基因受到的选择和调控情况。“我们的工作给出了上述问题在黑腹果蝇生殖系统表达和选择的框架,而对于这些基因是否已经产生生物学功能,如果有,它们的功能如何等问题还尚不清楚。我们也同时在果蝇的其他性别和组织中进行类似工作的探索,希望能通过不同的性别、组织表达的从头起源的比较,对从头起源的基因的起源和演化机制有更深的了解。”

  从头起源基因与自然选择

  除了新的基因从何而来外,还有一个有趣而重要的问题,那就是新的基因为何而来?

  这项研究提出了一些初步数据,指出了这些潜在的从头起源的基因可能都受到了自然选择的影响。理由在于:第一,群体中高频表达的基因比低频表达的基因更长,也更复杂,这提示了选择的作用;其次,研究人员发现了降低杂合度也与选择的模式是一致的。至于这些序列是否会被翻译成蛋白质,或其他方面的功能,还有待观察。

  当然,不是所有的新基因都是有利变化。事实上从理论上推测,大部分还是有害的。但是,认为新基因如此高频率产生的观点,将会给自然选择提供更多的线索。

  对此,赵莉博士解释道,“自然界中很多基因进行出生和死亡的循环过程,这些都和自然选择有关。我们鉴定的这些基因都是雄性中表达的,这些基因很可能经历了性选择(sexual selection),它们可能和雄性生殖(male reproduction)有关。目前我们发现了自然选择的证据,但是这些基因的功能还需要后续的深入研究。”