Science首次证实全新基因的非编码来源

2014-3-05 16:44 来源: 生物通
收藏到BLOG

  在过去的几年里,科学家们已逐渐认识到基因组中本来是非编码的区域,确实有可能形成新基因。事实上,相关物种基因组的比较也甚至指出,这种从头形成基因的方式也许是一种普遍模式。

  来自加州大学戴维斯分校的研究人员近期发现了在6种果蝇株系中全部或部分表达的142个转录子,对应于果蝇参考基因组(reference genome)中基因间序列,这第一次通过新基因群体检索分析,证实了以上观点。

  都柏林圣三一大学Smurfit遗传学研究所比较遗传学家Aoife McLysaght(未参与该项研究)表示,“直到近期,科学家们还认为基因无法从头形成”,“这种群体水平分析十分重要,因为这为解析基因从头形成和构建的早期阶段提出了新观点。”

  “这项研究展示了群体遗传学水平上(基因从头形成)的过程,这确实是一个不错的故事, ” 德国马普研究所进化生物学Diethard Tautz (未参与该项研究)说,“这说明基因能从无到有。 ”

  为了完成这项研究,在果蝇中筛选新基因,来自加州大学戴维斯分校的David Begun与他的同事分析了6种黑腹果蝇种系,拟果蝇(D.simulans)以及另外一种果蝇D. yakuba的睾丸转录组。他们专门寻找至少在一种黑腹果蝇中表达,但不在黑腹果蝇参考种系中表达(数据来自modENCODE项目),也不在拟果蝇和 D. yakuba中表达的转录子。

  结果他们发现一些转录子只是近期才进化为可以表达的,时间大约在拟果蝇与黑腹果蝇开始出现分叉的过去200万到300万年间的某个时刻。

  接着研究人员将适合这种模式的转录子与黑腹果蝇参考基因组进行比较,去除那些与已知基因偏离500个碱基对以下的序列,最小化只是已有基因非翻译区域部分的可能性。这样最终他们发现了142个从头合成候选基因。

  “在黑腹果蝇群体中,有许多这样起源和散布的基因”,文章另外一位作者,Begun实验室的博士后赵莉博士表示。

  研究人员仔细分析了这些转录子,从中发现了新的证据,证明大部分从头合成候选基因都是按顺式调控,这意味着这些表达仅受新转录子上游调控元件调控。而且序列绝大多数包含有至少150个碱基对的开放阅读框(ORF),后者也就是理论上能产生蛋白质区域,有起始和终止密码子序列。

  此外研究人员还将在祖先序列,果蝇非表达序列中发现了相同的开放阅读框,这表明这种调控变化就是新基因表达的唯一原因。

  “(基因从头形成)最简单的模型是,在上游区域出现一些突变,而这些突变可能是一个结合区或其他一些调控区域,并且在某种程度上,它们以某种方式使转录机器启动,”赵莉说。

  最后,研究人员还提出了一些初步数据,指出这些潜在的从头形成基因可能都受到了自然选择的影响。理由在于:第一,群体中高频表达的基因比低频表达的基因更长,也更复杂,这提示了选择的作用;其次,研究人员发现了降低杂合度也与选择的模式是一致的。至于这些序列是否会被翻译成蛋白质,或其他方面的功能,还有待观察。

  当然,不是所有的新基因都是有利变化。事实上从理论上推测,大部分还是有害的。但是,认为新基因如此高频率产生的观点,将会给自然选择提供更多的线索。“新的调控突变激活祖先未表达的序列,它们当中很多是有害突变,但还有一些突变证明具有重要的功能,在生物中散布,”Begun说,“我们认为我们通过这个数据集初见端倪。”

  虽然仍然存在许多问题,但这项研究还为科学家们理解一种几年前还被认为是不可能的现象,提供了新证据,Tautz说,“长期以来,传统生物学认为一个基因只能通过另一个基因的复制转移而产生,而这提出了一个全新的观点,这是一个令人兴奋的研究领域。”