新剪切模式揭示两千多种新蛋白

2014-2-11 13:58 来源: 生物通
收藏到BLOG

  十多年前,人们就已经完成了对人类和小鼠基因组的测序,现在每个人都可以通过数据库使用这些信息。然而,人类和小鼠的蛋白质列表还未完成,最近研究人员还在一种新剪切模式的基础上,发现了两千多种新的哺乳动物蛋白。数据库中列有编码这些蛋白的核苷酸序列,只不过人们原先认为它们没有得到翻译。

  “我们在研究蛋白时发现了一种奇怪的剪切模式,”文章的资深作者,澳大利亚国立大学的Aude Fahrer说。“于是我们就想看看还有多少类似的蛋白。”

  他在研究参与染色体装配的Ncaph2蛋白时发现,其编码基因的一种剪切方式,使一个外显子缺少了17bp。这种剪切没有删除完整的密码子,应该会使阅读框发生位移,最终无法翻译成为蛋白。事实上数据库中的确列出了这样的选择性剪切,并将其注释为无法翻译。

  然而Fahrer的研究团队发现,另有一个起始密码子和选择性剪切阅读框,令选择性剪切的蛋白得以翻译。研究人员指出,此前只报道过三例类似的蛋白异构体形成模式。

  于是研究人员利用NCBI和ENSEMBL数据库,在小鼠和人类基因组中寻找类似的选择性剪切。他们发现有1849个人类转录本和733个小鼠转录本,以类似的方式编码选择性剪切形成的蛋白异构体。其中80%的转录本被错误地注释为不编码蛋白质。

  “发现两千多种新蛋白令我们非常兴奋,”Fahrer说。“其中的一些很可能具有重要的生物学意义。”举例来说,其中一种蛋白异构体对一个通路的影响,与原始蛋白截然相反。

  生物信息学分析只能得到预测性的结论。为了证明这些蛋白的确得以翻译,研究团队在蛋白预测信息的基础上分析了一个质谱数据库,验证了26种新异构体的存在。此外,他们还比对了新发表的翻译起始位点,验证了另外38蛋白异构体。

  Fahrer的研究团队正在联系ENSEMBL数据库管理员,希望能够更新相关转录本的注释。“我们希望能使其他研究者们从中收益,”Fahrer说。