于是研究人员利用NCBI和ENSEMBL数据库,在小鼠和人类基因组中寻找类似的选择性剪切。他们发现有1849个人类转录本和733个小鼠转录本,以类似的方式编码选择性剪切形成的蛋白异构体。其中80%的转录本被错误地注释为不编码蛋白质。

  “发现两千多种新蛋白令我们非常兴奋,”Fahrer说。“其中的一些很可能具有重要的生物学意义。”举例来说,其中一种蛋白异构体对一个通路的影响,与原始蛋白截然相反。

  生物信息学分析只能得到预测性的结论。为了证明这些蛋白的确得以翻译,研究团队在蛋白预测信息的基础上分析了一个质谱数据库,验证了26种新异构体的存在。此外,他们还比对了新发表的翻译起始位点,验证了另外38蛋白异构体。

  Fahrer的研究团队正在联系ENSEMBL数据库管理员,希望能够更新相关转录本的注释。“我们希望能使其他研究者们从中收益,”Fahrer说。