新剪切模式揭示两千多种新蛋白（2）

2014-2-11 13:58

　　于是研究人员利用NCBI和ENSEMBL数据库，在小鼠和人类基因组中寻找类似的选择性剪切。他们发现有1849个人类转录本和733个小鼠转录本，以类似的方式编码选择性剪切形成的蛋白异构体。其中80%的转录本被错误地注释为不编码蛋白质。

　　“发现两千多种新蛋白令我们非常兴奋，”Fahrer说。“其中的一些很可能具有重要的生物学意义。”举例来说，其中一种蛋白异构体对一个通路的影响，与原始蛋白截然相反。

　　生物信息学分析只能得到预测性的结论。为了证明这些蛋白的确得以翻译，研究团队在蛋白预测信息的基础上分析了一个质谱数据库，验证了26种新异构体的存在。此外，他们还比对了新发表的翻译起始位点，验证了另外38蛋白异构体。

　　Fahrer的研究团队正在联系ENSEMBL数据库管理员，希望能够更新相关转录本的注释。“我们希望能使其他研究者们从中收益，”Fahrer说。