Cell：研究复杂蛋白质组的新方法

上一篇 / 下一篇 2010-10-15 16:20:25/ 个人分类：proteomics

(转自生物通）来自英国爱丁堡大学Wellcome Trust细胞生物学中心、牛津大学和日本国立遗传学研究员的研究人员开发出一种方法，简化了有丝分裂染色体组分的鉴定和功能分类。这种定性兼定量的实验方案可应用于复杂的蛋白数据组，以鉴定出功能关系，并指导未来的蛋白质组学研究。文章发表在9月3日的《Cell》杂志上。

尽管研究了很多年，但有丝分裂染色体结构及组成仍然未能清楚地鉴定。苏格兰的William C. Earnshaw和Juri Rappsilber以及日本的Tatsuo Fukagawa联合了他们三个实验室的优势和资源，创建出多分类组合蛋白质组学（multiclassifier combinatorial proteomics，MCCP）方法，这是一种分析蛋白质组功能关系的统计方法。利用Earnshaw实验室在染色体研究上的丰富经验，研究小组采用Rappsilber 实验室使用的SILAC及质谱成像技术，通过与野生型和突变染色体的比较，收集了6个不同分类的数据，获得了大约4000个有丝分裂染色体相关蛋白的清单。

通过一种机器学习方法-Random Forest（RF）整合这些分类，他们在完整染色体的背景下揭开了蛋白复合物之间的功能关系，并找到约560个未鉴定的蛋白，值得进一步研究。Random Forest分析将染色体蛋白与非染色体蛋白和目标蛋白分开。Earnshaw表示：“它能让你在有缺失值的情况下继续工作，这一点很关键。如果蛋白被一个或另一个分类漏掉—这种情况是可能的—计算不会中断。”RF分析所产生的数据预测出新的目标蛋白，并充当未来染色体蛋白质组研究的路标。

实际上，在34个GFP标记的预测染色体蛋白中，30个是染色体的，包括13个与着丝粒相关。而在16个GFP标记的预测非染色体蛋白中，14个被证实是非染色体的。

这种方法的优势在于，它能够确定一个不能纯化的复杂细胞器中的蛋白组成，并结合遗传学和蛋白质组学来研究全部染色体中的复合物。机器学习的使用揭开了蛋白之间的功能关系。

尽管他们只研究了染色体蛋白，但Earnshaw强调这个MCCP方法很灵活，可用于研究任何的蛋白质。“你任何时候都能用，如果你有一个复杂的数据组，其中一些是真的，另一些可能是污染或不是真的，我们的方法能帮你分类。”

导入论坛收藏分享给好友推荐到圈子管理举报

TAG:

查看全部评论