Cell:研究复杂蛋白质组的新方法

上一篇 / 下一篇  2010-10-15 16:20:25/ 个人分类:proteomics

(转自生物通)来自英国爱丁堡大学Wellcome Trust细胞生物学中心、牛津大学和日本国立遗传学研究员的研究人员开发出一种方法,简化了有丝分裂染色体组分的鉴定和功能分类。这种定性兼定量的实验方案可应用于复杂的蛋白数据组,以鉴定出功能关系,并指导未来的蛋白质组学研究。文章发表在9月3日的《Cell》杂志上。

尽管研究了很多年,但有丝分裂染色体结构及组成仍然未能清楚地鉴定。苏格兰的William C. Earnshaw和Juri Rappsilber以及日本的Tatsuo Fukagawa联合了他们三个实验室的优势和资源,创建出多分类组合蛋白质组学(multiclassifier combinatorial proteomics,MCCP)方法,这是一种分析蛋白质组功能关系的统计方法。利用Earnshaw实验室在染色体研究上的丰富经验,研究小组采用Rappsilber 实验室使用的SILAC及质谱成像技术,通过与野生型和突变染色体的比较,收集了6个不同分类的数据,获得了大约4000个有丝分裂染色体相关蛋白的清单。

通过一种机器学习方法-Random Forest(RF)整合这些分类,他们在完整染色体的背景下揭开了蛋白复合物之间的功能关系,并找到约560个未鉴定的蛋白,值得进一步研究。Random Forest分析将染色体蛋白与非染色体蛋白和目标蛋白分开。Earnshaw表示:“它能让你在有缺失值的情况下继续工作,这一点很关键。如果蛋白被一个或另一个分类漏掉—这种情况是可能的—计算不会中断。”RF分析所产生的数据预测出新的目标蛋白,并充当未来染色体蛋白质组研究的路标。

实际上,在34个GFP标记的预测染色体蛋白中,30个是染色体的,包括13个与着丝粒相关。而在16个GFP标记的预测非染色体蛋白中,14个被证实是非染色体的。

这种方法的优势在于,它能够确定一个不能纯化的复杂细胞器中的蛋白组成,并结合遗传学和蛋白质组学来研究全部染色体中的复合物。机器学习的使用揭开了蛋白之间的功能关系。

尽管他们只研究了染色体蛋白,但Earnshaw强调这个MCCP方法很灵活,可用于研究任何的蛋白质。“你任何时候都能用,如果你有一个复杂的数据组,其中一些是真的,另一些可能是污染或不是真的,我们的方法能帮你分类。”


TAG:

 

评分:0

我来说两句

显示全部

:loveliness::handshake:victory::funk::time::kiss::call::hug::lol:'(:Q:L;P:$:P:o:@:D:(:)

Open Toolbar