关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

蛋白质组学的标准化(上)

2009.12.29

27501_200912291443471.jpg

Tim Wehr

  由于人类基因序列的建立已经接近完成,人们认识到生物科学届的下一项任务将是表征基因组的产物——其中绝大部分是蛋白质。作为正在兴起的研究领域,蛋白质组学将其研究目标定位于:鉴定和测量在一个细胞或组织中的所有蛋白质,这样做的预期是,将能发现那些能够成为疾病生物标志物(biomarker)或药物靶标的候选蛋白质。经证明,这是一项令人望而生畏的工作,难度之一在于,25,000个基因中的每一个都会产生拼接、翻译后修饰,最后表达的蛋白质数量将会大大增加。另一个增加难度的因素是蛋白质的浓度范围太广——通常为许多个数量级——并且很可能大多数人们感兴趣的都是那些低丰度的蛋白。

  目前,已有大量的技术和实验方法用于解决蛋白质组学的问题。其中应用最广泛的是“自下而上”的方法。用蛋白质水解酶(典型的为胰蛋白酶)将细胞提取液或溶胞产物中的所有蛋白质酶解,接着用反相液相色谱(LC)分离,然后在线引入电喷雾源的质谱。一种参考的液相色谱-串联质谱(LC-MS-MS)流程通常为:多肽离子在母离子扫描中被分离,其中几个最强的离子将被自动碎裂,将母离子质量和子离子/碎片质量都输入搜索引擎,和数据库中的蛋白按照多肽和碎片质量去匹配,匹配的结果将生成记录、即完成了蛋白质的鉴定。获得一个、几个或所有蛋白质的定量信息,可以有几种做法:比如通过谱图计数和峰强度测量的非标记方法(Label free);通过引入稳定同位素标记标签;或用重同位素标记蛋白中的一个或几个肽(“蛋白典型多肽”) [1]对于复杂样品,如人体液或胞溶产物,潜在需要分析的蛋白质数量将非常庞大。在一个特定状态下一个细胞典型地会表达几千种蛋白质,每个蛋白质将产生多达几十个多肽,而每一个多肽在质谱中又以多种带电状态存在。因此,单个蛋白质组学样本就包含500, 000多种类别或者更多。为了减少分析问题的复杂性,通常在进行LC-MS分析前利用一维或二维凝胶电泳[2]、溶液中的等电聚焦[3]或多维高效液相色谱(HPLC)[4]技术,将样本预分离成多馏分(prefractionation)。

表1 蛋白质组学实验中不确定性来源

操作技能<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

样品制备(预分离、酶解、色谱)

蛋白丰度

多肽离子化效率

质谱类型和制造商

质谱的质量精度和分辨率

搜索引擎的算法

蛋白质鉴定试探方法的严密性

数据库的不透明性和综合性

  当面对复杂样本时,自下而上的方法有几种局限性。首先,由于蛋白质浓度具有非常宽的动态范围,故质谱不能检测到所有的多肽离子,因此自下而上的方法本身倾向于检测丰度较高的蛋白质。第二,复杂体系中酶解肽的数量巨大,而分析中的质谱的谱图采集速率(duty cycle)有限,减少了低丰度多肽的采集重现性。第三,多肽异构体(如翻译后的修饰)信息会丢失。最后,自下而上实验中大量的不确定因素会降低实验室内部和实验室之间分析的重现性。表1归纳了各种不确定因素。

表2 标准化蛋白质组学组织机构

英文全称

中文全称

英文缩写

 

Association of Biomelecular

Resource Facilities

生物分子资源实验室协会

ABRF

www.abrf.org

The Biological Reference

Material Initiative

生物参考物质组织

BRMI

www.who.int/bloodpruducts/

ref_materials/en

Clinical Proteomic Technology

Assessment for Cancer

癌症临床蛋白质组学

技术评价组织

CPTAC

www.fixingproteomics.org

Fixing Proteomics Campaign

蛋白质组学固定运动

 

www.fixingproteomics.org

Human Proteome Organization

人类蛋白质组研究组织

HUPO

www.hupo.org

  由于大量的不确定因素和大多数实验室中缺乏专家,早期蛋白质组学研究中数据的质量较差,并且由于较差的数据重现性致使该领域的名誉不太好。在过去的几年中,一些组织在蛋白质组学标准化协议和提供参考样本方面做出了努力。表2列出了其中5个组织机构及其网址。“发现中的方向”这一部分将对每个发起的组织和计划进行回顾。

  ABRF蛋白质组学研究组

  生物分子资源实验室协会(ABRF)是一个由约1000个成员组成的成员组织,这1000个成员分别代表政府部门、学术领域、研究领域和工业领域的250多个核心实验室。ABRF组织支持13个活跃研究组,成立这些研究组是为了对用于核心实验室的技术进行评估。蛋白质组学技术的三个核心小研究组为:蛋白质组学研究组(PRG)、蛋白质组学标准化研究组(sPRG)和蛋白质组学信息学研究组(iPRG)。

表3 2006-2009年PRG合作样本分析项目

时间/

2009

临床混合物中相对蛋白质含量

人体血浆,在两个人和两个兔子中添加回收不同浓度水平的蛋白。

测定4个样本中提取的蛋白的相对浓度水平。

2008

蛋白质组学定性

两个用不同制备手段制备的相关人类蛋白。

鉴定每个样本中的主要蛋白,报告两者在蛋白组成方面的任何差别,列出蛋白序列覆盖率。

2007

高级定量蛋白质组学

在复杂背景混合物下,添加回收三种浓度水平的、包含10~15个蛋白的混合物的样本。

鉴定提取的蛋白,测定3个样本中每个蛋白的相对比例。

2006

相对蛋白质定量

两个混合物,每个包含8种不同浓度水平的蛋白。

鉴定混合物中各组分,测定这两个样本中每种蛋白的相对含量。

2005

多肽从头测序

6个以上合成多肽的混合物,其序列在公开的数据库中找不到。

测定所有多肽的序列。

  蛋白质组学研究组:PRG的目标是促进对蛋白质现代分析方法的认识和培训。该小组的主要活动为组织每年一届的研究学习,对现行的技术和能力进行考核。每年PRG提出一个特定的蛋白质组学分析问题,发放一个样本分析项目,该项目面向全球ABRF成员,并向成员外的研究者开放,项目发放遵循“先到先得”的原则。样本通常在秋末进行分配,实验结果以匿名方式及时提交给PRG,PRG再对数据进行整理并在次年2月至3月举行的ABRF年会上以报告的形式提交数据。样本由PRG成员组织制备,并由经验丰富的成员实验室进行分析,以确保样本质量。样本列表和过去四年中PRG进行的相关分析任务列于表3。

表4 sPRG合作样本分析项目

时间/

专家评价

2009

相对或绝对定量

·       蛋白质定量方法学

·       生物信息学

36种蛋白质的混合物,用胰蛋白酶酶解并与稳定同位素标记的合成多肽混合,多肽与蛋白质一一对应。

2007

磷酸化位点的测定

·       蛋白质鉴定方法

·       磷酸化蛋白和磷酸化肽富集方法

·       磷酸化位点鉴定方法

浓度为5pmol10种蛋白质的混合物,每种蛋白质含

有一个或更多磷酸化位点。

2006

蛋白质鉴定

·       分离技术

·       蛋白质鉴定方法学

·       生物信息学工具

代表单一样本的高达50种蛋白质的混合物样本

  蛋白质组学标准化研究小组:蛋白质组学标准化研究小组的任务是促进、支持开发和使用蛋白质组学的标准,允许ABRF成员和成员实验室评估他们生成可预测的、和一致性的结果的能力。技术标准包括参考物质、数据组、实验条件和步骤。与PRG类似,sPRG每年将样本分配给ABRF实验室以及合作研究的成员外研究者。表4 列出了最近三年的合作研究题目、样本和分析任务。

未完待续......

  更多阅读:蛋白质组学的标准化(下)

推荐
关闭