蛋白质组学研究的技术体系

上一篇 / 下一篇  2008-07-29 15:47:59/ 个人分类:蛋白质组

转载

蛋白质组学的发展和其技术的发展是紧密联系并相互作用的,一方面蛋白质组学的发展依靠技术进步的推动,另一方面蛋白质组学研究本身反过来又促进了技术的突破。这些支撑蛋白质组学发展的技术除了包括在蛋白质组学产生以前就出现了的双向凝胶电泳和生物质谱技术以外,也包括蛋白质组学发展过程中出现的一系列定量技术和数据分析方法。到目前为止,蛋白质组学技术已经成为一个完整的系统,主要分为四大类。第一类是凝胶和非凝胶的蛋白质组分离技术;第二类是基于生物质谱技术的蛋白质组学鉴定技术;第三类是蛋白质组学定量技术;第四类是基于生物信息学的蛋白质组学数据的分析处理技术。正是由于建立了如此丰富全面的技术系统,蛋白质组学的研究才能在短短的十几年间取得飞速发展。下面对蛋白质组学技术及其优缺点予以具体介绍。

1.
蛋白质组学分离技术

     在整个蛋白质组学的研究中,分离技术是最基础的部分。如何实现对复杂的蛋白质样品或者其酶解产物进行有效的分离,是对样品做后续鉴定的先决条件。目前蛋白质组学常用的分离技术主要有两种类型,一是凝胶技术,主要包括双向凝胶电泳(Two-dimensional electrophoresis,2-DE)技术以及后来出现的双向荧光差异凝胶电泳技术(Two-dimensional fluorescence difference gel electrophoresis,2D-DIGE);二是非凝胶技术,主要是色谱(Liquid Chromatography,LC )技术,尤其是高效液相色谱(High Performance Liquid Chromatography,HPLC)和多维液相色谱(Multi-Dimensional Liquid Chromatography,MDLC)。

1.1 双向凝胶电泳

     传统的双向凝胶电泳(Two-dimensional electrophoresis,2-DE)技术由O’Farrell和Klose等人于1975年建立。第一向为等电聚焦(Isoelectrofocusing,IEF),使蛋白质根据等电点不同进行分离,第二向为SDS-聚丙烯酰胺凝胶电泳(SDS-polyacrylamide gel electrophoresis,SDS-PAGE),即将等电聚焦后的胶条放在SDS-PAGE上再根据蛋白质分子量不同进行电泳分离。由于具有高分辨率的特点,双向凝胶电泳在蛋白质组学的研究当中始终占据着重要的地位。

     现在的双向凝胶电泳技术第一向利用固相pH梯度(Immobilized pH Gradient,IPG)等电聚焦技术,具有上样量大、分辨率高、重复性好等优点,并且可以提供蛋白质的等电点(pI)和分子量(MW)数值信息,有助于蛋白质的鉴定,而且双向凝胶电泳胶上常见的isoform多是蛋白质翻译后修饰的结果,对于这些蛋白质点的分析有助于了解对蛋白质功能影响重大的翻译后修饰。但是双向凝胶电泳技术本身也存在一些难以克服的缺陷,主要表现在两个方面。第一,双向凝胶电泳对蛋白质的分离受到蛋白质丰度、等电点、分子量和疏水性等的限制。对于低丰度蛋白质,由于上样量的限制不能达到足够质谱鉴定需要的量;对于极大蛋白质(相对分子质量>200 kDa)、极小蛋白质(相对分子质量<8 kDa)、极碱性蛋白质和疏水性蛋白质(膜结合蛋白质和跨膜蛋白质),都难以进行有效分离分析。第二,双向凝胶电泳操作费时费力,难以实现和质谱的直接联用,不易自动化。


1. 双向荧光差异凝胶电泳
 
     目前在传统双向电泳技术的基础上发展出的双向荧光差异凝胶电泳(Two-dimensional fluorescence difference gel electrophoresis, 2D-DIGE) (图1),采用专有的荧光染料与多重样本和图象分析的方法,在同一块胶上可同时分离多个由不同荧光标记的样品,并以荧光标记的样品混合物为内标,对每个蛋白质点和每个差异都可以进行统计学可信度分析,从而具有良好的重复性和较高的准确率。另外,由于荧光染料的使用,使得双向荧光差异凝胶电泳具有高灵敏度的特性,能够满足高通量差异蛋白质组学研究分析的要求。

     双向凝胶电泳作为蛋白质组学最经典的技术手段,随着本身的的不断发展,染色技术的突破,样品制备方案的改进,还将在蛋白质组学研究中继续发挥作用。

1.2 色谱和多维液相色谱

     色谱技术是目前蛋白质组学最常用的分离技术,尤其是色谱技术可以实现与质谱的自动化联用,对于蛋白质组学研究有重大意义。除了自动化后节省大量的工作外,其意义之一就是对于实验样品蛋白质量很少时的,可以直接进行shotgun分析,而不再依赖于双向凝胶电泳。

     对于蛋白质组学有重大意义的色谱分离技术是多维液相色谱技术,这种分离方法与串联质谱联用的2D-LC-MS/MS可以检测动态范围10000:1内的低丰度肽段,是目前蛋白质组学研究最主要的技术路线,已发展成自动化系统,可快速、高通量鉴定复杂蛋白质混合物。在蛋白质组学研究的多维液相色谱技术中,最常用的是离子交换色谱-反相液相色谱的联用。离子交换色谱是通过溶质在离子交换色谱固定相上具有不同的保留能力而实现样品分离的色谱技术,而反相液相色谱是基于溶质疏水性的差异而实现分离的色谱技术。通过这两种色谱模式的联用,可以实现对复杂生物样品的二维分离。

1999年,Yates研究组提出并建立了多维蛋白质鉴定技术(Multidimensional protein identification technology,MudPIT) (图2),这种技术是将不同分离模式的色谱柱以串联方式合并于同一根色谱柱中进行。Yates等在同一根色谱柱的前半部分装填强阳离子色谱填料,后部分装填反相液相色谱填料。该方法可对样品量较少的蛋白质进行快速分析,适用并且已经成功应用于蛋白质组学中大规模蛋白质的分离鉴定。在对蛋白质组进行定性分析的同时,MudPIT技术也被Washburn等成功应用于定量蛋白质组学研究。然而在强阳离子交换柱上一般使用盐梯度进行肽段复合物的分级,由于过多的盐类与质谱是不兼容的,因而常常需要offline的除盐过程或需要在上样后经过多个柱体积的洗涤以保证质谱分析。2005年,我们实验室发明了一种新型的2D-LC技术,液相分离仍然使用强阳离子交换柱和反相柱,但在强阳离子交换柱上采用9个不同的pH梯度(pH 3、 pH 3.5、pH 4、 pH 4.5、pH 5、 pH 5.5、pH6、 pH 7、pH8)代替盐梯度分级肽段混合物,再进行反相的分离。这一方法避免了在HPLC系统中引入过多盐类,从而实现了多维液相色谱与串联质谱的直接连接。应用这一强大的新型2D-LC肽段分离手段结合串联质谱技术,在一次实验中就有2000种以上的小鼠肝组织蛋白质得到鉴定。

2. 蛋白质组学鉴定技术

     在蛋白质组学研究流程中,蛋白质鉴定技术是最关键的部分。在蛋白质组分离技术方面还有凝胶电泳技术和色谱技术的选择,而蛋白质鉴定技术方面却只是生物质谱技术(Bio-Mass Spectrometry)一枝独秀。质谱技术在二十世纪初就已出现,但一直仅应用于有机小分子领域,直到八十年代才渐渐应用到生物大分子领域。经过二十多年来的应用和发展,质谱技术已是蛋白质组研究中必不可少的工具,并成为蛋白质组研究中的主要支撑技术。


2. 多维蛋白质鉴定技术

质谱技术的基本原理是使样品分子离子化后,根据不同离子间的质荷比(m/z)的差异来分离并确定相对分子质量。一台质谱仪一般有进样装置、离子化源、质量分析器、离子检测器和数据分析系统组成。在这几部分中,离子化源和质量分析器是两个核心部件,也是发展得最快的两个方面。根据离子化源的不同,质谱主要可以分为电喷雾电离质谱(Electrospray Ionization Mass Spectrometry,ESI-MS)和基质辅助激光解析电离质谱(Matrix Assisted Laser Desorption Ionization Mass Spectrometry,MALDI-MS)两大类。

2.1 电喷雾电离质谱

     所谓电喷雾电离质谱就是以电喷雾离子化(ElectroSpray Ionization,ESI)为电离方式的质谱。电喷雾离子化是一种“软电离”方式,它是在“离子蒸发”原理上发展起来的一种离子化方法。离子蒸发是指离子从液相发射到气相的过程。待测分子溶解在溶剂中,以液相方式通过毛细管到达喷口。在喷口高电压作用下形成带电荷的微滴,随着微滴中的挥发性溶剂蒸发,微滴表面的电场随半径减少而增加,到达某一临界点时,样品将以离子方式从液滴表面蒸发,进入气相。这一过程即实现了样品的离子化,没有直接的外界能量作用于分子,因此对分子结构破坏较少,是一种典型的“软电离”方式。

     电喷雾质谱的另一大特点是可形成多电荷离子,因此在较小的m/z范围内可以检测到大分子质量的分子。采用电喷雾质谱目前可测定分子质量100 kDa以下的蛋白质,最高可达150 kDa。由于离子蒸发使电喷雾质谱采用液相方式进样,因此可与蛋白质化学中常用的液相色谱联用,即液相色谱-电喷雾质谱(LC-ESI MS),蛋白质或多肽经过高效液相色谱分离后,直接进入质谱进行分子质量测定。

     在常规电喷雾质谱中,喷雾的过程易形成较大液滴,液滴中的样品分子在离子源就不能完全离子化,从而降低了样品的利用率和灵敏度。近年发展的纳升电喷雾技术 (nanospray-ESI,nano-ESI)有效的解决了这一问题,使样品被充分利用,并有效离子化。

2.2
基质辅助激光解析电离质谱

     基质辅助激光解析电离质谱(MALDI-MS)是利用固体基质分子均匀的包埋样品分子,在激光的照射下,基质分子吸收激光能量而蒸发,携带样品分子进入气相,进一步将能量传递给样品分子,从而实现样品分子离子化。由于样品的电离过程是由基质介导的,因此基质的选择对分子离子化有很大的影响, 继而影响到分析的灵敏度、分辨率和精确度。合适的基质应该是保证待测物的离子化,而且基质本身的离子造成的背景较弱。蛋白质和多肽样品较为通用的基质有芥子酸(Sinapinic Acid,SA)、a-氰基-4-羟基肉桂酸(a-cyano-4-hydroxycinnamic acid,CHCA) 和2,5-二羟基苯甲酸( 2, 5-dihydroxybenzoic acid,DHB)。MALDI 最大的特点是离子电荷通常为1-2个,而不象ESI中为多电荷离子,对分子质量较大的样品而言,不会形成复杂的多电荷图谱,因而对图谱的解析比较清楚。

2.3 串联质谱

     串联质谱在解析蛋白质或者肽段序列信息以及蛋白质磷酸化位点等方面具有无法替代的作用,这里专门予以介绍。

     串联质谱(tandem MS,MS/MS)是指多个质量分析器相连,分离母离子,进行碰撞解离,并检测子离子。MS/MS较早在四极杆质谱中实现:将三个四极杆串联,第一个四极杆进行母离子分析,选择感兴趣的离子进入第二个四极杆,与惰性气体碰撞成碎片后,进入第三个四极杆进行子离子分析(图3)。

     与串联质谱平行的一个概念是碰撞诱导解离(Collision Induced Dissociation,CID)。在串联质谱诞生以前,为获得分子结构信息,需要在离子源内(in-source)对离子进行碰撞,使其碎裂。源内CID灵敏度高,但没有选择性,因此碎片的专一性不强。串联质谱出现后,逐渐取代了源内CID。严格地说,CID仅指离子解离成碎片的过程,串联质谱则包括了母离子选择、CID和子离子分析三个过程。


3. 串联质谱(MS/MS)示意图
2.4 质谱技术新进展

     最新发展应当是2005年由热电公司推出的静电场轨道阱(Orbitrap)质谱,是20年来离子阱质谱技术的重大突破。Orbitrap是一种离子阱,但是它不同于传统的离子阱,它既没有射频电场也没有磁体产生的磁场来捕获离子。进入Orbitrap的离子是由里面的静电场来捕获的。该质谱仪的质量分辨率可以和离子回旋共振质谱相媲美,为小分子研究、药物开发、蛋白质组学、代谢物鉴定等提供了更出众的性能,而且体积较小,价格相对便宜。

3. 蛋白质组学定量技术

     蛋白质组学的研究目的是以大规模的尺度研究细胞内蛋白质的功能,这种研究要走向成熟必然要脱离对蛋白质的简单鉴定,实现对蛋白质的表达水平及其变化的检测。因此,定量技术应该说是整个蛋白质组学的精华部分。而这种定量通常不必是检测蛋白质在细胞内的绝对含量,而只需对其相对含量进行定量即可。

     目前,蛋白质组研究中应用的比较成熟和可信的定量策略和方法主要有两种。一种是基于传统双向凝胶电泳及染色基础上的定量,另外一种是基于质谱检测技术的定量。

3.1 基于双向凝胶电泳及其染色的蛋白质组学定量技术

     建立在传统的双向凝胶电泳和染色基础上的定量方法,通过比较不同胶上蛋白质点的染色强度来进行相对定量。现有的染色方法包括银染、考马斯亮蓝染色,还有最新的荧光燃料。染色在显示蛋白质的存在的同时,还提供了其表达水平的信息。

     这类定量方法面临三个方面的问题。第一,用这类方法准确定量和实现高通量的关键是找到灵敏度高、检测动态线性范围大的染料。传统的考马斯蓝染色和银染已经不能满足准确定量的需求,现在发展了不少新的荧光染料染色技术。例如SYPRO Ruby等发光金属螯合荧光染料和双向荧光差异凝胶电泳技术采用的Cy2、Cy3和Cy5荧光燃料都具有灵敏度高,检测动态范围大的优势;第二个问题是前面已经提到的,由于双向凝胶电泳本身的限制,这类定量方法不能有效检测出具有极端等电点的、分子质量太大和太小的蛋白质以及低丰度的蛋白质和膜蛋白;第三个问题是双向凝胶电泳不能对蛋白质实现绝对分离,许多单一的蛋白质点包含了一个以上的蛋白质,对这样的蛋白质点的定量也就比较牵强。

    但是基于凝胶的定量特别是DIGE技术,采用了完善的统计学分析手段,使定量结果准确性有很大保证。

3.2 基于质谱的蛋白质组学定量技术

    基于质谱的蛋白质组学定量技术的基础在于肽段丰度可以用质谱峰的信号强度来表现,它可以分为两大类:第一类为标记定量技术(Labeling quantitation),第二类则为非标记定量技术(Label-free quantitation),而前者则可更细分为体内标记(in vivo labeling)定量技术和体外标记(in vitro labeling)定量技术。定量蛋白质组学技术后面有专门的介绍,这里简单带过。

4.蛋白质组生物信息学

     蛋白质组学本身是一门大科学,其产生的数据量是十分庞大。如何将大量的蛋白质组学数据进行储存和加工,使之转变成可以理解的具有生物学意义的结果比如蛋白质名称,多肽序列,蛋白质结构,蛋白质差异等;如何使蛋白质组学的研究流程尽可能的符合高通量、自动化的要求;如何深入的挖掘蛋白质组学数据内隐藏的生物学规律,比如蛋白质的亚细胞定位、蛋白质的翻译后修饰序列和位点信息、跨膜序列分析和信号肽序列分析等已经成为蛋白质组学面临的重要问题。而这些问题的解决必须要依赖于生物信息学分析手段。生物信息学(bioinformatics)是在生命科学、计算机科学和数学分析的基础上逐步发展而形成的一门新兴交叉学科,是运用数学与计算机科学手段进行生物数据等信息的收集、加工、存储、分析与解析的科学。随着蛋白质组学的不断发展,也对生物信息学提出了更多的挑战,两者不断的相互作用形成了蛋白质组生物信息学这一活跃的研究分支。

     另外蛋白质组学与其他学科的交叉也日益显著和重要,这种交叉是新技术新方法的活水之源,尤其是蛋白质组学与其他大规模生物科学如基因组学、转录组学、代谢组学等领域的交叉所呈现出的系统生物学(Systems Biology)研究模式将成为未来生命科学最令人激动的新前沿,这一领域的研究就更需要蛋白质组生物信息学的辅助。

TAG: proteome蛋白质组

lotus 引用 删除 lotus   /   2008-12-29 14:33:07
看了思路更清晰了,谢谢
小羊羔 引用 删除 L120623   /   2008-12-25 00:19:59
看了收获很大。
被淹死的鱼 引用 删除 l0802102   /   2008-10-22 02:54:52
呵呵,多谢楼主分享。
植物星球 引用 删除 vvyouttjean   /   2008-09-19 17:55:42
谢谢楼主的分享!
 

评分:0

我来说两句

显示全部

:loveliness::handshake:victory::funk::time::kiss::call::hug::lol:'(:Q:L;P:$:P:o:@:D:(:)

Open Toolbar