分析测试百科网 > 行业资讯 > 技术原理

蛋白质组技术的研究进展（二）

2020.7.14

3 蛋白质组技术的支柱－－-鉴定技术（Identification）

如果目前分离蛋白质组的最好技术是2-DE，那么随之而来的挑战是数百数千个蛋白如何被鉴定. 在这里，我们不考虑传统的蛋白鉴定方法，如免疫印迹法、内肽的化学测序、已知或未知蛋白的comigration分析，或者在一个有机体中有意义的基因的过表达. 并不是因为这些方法无效，而是因为它们通常耗时、耗力，不适合高流通量的筛选. 目前，所选用的技术包括对于蛋白鉴定的图象分析、微量测序；进一步对肽片段进行鉴定的氨基酸组分分析和与质谱相关的技术.

（1）图象分析技术（Image analysis）. “满天星”式的2-DE图谱分析不能依靠本能的直觉，每一个图象上斑点的上调、下调及出现、消失，都可能在生理和病理状态下产生，必须依靠计算机为基础的数据处理，进行定量分析. 在一系列高质量的2-DE凝胶产生（低背景染色，高度的重复性）的前提下，图象分析包括斑点检测、背景消减、斑点配比和数据库构建. 首先，采集图象通常所用的系统是电荷耦合CCD（charge coupled device）照相机；激光密度仪（laser densitometers）和Phospho或Fluoroimagers，对图象进行数字化. 并成为以象素（pixels）为基础的空间和网格. 其次，在图象灰度水平上过滤和变形，进行图象加工，以进行斑点检测. 利用Laplacian，Gaussian，DOG（difference of Gaussians） opreator使有意义的区域与背景分离，精确限定斑点的强度、面积、周长和方向. 图象分析检测的斑点须与肉眼观测的斑点一致. 在这一原则下，多数系统以控制斑点的重心或最高峰来分析，边缘检测的软件可精确描述斑点外观，并进行边缘检测和邻近分析，以增加精确度. 通过阈值分析、边缘检测、销蚀和扩大斑点检测的基本工具还可恢复共迁移的斑点边界. 以PC机为基础的软件Phoretix-2D正挑战古老的Unix为基础的2-D分析软件包. 第三，一旦2-DE图象上的斑点被检测，许多图象需要分析比较、增加、消减或均值化. 由于在2-DE中出现100%的重复性是很困难的，由此凝胶间的蛋白质的配比对于图象分析系统是一个挑战. IPG技术的出现已使斑点配比变得容易. 因此，较大程度的相似性可通过斑点配比向量算法在长度和平行度观测. 用来配比的著名软件系统包括Quest，Lips，Hermes，Gemini等，计算机方法如相似性、聚类分析、等级分类和主要因素分析已被采用，而神经网络、子波变换和实用分析在未来可被采用. 配比通常由一个人操作，其手工设定大约50个突出的斑点作为“路标”，进行交叉配比. 之后，扩展至整个胶. 例如：精确的PI和MW（分子量）的估计通过参考图上20个或更多的已知蛋白所组成的标准曲线来计算未知蛋白的PI和MW. 在凝胶图象分析系统依据已知蛋白质的pI值产生PI网络，使得凝胶上其它蛋白的PI按此分配. 所估计的精确度大大依赖于所建网格的结构及标本的类型. 已知的未被修饰的大蛋白应该作为标志，变性的修饰的蛋白的PI估计约在±0.25个单位. 同理，已知蛋白的理论分子量可以从数据库中计算，利用产生的表观分子量的网格来估计蛋白的分子量. 未被修饰的小蛋白的错误率大约30%，而翻译后蛋白的出入更大. 故需联合其他的技术完成鉴定. 

（2）微量测序（microsequencing）. 蛋白质的微量测序已成为蛋白质分析和鉴定的基石，可以提供足够的信息. 尽管氨基酸组分分析和肽质指纹谱（PMF）可鉴定由2-DE分离的蛋白，但最普通的N-末端Edman降解仍然是进行鉴定的主要技术. 目前已实现蛋白质微量测序的自动化. 首先使经凝胶分离的蛋白质直接印迹在PVDF膜或玻璃纤维膜上，染色、切割，然后直接置于测序仪中，可用于subpicomole水平的蛋白质的鉴定. 但有几点需注意：Edman降解很缓慢，序列以每40 min 1个氨基酸的速率产生；与质谱相比，Edman降解消耗大；试剂昂贵，每个氨基酸花费3～4$. 这都说明泛化的Edman降解蛋白质不适合分析成百上千的蛋白质. 然而，如果在一个凝胶上仅有几个有意义的蛋白质，或者如果其他技术无法测定而克隆其基因是必需的，则需要进行泛化的Edman降解测序.

近来，应用自动化的Edman降解可产生短的N-末端序列标签，这是将质谱的序列标签概念用于Edman降解，业已成为一种强有力的蛋白质鉴定. 当对Edman的硬件进行简单改进，以迅速产生N-末端序列标签达10～20个/d，序列检签将适于在较小的蛋白质组中进行鉴定.若联合其他的蛋白质属性，如氨基酸组分分析、肽质质量、表现蛋白质分子量、等电点，可以更加可信地鉴定蛋白质. 选择BLAST程序，可与数据库相配比. 目前，采用一种Tagldent的检索程序，还可以进行种间比较鉴定，又提高了其在蛋白质组研究中的作用.

（3）与质谱（mass spectrometry）相关的技术. 质谱已成为连接蛋白质与基因的重要技术，开启了大规模自动化的蛋白质鉴定之门. 用来分析蛋白质或多肽的质谱有两个主要的部分，1）样品入机的离子源，2）测量被介入离子的分子量的装置. 首先是基质辅助激光解吸附电离飞行时间质谱（MALDI-TOF）为一脉冲式的离子化技术. 它从固相标本中产生离子，并在飞行管中测其分子量. 其次是电喷雾质谱（ESI-MS），是一连续离子化的方法，从液相中产生离子,联合四极质谱或在飞行时间检测器中测其分子量. 近年来，质谱的装置和技术有了长足的进展. 在MALDI-TOF中，最重要的进步是离子反射器（ion reflectron）和延迟提取（delayed ion extraction），可达相当精确的分子量. 在ESI-MS中，纳米级电雾源（nano-electrospray source）的出现使得微升级的样品在30～40 min内分析成为可能. 将反相液相色谱和串联质谱（tandem MS）联用，可在数十个picomole的水平检测；若利用毛细管色谱与串联质谱联用，则可在低picomole到高femtomole水平检测；当利用毛细管电泳与串联质谱连用时，可在小于femtomole的水平检测^［25］. 甚至可在attomole水平进行. 目前多为酶解、液相色谱分离、串联质谱及计算机算法的联合应用鉴定蛋白质. 下面以肽质指纹术和肽片段的测序来说明怎样通过质谱来鉴定蛋白质.

1）肽质指纹术（peptide mass fingerprint, PMF）是由Henzel等人于1993年提出. 用酶（最常用的是胰酶）对由2-DE分离的蛋白在胶上或在膜上于精氨酸或赖氨酸的C-末端处进行断裂，断裂所产生的精确的分子量通过质谱来测量（MALDI-TOF-MS，或为ESI-MS），这一技术能够完成的肽质量可精确到0.1个分子量单位. 所有的肽质量最后与数据库中理论肽质量相配比（理论肽是由实验所用的酶来“断裂”蛋白所产生的）. 配比的结果是按照数据库中肽片段与未知蛋白共有的肽片段数目作一排行榜，“冠军”肽片段可能代表一个未知蛋白.若冠亚军之间的肽片段存在较大差异，且这个蛋白可与实验所示的肽片段覆盖良好，则说明正确鉴定的可能性较大.

2）肽片段（peptide fragment）的部分测序. 肽质指纹术对其自身而言，不能揭示所衍生的肽片段或蛋白质. 为进一步鉴定蛋白质，出现了一系列的质谱方法用来描述肽片段. 用酶或化学方法从N-或C-末端按顺序除去氨基酸，形成梯形肽片段（ladder peptide）. 首先以一种可控制的化学模式从N-末端降解，可产生大小不同的一系列的梯形肽片段，所得一定数目的肽质量由MALDI-TOF-MS测量. 另一种方法涉及羧基肽酶的应用，从C-末端除去不同数目的氨基酸形成肽片段. 化学法和酶法可产生相对较长的序列，其分子量精确至以区别赖氨酸（128.09）和谷氨酰胺（128.06）. 或者，在质谱仪内应用源后衰变（post-source decay, PSD）和碰撞诱导解离（collision-induced dissociation, CID），目的是产生包含有仅异于一个氨基酸残基质量的一系列肽峰的质谱. 因此，允许推断肽片段序列. 肽片段PSD的分析在MALDI反应器上能产生部分序列信息. 首先进行肽质指纹鉴定. 之后，一个有意义的肽片段在质谱仪被选作“母离子”，在飞行至离子反应器的过程中降解为“子离子”. 在反应器中，用逐渐降低的电压可测量至检测器的不同大小的片段. 但经常产生不完全的片段. 现在用肽片段来测序的方法始于70年代末的CID，可以一个三联四极质谱ESI-MS或MALDI-TOF-MS联合碰撞器内来完成. 在ESI-MS中，由电雾源产生的肽离子在质谱仪的第一个四极质谱中测量，有意义的肽片段被送至第二个四极质谱中，惰性气体轰击使其成为碎片，所得产物在第三个四极质谱中测量. 与MALDI-PSD相比，CID稳定、强健、普遍，肽离子片段基本沿着酰胺键的主架被轰击产生梯形序列. 连续的片段间差异决定此序列在那一点的氨基酸的质量. 由此，序列可被推测. 由CID图谱还可获得的几个序列的残基，叫做“肽序列标签”. 这样，联合肽片段母离子的分子量和肽片段距N-、C端的距离将足以鉴定一个蛋白质.

（4）氨基酸组分分析. 1977年首次作为鉴定蛋白质的一种工具，是一种独特的“脚印”技术. 利用蛋白质异质性的氨基酸组分特征，成为一种独立于序列的属性，不同于肽质量或序列标签. Latter首次表明氨基酸组分的数据能用于从2-DE凝胶上鉴定蛋白质. 通过放射标记的氨基酸来测定蛋白质的组分，或者将蛋白质印迹到PVDF膜上，在155℃进行酸性水解1 h，通过这一简单步骤的氨基酸的提取，每一样品的氨基酸在40min内自动衍生并由色谱分离，常规分析为100个蛋白质/周. 依据代表两组分间数目差异的分数，对数据库中的蛋白质进行排榜，“冠军”蛋白质具有与未知蛋白质最相近的组分，考虑冠亚军蛋白质分数之间的差异，仅处于冠军的蛋白质的可信度大. Internet上存在多个程序可用于氨基酸组分分析，如AACompIdent，ASA，FINDER，AAC-PI，PROP-SEARCH等，其中，在PROP-SEARCH中，组分、序列和氨基酸的位置被用来检索同源蛋白质. 但仍存在一些缺点，如由于不足的酸性水解或者部分降解会产生氨基酸的变异. 故应联合其他的蛋白质属性进行鉴定.

4 蛋白质组研究的百科全书数据库（database）

蛋白质组数据库（proteome database）被认为是蛋白质组知识的储存库，包含所有鉴定的蛋白质信息，如蛋白质的顺序、核苷酸顺序、2-D PAGE、3-D结构、翻译后的修饰、基因组及代谢数据库等. 例如，SWISS-2DPAGE数据库包括人类，细菌，细胞等物种的信息. 其中，E.coli SWISS-2DPAGE数据库是EXPASY分子生物学服务器的一部分，通过www的URL网址http://www.expasy.ch/ch2d/ch2d-top.html可以查询.

当前的计算机和网络技术，让我们将所有的数据库连在一起，并允许我们从一个数据库中的一条信息遨游到其他的数据库；将一个研究对象的数据与其他各种蛋白质组中的相关数据或图谱相连. 分析型软件工具被称为蛋白质组分析机器人、数据分析软件包. 在既定的状态下，定量研究蛋白质的表达水平，或者计算机辅助数据库系统建立可将实验推进一步.因此，蛋白质组分析技术联合蛋白质数据库，计算机网络和其他软件包合在一起称为蛋白质组的机控百科全书（Cyber-encyclopaedia of the proteome）.

蛋白质组和基因组共同分析可以产生大量的数据. 当评估每一个数据库的价值时，难免要考虑两个条件：1）数据库是否在任一时刻保持最新；2）何时能够相互连接，且以整体状态评估. 目前的发展趋势：1）信息量呈指数增长；2）蛋白质组计划的实施会产生新的数据库；3）致力于模拟细胞内蛋白质的相互作用的新型数据库；4）建立高级、智慧型的咨询工具是必需的.

5 蛋白质组技术的规模高流通量筛选（HTS）

HTS（High throughput screening）至今在蛋白质组研究中已成为现实. 在最近的一年内，由于制药工业对此的需求，样品输入自动化得以进展. 目前，正在设计的机器人可自动处理2-DE后电转至PVDF膜. 原形机器人加工、传输蛋白质至质谱或以液相色谱为基础的分析仪，如进行斑点切割，操纵、控制多种PMF、氨基酸组分分析所需的化学反应，使每天最小的流通量达1000个蛋白. 此外，必须选择适用的软件包，如应用第二代COMBINED来处理输出的数据，自动咨询本地或网上的数据库而进行系列的评估. 大量的数据分析表明HTS是刻不容缓的. 目前，对质谱已设想一个三级方案来处理大规模的蛋白质组：1）MALDI-TOF-MS以每天大于1000个蛋白的速率分析；2）通过ESI-MS/MS或SEQUEST，以每天每台机器分析几打蛋白质的速率进行序列标签；3）对由串联质谱所得的新蛋白或有意义蛋白进行全长肽段的测序，从而提供足够的信息通过核酸探针或简并PCR引物获得有意义的基因.

综上所述,高分辨率、高敏感性和高流通性的分离和分离后鉴定技术,结合准确、全面的数据库技术, 使蛋白质组技术用于生物研究卓有成效. 但仅鉴定蛋白质是不够的，蛋白质组世界的挑战是完善蛋白质质和量的分析,设想细胞活性、功能的全体性概念. 在此基础上,蛋白质组分析将会促进未来生命科学的整体发展

互联网

喜欢作者我要约稿