周正洪组:冷冻电镜研究蛋白组比传统方法强在哪?

2019年11月26日 09:50:47 来源: BioArt
收藏到BLOG

  自DNA重组技术和蛋白亲和纯化方法问世以来,研究人员利用蛋白异源表达纯化技术与X射线晶体衍射学方法解析了大量蛋白的高分辨结构,极大地丰富了我们对细胞中各种重要生命过程分子机制的认知【1】。然而这种方法需要大量高纯度蛋白样品,无法应用于异源系统表达量较低或或不易结晶的蛋白样品,比如大的蛋白复合物。另外,由于蛋白异源表达过程涉及蛋白序列的剪切、突变及添加标签,这种方法获得的重组蛋白结构可能无法准确反映细胞中内源蛋白的分子作用机理。

  近年来冷冻电镜技术发展迅猛【2,3】。与传统方法相比,冷冻电镜单颗粒分析技术对蛋白样品的数量和纯度要求大大降低,且可获得蛋白不同构象结构【4-8】。周正洪组进一步发现冷冻电镜单颗粒技术可用于研究从细胞匀浆直接富集的内源蛋白样品,从同一样品中获得多个内源蛋白的近原子分辨率电镜结构。这种高通量的自下而上的结构蛋白组研究方法样品制备流程简单,可捕捉到蛋白在细胞内行使功能时的结构,但也产生了非常有趣且富有挑战性的问题:这些近原子分辨率电镜结构是什么?该如何搭建原子模型?

  2019年11月25日,加州大学洛杉矶分校(UCLA)周正洪组在Nature Methods在线发表题为Bottom-up structural proteomics: cryoEM of protein complexes enriched from the cellular milieu文章,提出一种自下而上的高通量结构蛋白组研究方法。利用该方法,研究人员可直接从细胞匀浆富集多种内源性蛋白,并利用冷冻电镜单颗粒分析技术获得多个近原子分辨率(未知)电镜结构。作者开发的cryoID程序可准确、高效地从数万条候选序列中鉴别出未知电镜结构的蛋白序列,并辅助原子模型搭建工作。作为例证作者将该方法应用于引起疟疾的恶性疟原虫,获得了多个重要蛋白复合物的近原子分辨率结构。该方法为具有挑战性的蛋白复合物结构研究提供了新思路。

图片.png

  周正洪组提出从未知电镜结构中选取高分辨率区域进行序列搭建(以下称检索序列),然后利用序列搜索比对方法从候选序列库(可由蛋白样品质谱分析获得)中鉴别出目标蛋白序列。由于部分氨基酸侧链形状非常相似,仅仅根据电镜结构侧链密度图进行准确的氨基酸预测与检索序列搭建非常困难(例如天冬氨酸D和天冬酰胺N很难被区分开)。为应对这个挑战,周正洪组根据二十种氨基酸侧链形状相似性将它们简化为六个类,并使用简化类进行检索序列搭建与搜索。例如,天冬氨酸D和天冬酰胺N被归为亮氨酸类(用L表示),在检索序列搭建过程中将它们预测为亮氨酸类即可。简化类的使用引入了容错机制,大大提高了检索序列的准确率。周正洪组开发的cryoID程序可自动定位未知冷冻电镜结构中信号好的区域并搭建检索序列原子模型供用户查看,之后cryoID调用经优化的BLASTP程序对简化的检索序列和候选序列进行序列搜索比对,找到匹配的蛋白序列【9,10】。利用模拟数据和已发表电镜结构的测试结果表明,cryoID可从上万条候选序列(蛋白组或由质谱分析获得的候选序列库)中准确、高效鉴别出目标蛋白序列。

图片.png

  恶性疟原虫可引起疟疾。使用传统方法进行恶性疟原虫蛋白结构解析遭遇了极大挑战。周正洪组将他们的结构蛋白组研究方法应用于恶性疟原虫,从同一样品中获得了三种蛋白的四个近原子分辨率结构,经cryoID鉴别是M18 aspartyl aminopeptidase,glutamine synthetase和20S proteasome两个不同构象结构。

图片.png

  论文的共同第一作者是UCLA的Chi-Min Ho博士和中国科大的李晓润博士,通讯作者是UCLA的周正洪教授。有多位来自不同学科的研究人员参与此项目。

专家点评

  刘攀、王祥喜(中科院生物物理所)

  冷冻电镜技术通过近一二十年的快速发展已经成熟地用于蛋白质的结构解析。但是通过冷冻电镜密度图直接识别和鉴定蛋白质却因为潜在候选蛋白的数量众多和电镜密度图整体与局部的分辨率起伏变化而陷入瓶颈。文章提出了基于对细胞环境中富集蛋白质复合物的近原子分辨率的冷冻电镜模型的自下而上的结构蛋白质的组学方法,以及开发了仅在蛋白质的冷冻电镜密度图信息的基础上准确唯一识别蛋白质ID的CryoID程序。其中最为重要的最后一步主要通过近原子分辨率(3.0~4.0Å)的冷冻电镜密度模型结构与由选择、预测、简化和搜索四步组成的cryoID程序实现。对已存在的结构验证证实了方法的可行性与程序的准确性。

  此方法的创新性主要体现在:

  1.仅需要map的信息就可以鉴定蛋白质。传统的蛋白质鉴定方法对实验条件要求很高,实验周期较长,而通过冷冻电镜map运行程序就可以实现氨基酸序列的确定和样品的蛋白质鉴定,为解放繁杂的实验操作提供了可能性。

  2.氨基酸容错度的引入、评价体系的合理确定与科学的参数调试极大地提高了cryoID程序对于蛋白质鉴定的准确性和广泛性。将20种氨基酸按照其侧链的冷冻电镜密度相似度分成6类,并在兼顾查询序列与候选蛋白序列的匹配效率与匹配准确度条件下,通过参数调试确定最佳的查询序列数量和长度,从而大大缩短了匹配所需的时间。

  3.为难以结构表征的蛋白质的预测和蛋白质新构象态的识别提供了潜在的工具。对于像P.falciparum这样与医学高度相关的病原体难以使用传统的蛋白质重组方法进行结构表征,通过对其高分辨的冷冻电镜密度图来从候选池中确定蛋白质的种类无疑是一种有效的方案。同时,此方法还为多种天然构象状态(例如,结合伴侣的变化)和生物过程的各个阶段(例如,寄生虫的生命周期)捕获的复合物的准确鉴定打开了的大门。

  但是,由于CryoID程序的蛋白质鉴定的准确性很大程度上依赖于冷冻电镜map的分辨率,导致该方法不适用于map质量较差的蛋白质(例如柔性蛋白质的内在无序区域)的预测。然而一个好消息是,通过CryoID程序可以大大缩小候选池中蛋白质的数量。

专家点评

  孙林峰(中国科学技术大学)

  随着冷冻电镜单颗粒重构技术的发展和成熟,解析生物大分子高分辨三维结构已经变得相对容易。相比于晶体学手段,冷冻电镜技术对样品量和均一度的要求大幅降低,我们已经时常可以看到利用同一套电镜数据,观察到同一蛋白处于不同构象状态下的结构,甚至同时解析出不同蛋白的高分辨率结构。冷冻电镜技术的这一优势为研究内源性生物大分子样品的三维结构开辟了一条捷径,特别是在细胞中丰度较高的蛋白或复合物分子。但是,目前利用单颗粒技术解析的生物大分子结构的整体分辨率大多在3埃到4埃范围内。对于内源性纯化的样品,由于其组分复杂,时常存在一些之前未被鉴定的蛋白成员。在相对较低的分辨率下,很难单纯依靠密度图来确定未知组分的来源,并搭建完整的序列结构。

  在这篇文章中,周正洪教授课题组针对这一问题提出了一套自下而上的高通量结构蛋白组学的方法,将冷冻电镜单颗粒重构技术和质谱技术相关联,在解析内源性蛋白结构的基础上,利用其开发的cryoID程序,可准确、高效地从数万条候选序列中鉴别出未知电镜结构的蛋白序列,并辅助原子模型的搭建。将这一方法应用在恶性疟原虫的内源蛋白结构解析中,课题组成功获得了多个重要蛋白复合物的近原子分辨率结构,包括两个之前未知结构的蛋白复合物。该方法巧妙借鉴了经验丰富的结构生物学家搭建原子模型的最初过程,先利用清晰的密度部分,根据氨基酸的侧链特征,推测最有可能的蛋白序列,进而确定整个蛋白的序列走向。在推测蛋白序列的过程中,课题组设计了6种简化的氨基酸模型(G/L/K/P/Y/W),对应不同侧链形状和大小的氨基酸,从而提供了一定的容错空间。之后,利用推测的具有一定长度的序列,在质谱结果提供的序列数据库中进行比对搜索,找到最可能对应的蛋白分子。

  利用这套近乎全自动的前导原子模型搭建和未知蛋白组分鉴定程序,可以非常好的辅助对内源蛋白复合物的结构生物学研究,完善了冷冻电镜模型搭建的方法软件。利用计算机代替人脑的“推测”过程,并且与实验数据结合,在省去大量人力劳动的同时,极大提高了组分鉴定的准确率。值得一提的是,这一方法不仅在内源富集的蛋白复合物结构研究中具有很好的应用前景,同时也适用于一些组分复杂且具有高度动态变化的大分子复合物研究中,例如在之前对剪接体(splicesosome)的研究,就从结构中发现了之前未鉴定的复合体组分。

  参考文献

  1. Shi YG. A Glimpse of Structural Biology through X-Ray Crystallography. Cell. 2014;159(5):995-1014.

  2. Cheng Y. Single-Particle Cryo-EM at Crystallographic Resolution. Cell. 2015;161(3):450-7.

  3. Cheng Y, Glaeser RM, Nogales E. How Cryo-EM Became so Hot. Cell. 2017;171(6):1229-31.

  4. Cao E, Liao M, Cheng Y, Julius D. TRPV1 structures in distinct conformations reveal activation mechanisms. Nature. 2013;504(7478):113-8.

  5. Bai XC, Yan C, Yang G, Lu P, Ma D, Sun L, et al. An atomic structure of human gamma-secretase. Nature. 2015;525(7568):212-7.

  6. Ho CM, Beck JR, Lai M, Cui YX, Goldberg DE, Egea PF, et al. Malaria parasite translocon structure and mechanism of effector export. Nature. 2018;561(7721):70-+.

  7. Tian T, Li X, Liu Y, Wang C, Liu X, Bi G, et al. Molecular basis for CENP-N recognition of CENP-A nucleosome on the human kinetochore. Cell Res. 2018;28(3):374-8.

  8. Zhang X, Zhan X, Yan C, Zhang W, Liu D, Lei J, et al. Structures of the human spliceosomes before and after release of the ligated exon. Cell Res. 2019;29(4):274-85.

  9. Adams PD, Afonine PV, Bunkoczi G, Chen VB, Davis IW, Echols N, et al. PHENIX: a comprehensive Python-based system for macromolecular structure solution. Acta Crystallogr D. 2010;66:213-21.

  10. Altschul SF, Gish, W., Miller, W., Myers, E.W. & Lipman, D.J. . Basic local alignment search tool. J Mol Biol. 1990;215:403-10.