关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

朱正江:软件平台自主创新 破冰代谢组学研究难点

2022.9.02

  近期,中国科学院上海有机化学研究所生物与化学交叉研究中心朱正江研究员、刘南研究员课题组合作的最新学术成果发表在《自然·通讯》期刊(Nature Communications),应用基于稳定同位素标记的非靶向代谢流组学技术MetTracer,在系统层面上揭示了果蝇衰老过程中发生的代谢稳态变化,其中MetTracer技术已申请国家发明专利。近日,分析测试百科采访到朱正江研究员,他分享了代谢组学面临的挑战和应对之道,详解了质谱技术在代谢组学研究和临床应用中的特点,展望了未来代谢组学和质谱技术的发展趋势。

中国科学院上海有机化学研究所生物与化学交叉研究中心 朱正江研究员

基于质谱技术开发代谢组学技术

  中科院生物与化学交叉研究中心(以下简称“交叉中心”)是依托中国科学院上海有机化学研究所于2012年成立的一个跨学科综合研究中心,以人类健康前沿研究领域中的神经系统疾病,如阿尔茨海默氏病、帕金森氏病、肌萎缩性脊髓侧索硬化症等与衰老相关的神经退行性疾病以及神经损伤和修复为核心,发展和运用最前沿的生物与化学技术手段,对人类神经系统病变特别是神经退行性疾病中共性和关键性的科学问题开展研究。

  朱正江研究员是交叉中心质谱与代谢组学实验室的课题组长,主要工作围绕以质谱技术为核心的代谢组学研究。“代谢物的测量可以用核磁、质谱等技术,而我们实验室主要是用质谱技术来发展代谢组学技术。”朱正江说。代谢组学主要分析小分子代谢物,比如体内常见的氨基酸、脂类等。课题组约60%的工作聚焦于代谢组学技术开发研究,此外还有2个应用方向,一个是代谢生物学方向,主要聚焦衰老过程中的代谢物变化和代谢调控机制研究,以及衰老相关疾病(如阿尔兹海默症,帕金森症等)病程中的代谢变化;另一个是代谢组学的临床应用方向,通过和临床医生合作,对肿瘤、心血管疾病、阿尔兹海默症等疾病的临床样本等进行临床代谢组学研究。

  朱正江介绍说:“我们最重要的力量是围绕代谢组学的技术开发,聚焦于通过质谱技术进行高效率、高覆盖的代谢物鉴定。”谈到代谢组与其它组学的不同时朱正江表示:蛋白质组学也用质谱进行分析研究,主要面临定量准确性、数据重现性等问题,但基本不会遇到鉴定不准的问题;而代谢组学研究中的最大挑战是:如何将质谱信号转化为代谢物的化学结构,即代谢物化学结构鉴定问题。

  通常来说,小分子的化学结构鉴定一般使用核磁技术。但在实际研究工作中,核磁无法应对微量样本(10-100μL)和复杂生物样本中的大量代谢物进行同时高覆盖、高准确的结构鉴定。而质谱具有高灵敏度,适用于复杂样本、微量样本的分析,并可在短时间内采集成千上万个质谱信号。但如何将成质谱信号转化成代谢物的化学结构,就成为基于质谱的代谢组学技术的难点。

  朱正江课题组的研究聚焦于如何从质谱信号中解析代谢物的结构。其中有两个策略,一个是用计算的方法,通过自行搭建数据库并从数据库中总结规律,开发了基于代谢反应网络的代谢物结构鉴定算法MetDNA。MetDNA是代谢组学研究的重大突破之一,最重要特色是利用已知、少量的代谢物的信息去鉴定大量、未知的代谢物。另一个策略是用离子淌度质谱方法,通过引入淌度分离过程中的碰撞截面积(CCS)值来辅助代谢物的鉴定,课题组已开发了很多离子淌度质谱的基础性的数据库(如AllCCS)、数据处理软件(如Met4DX、 Lipid4DAnalyzer)等。

代谢组学的两大研究挑战

  提及代谢组学的研究挑战,朱正江表示主要有两大方面:高准确性、高覆盖度的代谢物化学结构鉴定和功能性代谢物的发现。

  代谢物化学结构鉴定包括已知代谢物和全新未知代谢物化学结构鉴定。无论是面对常规样本、微量样本、或单细胞样本分析,都存在代谢物化学结构的高准确、高覆盖鉴定的挑战。当前单细胞测序已很成熟,单细胞蛋白质组学也发展得风生水起,它们均没有遇到基因识别、蛋白质鉴定问题。但单细胞水平的代谢物,因为含量极低、信号不够丰富,通常都不能进行MS/MS谱图数据采集,因此不一定能够准确鉴定其中代谢物的化学结构。此外,全新未知代谢物的鉴定也是另外一个重大挑战。现在已知的代谢物有20万种,近一两年不断发现有新的功能性代谢物。因此,代谢物化学结构鉴定既包括已知代谢物,也包含未知代谢物的结构鉴定。从常规分析到高精尖的单细胞分析都面临同样的问题,如何更高覆盖地、更准确地鉴定小分子代谢物的化学结构是代谢组学的难点。

  随着未来技术发展越来越成熟,如何发现功能性的代谢物是新的挑战。当前代谢组的很多研究者背景偏分析化学,目标是测定生物样本中,如果血浆、细胞和组织样本,尽可能多的代谢物。而真正的生命科学和疾病研究,并不关注样本中所有的代谢物,他们更希望获知哪个代谢物发挥了关键作用。如同发现重要的基因或蛋白靶点一样,研究者希望发现重要的、有关键调控作用的代谢物,可称之为功能代谢组学/功能性代谢物的发现。在疾病发生和发展过程中起到促进、抑制作用,或者成为疾病诊断标志物,或预示疾病发生发展或者预后的代谢物都统称为功能性代谢物。朱正江强调:“生命科学研究者们需要知道在生命过程中哪些代谢物起到了决定性作用,不是仅仅发现代谢物,而是要发现哪个代谢物更重要,这需要达到更高的层次,既是难点也是未来发展的方向。”

MetDNA+MetTracer破冰研究痛点

  今年6月,朱正江研究员和刘南研究员课题组在《自然· 通讯》 (Nature Communications)杂志在线发表了题为“Global Stable-isotope Tracing Metabolomics Reveals System-wide Metabolic Alternations in Aging Drosophila”的研究论文 (Nature Communications, 2022, 13: 3518) ,结合了前期发展的大规模代谢物结构鉴定技术MetDNA和稳定同位素标记代谢物检测技术,发展了基于稳定同位素标记的非靶向代谢流组学技术MetTracer,从而在以果蝇为例的动物模型中揭示了果蝇衰老过程中发生的代谢稳态变化。

  朱正江表示:“这项研究成果有2个重要贡献。首先是发展了非靶向代谢流组学技术MetTracer(已申请专利);其次是在衰老过程中,发现了一个衰老代谢的调控通路。”

  MetDNA:缺乏标准品MS/MS时进行数千种代谢物鉴定

  早在2019年,朱正江课题组就在《自然· 通讯》(Nature Communications)杂志发表了一种基于代谢反应网络的代谢物结构鉴定算法MetDNA,创新性地克服了代谢物结构鉴定对于代谢物标准MS/MS谱图库的依赖,能够在多种生物样本中鉴定出超过2000种代谢物的结构,相比传统方法提高了近10倍,极大地提高了代谢物结构鉴定的效率和准确度。

MetDNA的工作原理和基本流程

  朱正江强调:“这是我们在技术上的一个重要进展,MetDNA技术可利用已知、少量的代谢物去鉴定大量、未知的代谢物。”

  MetDNA的基本原理是:在细胞环境中,一种代谢物可以被催化成另一种代谢物产物。因此将底物代谢物与其相似化学结构的产物代谢物定义为一对反应对(RP)。在串联质谱中,代谢物的碎裂模式由其化学结构决定,由于结构的相似性,反应配对的两种代谢物倾向于具有相似的MS2谱。因此,原则上MetDNA可以使用反应对中的一个代谢物来注释另一个未知代谢物,而不一定通过标准品谱图数据库中现有的MS2谱图来注释。MetDNA先通过一个小的二级质谱数据库对代谢物进行鉴定,将鉴定到的代谢物作为种子,然后利用这些种子代谢物的MS2谱去注释与它成对反应的相邻代谢物,循序递进,进行递归的注释分析,重复应用该策略可逐步扩展注释代谢物。数据显示,在一个实验中,MetDNA显著增加了代谢物的注释数量,从传统分析的不到100种代谢物增加到超过2000种代谢物。MetDNA还包括一个自我检查的打分系统,可以减少冗余和不确定性。

  因此,MetDNA能大规模地提高小分子代谢物结构鉴定的数量和覆盖度,即使是基于不同的质谱平台、不同的数据采集模式(DDA/DIA)采集的各种生物样本的质谱数据,都能在一次实验中累积注释到大约2000个代谢物结果。最近朱正江课题组对MetDNA技术进行了升级,最新的MetDNA2 开发了多层代谢网络技术用于提升对于未知代谢物鉴定的能力,同时也通过全局质谱峰关联网络提升代谢物鉴定的准确度。MetDNA数据分析平台(http://metdna.zhulab.cn/)为代谢组学研究者提供了免费的数据分析服务,已为世界上40多个国家和地区的1600余位用户完成了超过1.3万个代谢组学项目的数据处理,具有广泛的国际影响力和认可度。

  MetTracer:对整个代谢组进行全面的代谢流动态分析

  目前基于质谱的非靶向代谢组学(Global metabolomics)研究大多是“静态分析”,即在某个时间点采样分析,难以测定生物体内代谢物合成和降解等动态变化规律。代谢流分析技术通常采用稳定同位素示踪(Stable-isotope tracing)实验来追踪稳定同位素在代谢物中的流向,通过测定代谢网络中代谢物的同位素分布,来计算代谢物合成和降解等动态变化规律。但是,当前代谢流分析大多只靶向分析特定的代谢通路,如糖酵解、三羧酸循环、氨基酸代谢、脂肪酸代谢等,难以全面地对整个代谢组的动态变化进行大范围检测和解析,且限制了发现新的代谢通路和代谢反应。

  那么,如何对生命体的整个代谢组进行全面的代谢流动态分析呢?

  首先,采用稳定同位素标记时,一般用13C或15N这样的稳定同位素标记活的细胞进行代谢,将代谢物中的12C取代成13C形成同素异形体,并通过质谱进行分析。

  朱正江解释道:“该技术难点是,本来进行一个代谢物鉴定就很困难,而每个代谢物经过同位素标记后会得到数个标记之后的同素异形体(isotopologue),一条通路可能会出现二十多个代谢物。一旦放大工作量,需要对上千个标记同素异形体(isotopologue)进行追踪,而且样品量达到上百个时,人工鉴定和数据分析难以完成,人工判断的失误率也会极大地增大。”

  针对上述技术难点,需要开发出能够正确并高覆盖地识别同素异形体的技术。因此,课题组基于MetDNA策略,先鉴定出未标记生物样本中的所有代谢物,将其作为模板推导出可能产生的同素异形体。朱正江比喻道:“将目标代谢物的色谱质谱峰形作为模板,靶向提取代谢物,就类似于用画像在茫茫人海中去找一个人。在根据模板寻找代谢物时用多种实验室前期开发的算法进行打分、包括m/z准确度,保留时间准确度,EIC峰型相似度等,就类似于人脸识别的打分。”这种策略能够在一次实验中自动去提取出成千上万个代谢物的同素异形体。

  该突破性的技术具有以下特点:1,追踪覆盖范围高,能够对上千个代谢物的上万个同素异形体同时进行稳定同位素标记的追踪;2,对稳定同位素标记代谢物的定量准确性高且可重复性好;3,大规模数据分析的假阳性低。

基于稳定同位素标记的代谢流组学技术MetTracer(图片来源:Nature Communications)

  发现衰老相关重要代谢通路

  果蝇是衰老研究中常用的模式动物。在开发MetTracer技术后,课题组通过13C标记方法喂养果蝇,然后解剖果蝇的脑组织和肌肉组织进行非靶向代谢流组学的分析,在脑组织和肌肉组织中分别追踪到390个和597个标记的代谢物。通过多个时间点标记程度的聚类分析表征了代谢物可以根据标记速率分为高、中、低标记速率三类,分别富集于糖相关代谢、氨基酸相关代谢和嘌呤代谢脂肪酸合成等代谢通路。最后,通过对年轻果蝇和衰老果蝇进行了代谢稳态变化的系统性分析,找到了一条重要的代谢通路。课题组在研究中发现,果蝇衰老过程中存在糖酵解代谢减弱、丝氨酸代谢增强的代谢转变。

果蝇衰老过程中的代谢稳态变化(图片来源:Nature Communications)

  朱正江介绍说:“我们文章发表的同时,另一篇发表在Cell Metabolism的文章,在研究老年痴呆症的人群队列样本中,也发现了丝氨酸代谢的上调是老年痴呆症的一个标志,同时跟病人的认知能力成负相关。这是两个完全独立的实验但殊途同归,以人和果蝇作为不同实验对象。我们在果蝇活体上发现的随衰老增强的丝氨酸代谢,同人群队列样本中发现的衰老所引起的老年痴呆症代谢通路是相互吻合的。这也充分证明我们这项技术能够发现新的跟衰老相关的代谢调控的通路。”

  突破边界:发现新未知代谢物和新代谢通路

  MetTracer 的技术特点是利用MetDNA鉴定出来的代谢物作为模板,通过靶向提取的策略实现高灵敏度、高覆盖性、高准确性、低假阳性地代谢物识别。最大的优势是通过同位素标记将实验数据分析变成傻瓜式操作,无需人工提取和辨别。而且把以前局限于少数几条通路的实验扩大到整个代谢组。

  除了能够识别已知代谢物是否被标记,通过质谱信号MetTracer还能发现新的代谢物。课题组还在常见的生物样本里发现了若干个全新的未知代谢物。以前的质谱信号很难判断代谢物的来源,因为样本制备的过程中的污染也会产生质谱信号;但通过同位素标记后,只有真的活性物质才会代谢产生新的信号。以前通过MetDNA分析已知的质谱信号,现在将这项技术拓展后还能在被标记后做未知代谢物的鉴定。所以它能够很好地发现生命体所产生的新的未知代谢物。

  此外,以往的代谢物鉴定是根据信号测定其含量,但无法知道两个代谢物之间有没有关系,需要先分别鉴定出两个代谢物以后才能判定。当应用MetTracer后,如果有两个代谢物的同素异形体很相像,则表示它们是共同代谢的,用该方式可能发现新的代谢通路或者新的代谢反应。

  朱正江展望说:“未来,MetTracer还有2个重要用途,一是发现新的未知代谢物,二是发现新的代谢反应以及相应的代谢通路。MetTracer突破了此前非靶向非标记代谢组学技术的边界。”

  平台不断更新

  MetDNA可以支持多种仪器平台,解决了代谢物鉴定的痛点问题。当前有很多软件帮助进行原始数据处理,但一站式鉴定的软件相对很少。有很多用户将数据上传,然后自动处理后就可以获得鉴定的结果。

  MetDNA已更新到第二版本,从鉴定已知代谢物发展到鉴定未知代谢物。下一个版本将支持从头推导全新的结构;并增加数据库,增加保留时间,色谱柱考虑反相或亲水HILIC色谱柱;可解析质谱干扰信号,考虑中性丢失、离子源裂解等多种情况下的干扰;提供更多功能来解析质谱信号,包括一些下游数据的通路分析,统计分析方案,不断提升用户体验。

  朱正江强调:“在技术方面,我们未来的方向将聚焦于如何从质谱信号中解析已知的代谢物化学结构和越来越多的未知代谢物,通过发展一些基于深度学习的人工智能算法,借助稳定同位素标记技术,从质谱信号去推导化学结构。第二个重要方向不仅限于代谢物结构的鉴定,还将更多关注功能性代谢物,尤其是衰老、神经退行性疾病、临床诊断过程中,用该技术发现一些新的重要的功能性代谢物。”

工欲善其事 必先利其器

  代谢组学分析的工作和质谱仪密不可分。朱正江表示:“在生命科学领域中,我们应用较多的是赛默飞Orbitrap Exploris 480质谱仪,一方面用于常规代谢组学研究分析,另一方面利用其长程稳定性的特点进行临床代谢组学研究。”

朱正江实验室的赛默飞Orbitrap Exploris 480质谱仪

  谈到该仪器的特点朱正江表示:“首先,在常规代谢组学研究首先需要使用几千个标准品建立代谢物数据库。赛默飞Orbitrap Exploris 480质谱仪不仅能在不同能级的情况下建库,还能在不同的LC条件下对每个代谢物做保留时间建库。

  建库之后,以这些数据作为起始数据去训练MetDNA,使其通过已知代谢物去推导未知代谢物。MetDNA训练后的数据库,再用来做MetTracer实验。Orbitrap Exploris 480质谱仪的优点是分辨率高,特别是在稳定同位素标记的代谢物检测方面,超高分辨率更有利于清晰地分辨同位素,对我们的实验有很大的帮助。”

  在临床样本应用方面,一次实验通常采集成百上千个样本,仪器需要连续运行一个星期或者更长时间,质谱仪器的长程稳定性、耐污染性以及重现性是考量的首要标准。

  朱正江强调:“由于赛默飞Orbitrap Exploris 480质谱仪良好的长程稳定性,给我们提供了无与伦比的体验,在很长的运行时间里保持很好的稳定性,特别是对小分子的抗污染性很强,不用担心需要运行一个星期或者更长时间的实验。”

  朱正江回顾说:“代谢组学业内使用传统高分辨质谱仪比较多,在小样本规模的生物学研究时其稳定性和性能与Orbitrap相比不相上下。但对于长程的临床样本分析,传统高分辨质谱仪有两个限制,一个是仪器对温度稳定性的需求比较高,即使实验室温度保持得很好,仍然会有一些漂移。第二是仪器的稳定性、抗污染性。目前的传统高分辨质谱仪技术已有很大改善,从小样本规模的生物学研究角度来讲,传统高分辨质谱仪也能满足但对于长程的临床样本而言首选480进行数据采集。”

  “最初调整到Orbitrap平台需要很大的工作量,需要将代谢物数据库等重新采集并做技术迁移,包括一整套的数据处理算法、软件平台参数调整等多个方面。赛默飞公司对我们也提供了很大的支持,在2019我们有幸使用了一台QE plus后,我们体验得不错,发现解决了临床样本长程稳定性数据采集的痛点,后来就采购了Expolaris 480。我们的合作对双方都有价值。我们的算法和数据库最早仅支持Q-TOF,现在可支持Q-TOF和Orbitrap多种平台,包括MetDNA、MetTracer和代谢物数据库等一整套平台。”

  让质谱仪走进千家万户实验室

  朱正江展望科学仪器的未来发展时说:“近几年的仪器发展速度很快。对于代谢组学研究而言,未来一定希望仪器越来越‘傻瓜化’,甚至是像PCR仪一样,本科生就能操作。如果想让质谱仪走向千家万户的实验室,一定要更简单更傻瓜。这个傻瓜化的过程,既需要硬件支持的傻瓜化,也需要软件支持的傻瓜化。以我们实验室为例,做代谢组学的前处理操作尽可能简单,血清、尿液样本直接加入甲醇沉淀然后上机进样即可。即更简单的前处理,让仪器和软件来处理复杂的样品和数据。”

  “第二就是面对如此复杂的数据,数据分析软件需尽可能精确地解析,力争做到和PCR仪一样的高准确度、高覆盖度。人们希望一次进样,获得几千个代谢物的信息,越多越好。仪器的未来发展,既需要硬件的创新,也需要软件的创新,两者之间要相互结合。”

  朱正江强调:“现在国内都提倡做自主研发的仪器,但很少提到软件的自主研发。在代谢组学领域里,希望通过我们的努力,在未来的5-10年里能够稍微改变现状,希望更多的人能参与,让中国的国产仪器有自主的硬件和软件的结合。另外就是标准化,质谱仪器想要广泛应用需要标准化,让一部分质谱仪能够进入成千上万的实验室中。”

代谢组学分析技术和数据解析要齐头并进

  代谢组学是对生物体内所有代谢物进行定量分析,并寻找代谢物与生理病理变化的相对关系的研究方式,随着代谢组学的迅猛发展已涉及疾病诊断、医药研制开发、营养食品科学、毒理学、环境等多项与人类健康密切相关的领域。

  国内代谢组学的研究也遍地开花,大连化物所许国旺研究组利用多维色谱分离分析技术辅助代谢物的分离分析;复旦大学唐惠儒老师课题组通过衍生化和靶向分析的方法分析代谢组学;中国医学科学院药物研究所再帕尔·阿不力孜科研团队通过质谱分子成像技术研究空间代谢组学……一批国内前沿代谢组学研究已经完全形成自有特色,比肩国际水平。

  与之相比,与国外同行相比差异较大的是代谢组学数据分析技术。朱正江强调:“代谢组学研究产生庞大的数据,解析如此庞大的数据需要大量的软件。国内的代谢组学研究在分析技术方面的发展与国外齐头并进,在个别领域如单细胞代谢组分析处于领先位置,但是在代谢组学数据分析方面相对比较落后。这包括了原始数据的分析软件,从质谱峰的转化到代谢物信息的一步步转化,以及代谢物结构的鉴定。在这个过程中,国内代谢组学缺乏自主的特色的分析软件和数据库。”

  因此在过去10年,朱正江课题组一直致力于代谢组学数据解析研究,包括原始数据处理、MetDNA化学结构鉴定、MetTracer标记代谢组学数据处理等。不仅如此,课题组也针对离子淌度质谱建立了大量的基础数据库和数据处理软件。

  朱正江补充说:“这是一个时代发展的趋势,组学研究越来越成熟以后 ,既需要仪器公司的硬件支持,也需要很多软件的支持,两者相辅相成。”

文章提到的厂商
文章提到的仪器
推荐
热点排行
一周推荐
关闭