关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

定量蛋白数>1000个!血液样本DIA技术“质”的提升

2018.12.20

  传统的蛋白质组技术,如iTRAQ、TMT或者label-free等,采用的是DDA(data-dependent acquisition,数据依赖采集)数据采集方式,其策略是对响应最高的部分母离子进行二级采集。而新一代的蛋白质组学技术DIA(Data Independent Acquisition,数据非依赖采集)采用了不同的数据采集模式:将质谱整个全扫描范围分为若干个窗口,然后对每个窗口中的所有离子进行检测、碎裂,从而无遗漏、无差异地获得样本中所有离子的信息,实现了从传统的机枪扫射的方式向导弹轰炸方式的采集方式转变。

图片.png

  DIA(Data Independent Acquisition,数据非依赖采集)作为新一代的蛋白质组学技术,凭借其导弹轰炸式的全扫描数据采集方式,显著提升了蛋白质组学分析的覆盖度、重现性和准确性,已被众多顶级研究应用,并发表于Cell、Science、Nature Medicine、Circulation等杂志。更重要的是,DIA已经应用于众多国家级的精准医疗项目,如“癌症登月计划”、“苏黎世癌症地图”、“ProCan项目”等。

图片.png

  上海中科新生命经过长期的潜心研发,已在血液样本蛋白质组学分析方面实现新突破:基于DIA技术,在常规2h分析时长、无需去除血液高丰度蛋白、无需分级的情况下,实现了单个样本定量>1000个蛋白!!!其中线性范围跨越5-6个数量级。该分析能力,比相同分析条件下的传统蛋白质组分析技术(如iTRAQ、TMT或label-free)的数据量提升不止2倍,也使得服务行业中DIA技术在分析能力方面有了质的提升!

  中科新生命本次在血液蛋白质组学上的技术突破获得了行业内的广泛关注,也非常希望同对DIA技术感兴趣的老师与同行,进行广泛沟通与交流,共同推动技术发展与进步。我们整理了几个最为关注的问题与大家共享:

  出发点:针对血液样本进行DIA深度开发的意义在哪?

  重要性:血液样本毫无疑问是临床医学研究最重要、最高频分析的样本类型,尤其在标志物研究方面具有无可替代的地位。

  传统技术的瓶颈:血液样本是蛋白质组分析的难点,因为血液中的白蛋白、IgG等高丰度蛋白占据了90%以上的含量,而质谱会反复扫描这些高丰度蛋白,导致有意义的低丰度蛋白被采集到的过少。因此,为了能够检测到更多、更有意义的蛋白质,在传统的蛋白质组学的分析模式下,目前的常规策略是:先通过亲和方法去除高丰度蛋白,再通过大量的预分级进行检测。该分析模式的问题在于:

  (1) 关于高丰度蛋白的去除问题:高丰度蛋白本身虽然不是大家研究的对象,但却是重要的载体,血液中非常多的蛋白、代谢分子都会与高丰度蛋白结合。高丰度蛋白去除的同时,很多与其结合的蛋白也会被去除。因此,高丰度蛋白的去除过程对实验结果的真实性、准确性有一定的影响。有数据表明,对于某些重要蛋白,去除高丰度会影响这些重要蛋白是否表达差异确定。

  (2) 关于精准医疗、标志物研究的问题:在精准医疗、大数据分析的研究模式下,临床样本的分析方案,已经逐渐摒弃将组内样本混合的模式,而是倾向于将每个样本进行独立的采集和分析。因为,这种模式能尽可能保留信息的完整性、真实性,更有利于数据的有效分析和延展性挖掘。在这种大规模样本的分析过程中,传统的蛋白质组分析模式采用的大规模高丰度蛋白去除、大规模预分级实验过程,不仅意味着巨大的实验成本,更重要的是其对实验操作的平行性是个巨大的挑战(这些预处理过程造成的实验误差,是难以通过内标、算法等方式校正回来的)。

  为什么要用DIA技术?

  首先,不同于传统蛋白质组的优先采集高强度信号的DDA数据采集模式,DIA采用的全扫描采集模式,使得其受到高丰度信号的影响大大降低。所以DIA在血液这种高丰度蛋白构成特点的样本分析上,会更有优势。越难的样本,DIA越能发挥出技术特色。上海中科新生命的DIA平台还对激光显微切割的组织样本进行过分析,其数据量也比常规方法提高0.5-1倍。其次,DIA所具备的高重现性、高准确性的特点,可以在大规模样本分析过程中,尽可能地保证平行性和准确性,无疑是精准医疗、标志物研究等大规模样本分析项目的首选,这也是为什么美国、瑞士、澳大利亚的精准医疗国家项目均采用DIA平台的原因之一。

  血液DIA的分析能力提高这么多,可信度有多高?

  对于血液DIA的分析能力一下子提高了这么多,相信很多人肯定会产生疑问。所以我们已经对DIA数据设置了严格、高标准的“三重数据过滤”:protein FDR、peptide FDR和score值。其次,在分析平台方面也进行了改进,主要包括以下两方面:

  色谱提升:一方面,在蛋白质组的分析流程中,色谱的重要性不亚于质谱,色谱的分离效果,直接影响质谱对信号的采集效率。另一方面,质谱采集到的信号,是否能够用于定量,也需要满足一定的色谱峰条件。色谱的稳定性,还直接决定了数据的重现性和准确性。

  数据库提升:质谱获得原始数据只是图谱与数字符号,数据库搜索过程决定了原始数据有多少可以变为真正有用的数据。DIA技术由于全扫描的采集方式,其原始数据的复杂性远远高于传统蛋白质组技术,高度依赖于预先构建的图谱库对DIA的数据进行搜库。由于我们是最早开展DIA分析的平台,在已经积累了大量血液样本质谱数据的前提下,已经构建成功独有的血液样本图谱库。项目开展过程中,不但会为每个项目构建其特有的图谱库,还会加上本平台自有的血液图谱库,从而实现更高覆盖度地对DIA数据进行分析。

  总 结

  在大规模样本分析的情况下,除了DIA本身具有的高覆盖度、高重现性和高准确性上的优势外,其无需去除高丰度蛋白、无需进行预分级的优势,最大程度地保证了实验结果的真实性和平行性。在原有DIA分析体系的基础上,升级的分析体系进一步实现了更深度的检测,实现了数据量的进一步提升。


推荐
热点排行
一周推荐
关闭