关注公众号

关注公众号

手机扫码查看

手机查看

干货|代谢组学数据分析

迈维代谢
2018.10.23

走过路过,不要错过这个公众号哦!

e1992ab58eaf4040d95e83b9d18ea8b0.gif

总有研究者对代谢组数据如何分析和运用一片茫然,今天在这里小编带大家一起解读常用代谢数据分析,希望能给大家带来灵感。


关于标记物的筛选


01

通过统计图来选择

通常,在多元统计分析(如PCA和PLS-DA)的载荷图(Loading plot)可以帮助我们选出对分类贡献较大的变量。


·在图中,我们可以选取距离原点较远的点作为潜在的生物标记物。


8de15bde6b4e011e4b8590ec900fda95.png


·此外,如果是两组比较,也可以通过OPLS-DA的S-plot进行标记物筛选。选择分布在S-plot两端的变量作为标记物,同时可以参考得分图(Score plot)来观察变量在不同组别的相对含量高低(即处于S-plot右上方的变量在得分图中处于y轴右侧的组别中含量较高,反之亦然)。

cfb846b8e83e882a11ee7c61e42e179f.png


02

通过统计数值来选择

·PLS-DA分析之后,通过VIP值的大小来筛选变量,通常选择VIP值大于某个数值(如VIP>1或者2等,这个是作者自己定义的)。由于每一个主成份都会有一个VIP值,也有的文章选取VIP1和VIP2同时大于某个数值的变量来作为标记物,利用Venn图来取二者的交集。

d42f441058e5c166677aae9c37604452.png

·T检验,或者方差分析来选择差异具有统计学意义的变量,p<0.05或0.01。


·利用Fold change大于某一数值(FC>1或者2等) 用来进一步对标记物进行筛选。


·也可以利用p值和FC值经过数据转换后绘制火山图(volcano plot),从图中选择化合物。

6e0ff2ea54f84c941e41b4f1fdfa31dc.png


03

文章报道的其他选择生物标记物的方法

·PLS-DA分析后,选择p(corr)大于0.3的变量。

b50c5ed6c0305fde475cf07f9662957d.png


·删除VIP值在负置信区间的变量。

23ad80297fad6c511e3024875512028b.png

·通过相关分析筛选与功能明确的代谢物呈现明显正相关或者负相关的化合物

ccd415df5dcb39134ad5063337ea73fc.png


·通过网络分析,选择与其他化合物联系最紧密的标记物。(如下图中连结较多且颜色较深的结点)

2f6f0293fd1c6b341a12c9fbf49834a4.png

但是,实验如果只是停留在标记物的阶段,恐怕已经不能满足我们的需求,所以需要对所选择的标记物进行进一步的验证(代谢组学活性筛选(metabolomics activity screen, MAS)用于发现调节表型的小分子代谢物)。如果要对实验进行深入的研究,则需要我们结合研究本身(如所研究的疾病的发生发展、所评价药物的作用等)对数据进一步的挖掘,对已选择的标记物进行更深层次的筛选,最后选择出“真正”的标记物进行生物化学或分子生物学实验的验证,阐明与之相关的生理病理过程。


代谢组学活性筛选(metabolomics activity screen, MAS)用于发现调节表型的小分子代谢物

·代谢组学对小分子代谢物进行定性定量研究,被认为是和表型最接近的组学研究。虽然代谢组学被广泛应用于生物标记物的发现和鉴定中,但是我们同样可以使用该方法来寻找影响细胞或者器官表型的小分子代谢物。


·代谢组学活性筛选(MAS)将代谢组学的数据与代谢通路以及系统生物学信息(包括蛋白组和转录组等)进行整合,筛选出一系列可以用于测试影响表型功能的小分子代谢物。关于使用小分子代谢物调节各种生理病理过程的文章也越来越多的被发表,如使用小分子来调节干细胞分化,少突胶质细胞成熟,胰岛素信号传导,T细胞存活和巨噬细胞免疫应答等等。这使得研究者可以使用代谢组学的技术来鉴定小分子,并使用这些小分子来影响表型。相比于基因和蛋白,代谢物通常比较容易获得,这就意味着MAS技术可以广泛地应用于几乎任何生物系统的高通量筛选。


·通常,代谢物可以从细胞的培养基以及饮食中补充或者消除,用以调节细胞的活性并影响表型。例如,在苯丙氨酸羟化酶缺乏的苯丙酮尿症中,苯丙氨酸的代谢缺陷导致的症状只能通过从出生时严格遵守低苯丙氨酸饮食而得到改善。另一个例子是烟酸(维生素B3),它在能量转移和维持代谢活动中起着重要作用。代谢产物还可以作为代谢辅酶(如辅酶Q10和硫胺素),通过改变酶反应的调节来改变表型。 例如,他汀类(一类降胆固醇药物)具有抑制辅酶Q10内源性合成的副作用。因此辅酶Q10(泛醌)常被用为服用他汀类药物病人的补充剂,以重新获得线粒体能量稳态。


·代谢组学用于发现与生理病理过程相关的一系列代谢物。迄今为止,研究者主要利用这些信息来发现生物标志物,激活或失调的代谢路径。而在MAS中则是讨论如何利用代谢组学的数据来筛选可用于诱导或抑制生物功能的代谢物。 与蛋白质或基因不同,内源性代谢物很容易获得并且进行生物测试和临床应用。

·非靶向代谢组学主要使用LC-MS作为工具对生物样本进行综合比较分析。 LC-MS非常适合代谢组学分析,因为它具有高灵敏度,特异性,和可重复性。 这些优点使其可以对从样品中提取的代谢物进行广泛的统计评估,并可用于揭示未预料到的代谢紊乱。非靶向LC-MS代谢组学的主要优点在于它以一种无偏见的方式来鉴定与特定疾病相关的代谢物,无论是干细胞分化免疫细胞活化,多发性硬化症中的髓鞘再生,慢性疼痛还是II型糖尿病。研究者可以从代谢组学数据集中鉴定的内源性代谢物中筛选可以调节表型的代谢物。 与基因和蛋白质不同,代谢物容易获得,通常价格低廉,并且具有相对简单的结构特征,使得它们非常容易被筛选出来。


0d9d307ec9982e88b1db155b851fe49b.png


·如上图所示, 我们可以设计一些流程来从代谢组学实验中筛选小分子代谢物用于活性检测。


1.最简单接的方法是根据统计学显着性和倍数变化来选择代谢物,这也是在非靶向代谢组学实验中筛选代谢物的常用方法。例如,在使用细胞模型的比较分析中,任何具有统计显着性的代谢物如p<0.001,并且fold change>2(这些值是用户定义的并且可以变化的)都可以被选出进行进一步活性检测。


2.第二种方法是从被激活的代谢通路上选取代谢物,这一功能已经在近期发布的XCMS Online中实现。这种选择方法可以将受到干扰的代谢物以及在特定的感兴趣的代谢途径上的化合物筛选出来。代谢物可以在代谢路径上进行标记,并根据所涉及的途径的数量对代谢路径进行排序,筛选出具有特异性的代谢途径。


3.第三种方法是使用酶的抑制剂或者分子生物性的方法来影响代谢途径上的酶的活性,通过这种方法来筛选特定的代谢物。


4.代谢物选择的过程中,除了评估统计学意义,倍数变化和代谢途径之外,另一个重要的部分就是代谢物鉴定。 为此,已经创建了多个数据库,这些数据库允许研究者使用精确分子量和串联质谱数据推定代谢物的结构。已推定的化合物的结构需要通过与标准品比对(保留时间,精确分子量,串联质谱信息)进行进一步确认。此外,这些化合物的变化也需要使用靶向代谢组学的方法(三重四极杆质谱)进行准确定量,并与非靶向代谢组学的数据进行比较。这种多级验证的方法,可以最大限度的减少假阳性结果的产生。


5.一些使用代谢组学的方法筛选有活性的代谢物的例子


·过去,研究者们使用MAS以外的方法,包括细胞分离,配体结合测定和酶促反应测定等,已经发现几种代谢物作为有效的表型调节剂。 例如1-磷酸鞘氨醇(免疫调节),DHA(认知功能),肉毒碱(生育力),anandamide(神经紊乱)和褪黑激素(睡眠)等等。但是使用代谢组学的方法来表征代谢异常的代谢物正在受到越来越多的关注,因为该方法可以广泛地对小分子化合物进行检测,特别是对低浓度的小分子。因此,代谢组学的方法已经成功地被用来鉴定对表型有调节作用的代谢物(如上表所示)。因此,代谢组学可以用来识别具有潜在的某种功能的小分子化合物。


384b255febb2776bafbd35bc465fafb1.png

·尽管MAS有明显的实用性,但是也存在着一些阻碍其广泛应用的因素:


1.如何对感兴趣的化合物进行筛选,以用于下一步验证试验;


2.在众多收到干扰的化合物中,如何选择对表型调节最有效的化合物;

统计学的分析,对化合物进行分类研究(基于对化合物活性的了解),以及代谢路径的筛选分析都用来筛选最适合的代谢物同时也减少了大量生物学实验验证的必要。接下来的实验,包括代谢通路分析,代谢通路抑制,同位素标记以及代谢流分析等都可以用来进一步对得到的化合物进行筛选。


3.鉴定未知化合物

这主要是因为代谢物的化学多样性和异质性,大量的努力已经致力于开发高级的计算机工具用来预测化合物的多级质谱信息和辅助代谢物的表征。


4.缺乏可以用于生物学验证的代谢物的标准品(特别是那些较少被人熟知的化合物)。

在这种情况下,解决方式通常有两种,人工合成或者分离纯化目标化合物,大多数情况下会采用前者,因为大多数的生物样本量很少,很难对目标化合物进行提取分离纯化研究。

·代谢组学已被广泛地应用于鉴定生物标志物和表征生物作用机制。 未来,使用MAS来鉴定可以改变表型的具有生物活性内源性代谢物将可能被证明是代谢组学更有效的应用。 使用MAS鉴定的代谢物可以单独用于诱导表型反应,或与药物联合使用进行诱导。MAS可以在维持甚至改善治疗结果的同时对药物剂量进行控制和减少副作用。


·MAS的应用可以扩展到疾病调节,生物膜激发或抑制,药物-暴露环境的相互作用,植物生物学和免疫治疗等方面。也许最有趣的是,我们可以应用代谢物来调节生理机能,而不是通过识别代谢物来理解代谢通路,从而改变我们的常规思维。


资料来源于代谢组学分享平台


迈维代谢

b7c5f9389d7fc77675ca12106aeb6228.png

武汉迈特维尔生物科技有限公司(简称“迈维代谢”)位于武汉国家生物产业基地--光谷生物城,专注于提供领先的代谢组学技术开发及服务。迈维代谢创新了“广泛靶向代谢组”技术,基于“代谢组+基因组+转录组”的技术路线,近年来以通讯作者身份在Cell、Nature Genetics、Nature Communications、PNAS、Plant Cell、Current Opinion in Plant Biology等国际学术期刊发表多篇论文,引领基因组时代的代谢生物学研究新方向。

83e991508986e60c38bf62d3c88ab72d.jpeg


迈维代谢

创新代谢组及多组学研究领导者


文章作者
推荐
关闭