用相异性指数、主对应分析和秩检验建立人体汗液代谢组气相色谱/质谱峰列表

Xu Y, Gong F, Dixon SJ, Brereton RG, Soini HA, Novotny MV,Oberzaucher E, Grammer K, Penn DJ. Anal Chem.2007 Aug 1; 79(15):5633-41. Epub 2007 Jun 30.

摘要:代谢组学中的主要工作是运用主成分分析法(PCA) 和偏最小二乘法,首先确定样品是否处于大组之中。但是,分析化学家很少处理单独的指纹识别问题,为了更有效地进行这一工作,需要研究大量小组别,而不是少量大组别,并需要本文所报导的不同方法。另外,许多哺乳动物和人的代谢组学研究涉及到分析只在某部分样品中存在的化合物(或色谱峰),而PCA 的常规方法不适宜处理稀的基质,可能会有很多个0。但可以通过主对应分析(principal coordinates analysis (PCO)),可以开发出大量定性相似度测量方法,来完成这一工作。可以看出,PCA 值是采用定量相似度测量的PCO 值的特例。我们用将近1000 个人体汗液标本的气相色谱/质谱分析数据进行了大样本研究,这些标本来自Carinthia(南奥地利)200 个不同个体,10 周内每两周取样一次,并按家庭分组。第一步是制作了一张色谱峰列表,需要进行色谱峰识别、校准和积分。从5080 个峰中选出了373 个,这些峰至少在某个人连续5 次的取样中存在4 次。进行定性(存在与否)和定量(相当于PCA)相似度测量计算。对这些相似度矩阵进行PCO和Kolomorogov-Smirnoff (KS) 秩检验。结果表明这些数据组中存在可重现的个体指纹,最好用Hotelling t2 统计的PCO 值和KS 秩检验相关的可能性赋值表示的定性相似度来表示。