关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

计算机辅助鉴定药物代谢产物

2018.6.29

随着分析仪器的发展,单个代谢样品中即可检测到成千甚至上万个化合物,如此庞大的数据亟需无监督的自动化鉴定过程。计算机的引入有效解决了大数据处理难题,同时加速了无标准谱图化合物的解析过程,在一定程度上实现了药物代谢产物的自动化鉴定。计算机辅助鉴定方法多种多样,根据其工作原理,现分为化学结构数据库基础上的自动化鉴定、碎片树、基于代谢反应预测的代谢产物鉴定3类,其中化学结构数据库基础上的自动化鉴定适用于无标准谱图的已知化合物的鉴定,碎片树以及基于代谢反应预测的代谢产物鉴定为普适性方法,同时适用于未知代谢产物的分析鉴定。

化学结构数据库基础上的自动化鉴定

相对于存在标准质谱图的化合物,数据库收录的具有结构信息的化合物在数目上具有绝对优势,例如质谱专用数据库MassBank中收录了3 127个化合物的26 296张质谱图,而化学结构数据库ChemSpider中收录了580 000多个化合物结构。如果在化合物结构数据库基础上,根据化合物结构即可推测出化合物的主要离子碎片,或者根据离子碎片即可寻找匹配的化合物结构,那么药物代谢产物可鉴定范围将进一步扩大。研究人员基于这些思考,将化学信息学与计算机科学相结合,开发出多种二级质谱、多级质谱的检索与相似度匹配的计算机程序,实现了基于化合物结构数据库的自动化鉴定过程,扩大了药物代谢产物的可鉴定范围。目前相关的方法工具可分为以下3类。

1.1 计算机模拟MS/MS谱图的代谢产物鉴定

该类方法是根据现有数据库中化合物的MS/MS标准谱图规律建立算法,并利用现有数据库中的数据对算法不断优化。代谢鉴定工具通过这些算法对实际谱图进行分析,完成化合物预测、图谱匹配、评分排序等化合物自动化鉴定过程。例如,CFM-ID 是基于二级质谱并运用此原理的网络服务器,其主要通过概率模型预测裂解过程,生成候选化合物的裂解图谱,然后对预测的裂解图谱和实际图谱进行相似性评分。CFM-ID实际应用过程中具有3方面的作用: 1)对已知化合物的二级质谱解析;2)对未知化合物的二级质谱预测;3)通过对特定图谱的候选结构进行预测排序,进而鉴定代谢产物。

1.2 基于裂解方式预测的代谢产物鉴定

此类方法是根据化合物结构,对其所有可能裂解方式进行预测,将所有裂解方式产生的离子碎片组合与实际质谱谱图进行匹配评分,得到最佳候选化合物结构。应用此原理的代谢产物鉴定软件很多,例如MS-Finder MetFrag MIDAS MAGMa MIDAS是一种通过将MS/MS谱图与数据库中的代谢产物的预测碎片进行匹配完成代谢产物鉴定的数据库检索方法。为了计算匹配度,MIDAS首先根据化学键断裂一般规律列举出代谢产物的可能碎片并计算其合理性,然后对实验数据的MS/MS谱图与代谢产物预测的MS/MS谱图进行匹配评分。Ridder等 结合多级质谱谱图树,构建了一种以子结构为基础的拓展算法。该算法通过建立候选化合物的子结构分层树与各级碎片离子进行匹配,计算匹配分数,根据其匹配分数对从PubChem数据库得到的候选离子进行排序,获取代谢产物的分子结构。以上2种方法对质谱均要求较高的质量精度。MetFrag则以某一特定的相对分子质量对PubChemKEGGChemSpider等数据库进行检索,然后对合理碎片进行计数,结合碎片峰评分完成对候选化合物的进一步筛选。

1.3 基于分子指纹特征的代谢产物鉴定

该类算法是根据化合物的碎片图谱对分子指纹特征进行预测,然后根据这些特征在结构数据库中进行检索获取候选化合物。Heinonen等 运用机器学习模型(基于支持向量机原理)完成对分子特征的预测和串联质谱中的代谢产物鉴定。该方法首先根据未知化合物的质谱信息预测出化合物多种特征,然后将预测的化合物特征与大型数据库如PubChem进行匹配获取候选化合物结构。其常用的方法有FingerIDCSI:FingerID ,其中CSI:FingerID结合了“碎片树”的思想,详细介绍见“碎片树”部分。

碎片树

ö c k e r 等 于2008年首次提出“ 碎片树”(fragmentation treesFTs)的概念,这是一种基于质谱碎片的从头鉴定方法。该法不需要化合物的精确分子结构、化学数据库、质谱数据库等信息,以碎片离子为节点,以丢失的基团为连线,表征化合物的裂解途径,运用固定算法计算子树的最佳得分,预测化合物分子式。为了验证方法的可行性,研究人员运用此方法对32个化合物的分子式进行预测,26个化合物的正确分子式位于候选分子式列表的第1位,其余5个化合物的正确分子式也位于候选分子式列表的前五名。该方法提出后,Böcker团队不断地将其完善 ,并将碎片树的思想与机器学习相结合开发出一种基于MS/MS数据对小分子结构进行数据库搜索的新方法——CSI: FingerID ,在应用过程中该方法与现阶段其他的代谢产物鉴定工具如MIDASMetFragMAGMaCFM-IDFingerID相比,均表现出更高的准确性。2016Böcker等 对“碎片树”算法——SIRIUS系列进行了新的优化,提出了一种碎片树的新计算方法——SIRIUS 3,将原本的“组合优化”转换为“最大后验估计”。相较于前面的方法,SIRIUS 3解决了碎片树的计算难题,在未知化合物分子式的从头鉴定和数据库检索寻找结构相似化合物方面更具突出优势。此外,应用于碎片树的软件还有MoleculePuzzleISIS等 。5.3 基于代谢反应预测的代谢产物鉴定

药物代谢产物来源于药物的代谢反应,代谢产物的结构与代谢反应的类型、前体化合物结构性质密切相关。因此研究者利用这些特征,结合化学信息学与化学计量学,开发出一系列代谢产物的预测软件和代谢产物筛选方法,辅助药物代谢产物鉴定。

代谢产物预测软件根据前体化合物的空间结构、化学键的强弱、常见代谢途径,对代谢产物进行预测。目前根据此方法常用的代谢产物预测软件有:MeteorMetaSiteStarDropMetaDrug Meteor主要根据现有代谢数据中的代谢规律和推理算法对化合物的代谢反应进行预测且能够覆盖主要的代谢反应,灵敏度高,但其缺点是预测化合物数量大于代谢产物数量,存在一定的假阳性,准确性低。MetaSite是一种反应自动对接模型,主要用于预测P450的Ⅰ相代谢反应。StarDrop则主要运用量子力学的方法预测所要查询化合物代谢反应中CYP3A4CYP2D6CYP2C9的参与程度。以上预测软件基于不同的原理,多个预测软件的结合使用可提高化合物预测的准确性。

面对复杂的代谢体系,这些软件预测能力十分有限。因此,一些研究者在对复杂体系代谢产物的鉴定过程中,首先应用化学计量学手段对代谢数据进行预处理,如背景扣除、主成分分析(PCA)、质量亏损过滤(MDF)、子离子或中性丢失过滤,然后综合代谢反应及其图谱特征进行鉴定。例如,MassMetaSite 就是在MetaSite基础上,将代谢产物预测功能与上述预处理过程相结合的化合物自动化鉴定软件。另外,在寻找和鉴定药物肠道菌群代谢产物过程中,研究者们常常根据原产物以及可能发生的代谢反应,应用MetaboLynx软件,对样品和基质图谱进行扫描,寻找发生固定代谢反应的代谢产物。或者根据代谢反应直接对代谢产物的相对分子质量和分子式进行推算,结合MDF,完成代谢产物的寻找。但MDF仅仅能够实现少数步骤的代谢反应的搜索,容易造成代谢产物的丢失。Wang等 通过使用MATLAB软件将任意2个代谢产物之间的差值与可能发生的代谢反应造成的相对分子质量改变相匹配,减少了代谢产物的丢失。同时计算化合物反应对之间相同的中性丢失、碎片离子、碎片离子差,三者之和与碎片离子总数的比值,得到每个化合物的匹配系数,保留每一个化合物的最大值,以达到对代谢产物进行辅助鉴定的目的。


推荐
关闭