关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

代谢组学常使用的数据库

2020.10.23

  代谢组主要是对小分子代谢物(一般50-1500 Da)进行高通量定性和定量分析,代谢组分析产生了大量的生物信息数据。代谢组数据库的开发对于归纳总结这些大数据,方便后续的代谢组学数据分析,揭示隐藏在大数据背后的生物学机理具有十分重要的作用。

  目前常用的代谢组学数据库有HMDB、NIST、LMSD、LipidBlast、KEGG和Metlin等,本期小编进行了归纳总结,希望对从事代谢组学研究的大家有所帮助。

  Human

  Metabolome

  Database(HMDB)

  HMDB数据库是由加拿大代谢组学创新中心(TMIC)于2007年创立的代谢组学综合数据库。网站主要收录人体内源性代谢产物,包括化合物简介、化学式、分子量、化学分类、化学性质、代谢通路、部分代谢产物浓度和部分MS/MS图谱等。目前为HMDB Version 4.0,数据库主要包含化学数据、临床数据和分子生物学/生物化学数据,共计114183个代谢物条目。另外DrugBank(包含约2280种药物代谢物信息)、T3DB(包含约3670种常见毒素和环境污染物代谢物信息)、SMPDB(包含约25000个人类代谢物和疾病通路信息)和FooDB(包含约28000种食品成分和食品添加剂代谢物信息)也属于HMDB数据库的一部分。

  NIST

  NIST数据库通常被认为是一个EI-MS数据库,但是在新版的NIST数据库中也包含了小分子化合物的ESI MS/MS质谱图。这些小分子包括代谢物的化学标准品、脂质以及生物活性肽。数据库中还包含了常见的ESI加合离子类型的母离子碎片信息和代谢物二级结构信息。数据库包含了几十万种化合物信息,代谢物只是其中的一部分,数据丰富,但需要人工进行衍生化基团回溯。

  LIPID MAPS Structure Database(LMSD)

  LMSD数据库包含了生物相关的脂质结构以及注释。该数据库包含了超过40000个脂质的结构,这使其成为了目前世界上最大的公共脂质数据库。LMSD数据库将所有的脂质分为八个类别,每个类别又具有自己的下一级分类。所有在LMSD数据库中的脂质化合物都被分配了一个编号。LMSD中的每一个记录包含该脂质对应的分子结构,通用名和系统命名,外部数据库的链接,化合物的物理化学性质等信息。

  LipidBlast

  Fiehn实验室于2013年上线了一款免费的数据库,该数据库基于计算机预测的脂质类化合物的串联质谱信息来帮助研究者对脂质类化合物进行注释。该数据库包含了约200000张MS/MS质谱图,涵盖了来自于29个类别的约100000个化合物。其中,超过一半的数据是从LMSD数据库导入或者使用LMSD Tool来生成。LipidBlast数据库还包含了许多没有被LMSD数据库包含的细菌和植物脂质信息。该数据库使用计算机生成了约80000个正离子模式数据和约130000个负离子模式数据,同时也包含了多种加合离子的类型。

  KEGG

  KEGG数据库是由日本京都大学生物信息学中心的Kanehisa实验室于1995年创立,是国际最常用的生物信息数据库之一,以“理解生物系统的高级功能和实用程序资源库”著称。含有部分代谢组学信息。主要偏重于代谢通路和整合代谢、基因和蛋白通路信息。

  Metabolite Link(Metlin)

  Metlin数据库是由The Scripps Institute Gary Siuzdak创立。网站主要侧重于非靶向代谢组学代谢产物的鉴定,其主要特征是具有大量代谢产物的MS/MS图谱,而且每个化合物都有不同的碰撞能图谱,可以清晰的找到代谢产物的碎片离子,还可获得分子量、化学结构式和化学结构等信息。该数据库包含超过960000种化合物,包括来自不同生物的内源性代谢物和外源性化合物。


推荐
关闭