关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

GenOrigin——一种多物种蛋白质编码基因起源与演化的数据库

2021.6.18

  2021年6月14日,JGG在线发表了华中农业大学陈振夏教授课题组题为“GenOrigin: A Comprehensive Protein-coding Gene Origination Database on the Evolutionary Timescale of Life”的研究论文。该研究开发的GenOrigin数据库可系统追溯565个物种,9,102,113个基因起源,并根据包含时间刻度的物种树推断基因年龄。

  294023_202106181420071.jpg

  DOI:10.1016/j.jgg.2021.03.018

  基因起源的时间(即基因年龄)与其功能密切相关。例如,抑癌基因TP53等癌症相关基因的起源时间与生物多细胞性出现的时间相对应。目前注释同源基因的数据库大多没有提供推断基因年龄的功能,即使有此功能,也仅针对少数核心物种。此外,由于不同研究之间所用注释和方法存在差异,各数据集的基因年龄推断之间也难以比较。

  294023_202106181420241.jpg

  GenOrigin数据库建立流程及提供的功能

  该研究建立了一套系统的基因年龄推断流程,利用Ensembl Compara提供的同源基因注释与TimeTree提供的物种分歧时间,根据Wagner parsimony计算基因的获得与丢失,推断超过90万个基因的年龄。在GenOrigin数据库中,用户可以用关键词轻松查询565个物种中所有蛋白质编码基因的推断年龄,观察其在物种树各分支的存在与缺失,并查看其演化轨迹。用户也可以通过物种树、基因年龄或者基因本体论来浏览相关的基因集。每一个页面都提供了下载当前页面表格选项以及每个物种的基因年龄推断数据。该研究建立的GenOrigin数据库可以为分子生物学、发育生物学、分子进化以及比较基因组学等多个学科提供有用的数据信息。

  华中农业大学硕士生童奕博、博士生石梦威和钱胜为该论文的共同第一作者,陈振夏教授为该论文的通讯作者。相关工作得到国家自然科学基金、中国科学院水生生物研究所淡水生态与生物技术国家重点实验室开放基金、中央高校基本科研基金、华中农业大学自主科技创新基金等资助。

  图文来源:JGG遗传学报公众号


推荐
关闭