关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

竹类组学和分类学信息平台发布

2024.3.31

日前,中国科学院昆明植物研究所研究员李德铢带领的研究团队在《分子植物》上在线发表论文,发布了“竹类组学和分类学信息平台(BambooBase,https://bamboo.genobank.org/)”。

BambooBase收录了竹类植物18个基因组、476个转录组和16个表观基因组的数据,以及135个属的分类学信息,用户界面友好,可为全球从事竹类相关研究的人员提供一站式数据支持。

1711936484790430.jpg

BambooBase主页

 竹类植物是竹亚科(Bambusoideae)植物的总称,与水稻、小麦、大麦和燕麦同属于禾本科BOP分支,具有重要的经济、生态和文化价值。2013年以来,毛竹和芸香竹的基因组草图,以及麻竹参考基因组相继完成。最近,科研团队又在《自然—遗传学》上发表论文,发布了11个代表各主要分支和倍性的竹类植物参考基因组。至此发布的竹类植物基因组已有18个,其中6个为草图,12个为染色体水平的高质量参考基因组(2个草本竹类和10个木本竹类)。

在科研团队看来,为更好地服务竹类植物的系统进化和功能研究,有效归纳和整理这些海量组学和分类学数据成为迫切需求。

在BambooBase的开发中,研究团队基于序列相似性和基因共线性信息,构建了竹亚科物种基因组/亚基因组间的同源基因数据集。平台提供了丰富的生物信息学工具,方便用户对不同竹类植物基因以及基因同源关系进行查询、分析和可视化。用户可以在“Help”栏目查阅平台使用手册。

科研人员介绍,由于竹类植物经历过多次异源多倍化事件,各主要分支间具有复杂的网状演化关系,同源基因的鉴定比较困难。

针对这一困难,该平台选择水稻作为外类群,以亚基因组为单位,通过整合序列相似性和基因共线性信息,将13个基因组27个亚基因组的基因聚类划分到166,307个共线直系同源基因簇(Syntelog Groups,SGs)。与仅使用序列相似性信息聚类方法获得的基因簇相比,SGs在区分直系同源基因和旁系同源基因方面表现更优。

同严格要求基因拷贝数符合染色体倍性的“完美拷贝”(perfect-copy)方法相比,SGs提供了更灵活和更全面的直系同源基因数据集。平台用户可以从目标基因出发,查询其所在同源基因簇的所有基因列表和基因树。

BambooBase为每个基因建立一张“卡片”,记录包括基因注释、各类组织和不同发育阶段表达量等基本信息,而且可以从该卡片链接到基因组可视化和同源基因等模块以及相关外部数据库。

此外,BambooBase提供了丰富的查询、分析和可视化工具,如微观和宏观尺度(亚)基因组共线性、序列搜索比对、引物设计、同一竹种(如毛竹)不同拼接组装版本的基因ID 转换、功能基因富集和共表达网络分析等。

除了多组学数据外,竹类系统发育工作组(BPG II)版面集中介绍了竹亚科已知全部3个族135属的主要分类学信息,包括每个属发表时的原始文献、异名、模式种、形态学描述和地理分布等。

中国科学院昆明植物研究所副研究员刘云龙、博士生高舒扬、副研究员金桂花、周梦媛博士,以及安徽农业大学高琪娟博士为论文第一作者,刘云龙、昆明植物研究所研究员马朋飞和李德铢为论文共同通讯作者,安徽农业大学教授夏恩华参与该数据库的构建工作。

相关论文链接:https://doi.org/10.1016/j.molp.2024.02.017

推荐
关闭