关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

Nature Biotechnology定义病毒基因组标准:何谓高质量基因组

2018.12.18

  据说,地球上的微生物总量超过了银河系中的恒星数量,而且病毒总量也要比之前预计的多得多。

  在最新的Nature Biotechnology杂志上,美国能源部(DOE)联合基因组研究所(JGI)构建了重要的病毒序列数据库,同时提出了病毒基因组标准,指出了三类基因组质量的分级。

  目前虽然许多病毒未知,或者未在实验室培养,但基因组测序和分析方面技术的机制,让研究人员能够从宏基因组和元转录组数据集中识别出超过750,000种未培养的病毒基因组。

  质量和分析指南

  “病毒是每个微生物生态系统中的关键组成部分,由于JGI生成了大量这些数据,因此对开发病毒基因组标准特别感兴趣,”JGI研究人员,第一作者Simon Roux说,“我们只是部分研究人员,我们庞大的研究机构详细审查了这些数据,并提供指导以帮助确定数据质量。此外,在本文中,我们希望提供的不仅仅是标准,而是包括了对这些数据进行何种类型的分析,帮助想要描述自己实验室新型病毒的研究人员。”

  培养病毒已经有了自己的数据质量标准,但这些标准不能直接应用于未经培养的病毒,这些病毒的序列通常是不完整的,并且某些属性只能通过计算方法间接预测。

  马里兰大学医学院基因组科学研究所的GSC主席Lynn Schriml说:“未定义的病毒基因组群体共同确定了对于学界什么是值得报道和有价值的东西。”

  基因组质量的分类

  在这篇论文中,Roux等人指出了未定义病毒基因组的最小信息量,包括来源,病毒基因组鉴定方法和数据质量。JGI先前已经开发了用于报告最小元数据的标准。

  “病毒序列数据和微生物组数据的巨大增长需要强大的标准和数据质量指标,从而研究人员能够利用这些数据进行比较分析,”JGI Metagenome计划负责人,文章通讯作者Emiley Eloe-Fadrosh表示,“通过建立和推广‘best practices’,研究人员就可以打破数据可访问性和可重用性的障碍,在最初的项目范围之外扩大研究范围。”

  研究团队提出了三类基因组质量:

  “Genome fragments”是指由单个或多个片段组成,预测完整性小于90%,或者没有预测基因组大小,注释量小;“high-quality draft genome”代表的是基因组序列完成了90%或更多,片段gaps主要是重复区域。最后,“finished genome”是指由没有gaps的单个连续序列组成的完整基因组和广泛的注释。


推荐
热点排行
一周推荐
关闭