关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

聚焦基因组组装 至今最大组装竞赛寻找最优基因组指标

2013.7.24

  2013年7月23日,由华大基因和BioMed Cental联合创办的开放式期刊《GigaScience》发表了当前最大、最系统的基因组组装过程及评价结果。在第二届Assemblathon竞赛中,共有21个团队基于由三种不同的测序技术所得的鸟、鱼和蛇的未组装基因组数据,提交了43个组装结果,其中来自华大基因的SOAPdenovo团队也参与了此次竞赛。通过对每个组装结果进行100多次评定,大赛共选出十项与组装质量相关的关键性指标。

  这项研究结果经过特殊的同行评议得以发表。Assemblathon2存放在一个存档服务器上(http://arxiv.org/abs/1301.5406 ),指定评审人可以登录该服务器对文章进行评审。由于数据公开存放,作者之间可以自由讨论,《GigaScience》编辑也非常鼓励这种同行评审间的开放性探讨。

  随着新的物种基因组以几乎每天一个的速度公布,基因组学研究也不断加速且更便宜。然而在没有已知组装参考序列的情况下,将原始测序数据拼接成高质量的完整基因组序列,仍然具有很大的技术挑战,因为这需要巨大的计算能力及资源。全球有越来越多的实验室开展完整基因组序列的组装。测序工具日新月异,有无数种方法可以进行复杂的组装流程,但目前科研人员却还不清楚哪种是进行基因序列拼装的最优解决方法。Assemblathon旨在通过周期性的协作共同努力解决这一问题,进一步促进基因组学的开展。

  组织这一规模庞大的竞赛极具挑战性,需要超算中心提供大容量测试和数据访问空间,可镜像到云存储,并能自动计算及呈现处理结果。对于文章评审,同样也具有挑战性和创新性,这需要每个人都须遵守《GigaScience》的开放透明评审程序,在评审过程中,作者和评审人通过Twitter或博客在线发表评论。在Assemblathon网站上可以实时查看同行评议结果,其中评审报告及评审记录会被存档,并连同文章一起供读者阅读。相关补充数据和27GB的参赛方案也存储于《GigaScience》杂志的数据库GigaDB以及NCBI SRA数据库,以促进结果的可重现性。

推荐
关闭