数据处理细节影响结果重现;可效仿千人基因组计划做法

  2月17日出版的《自然》杂志刊登社论——《细节的困扰》(Devil in the
details),着重就基因组测序领域科学研究公布的详细程度对其结果重现的影响进行了讨论。以下为文章主要内容:

  随着海量数据的计算机分析日益成为研究中不可或缺的部分,一个新问题产生:科学家公布的研究发现要详细到何等程度,才能让其他人可以重复其研究结果?

  在基因组学和测序分析领域中,生物学家处理的数据更多、更复杂,然而他们往往只是公布结果,于是一些人就说,有关作者是如何分析处理这些数据的内容在多数情况下并不详尽。

  最近一项调查针对去年发表在《科学》、《自然》、《自然—遗传学》上的共14篇有关测序的文章进行检查,发现这些文章都缺乏便于他人重现其结果所需的必要细节内容——比如只提及所用分析软件名,而未提及使用版本和关键参数。