研究细节是否应详尽公布

2011-2-17 13:02 来源: 科学网
708 收藏到BLOG

数据处理细节影响结果重现;可效仿千人基因组计划做法

  2月17日出版的《自然》杂志刊登社论——《细节的困扰》(Devil in the details),着重就基因组测序领域科学研究公布的详细程度对其结果重现的影响进行了讨论。以下为文章主要内容:

  随着海量数据的计算机分析日益成为研究中不可或缺的部分,一个新问题产生:科学家公布的研究发现要详细到何等程度,才能让其他人可以重复其研究结果?

  在基因组学和测序分析领域中,生物学家处理的数据更多、更复杂,然而他们往往只是公布结果,于是一些人就说,有关作者是如何分析处理这些数据的内容在多数情况下并不详尽。

  最近一项调查针对去年发表在《科学》、《自然》、《自然—遗传学》上的共14篇有关测序的文章进行检查,发现这些文章都缺乏便于他人重现其结果所需的必要细节内容——比如只提及所用分析软件名,而未提及使用版本和关键参数。

  另一项研究也指出,在被调查的18篇微阵列(microarray)实验文章中,可能是因为相关信息的缺少,有10篇文章的研究结果无法被重现。

  一些人称只公布原始数据和最终结果,这就足够了;还有些人争辩公布分析软件的版本毫无意义——不同版本的软件差别又不大。事实并非总是如此:有人就曾因为使用了同一软件的不同版本,使得其结果千差万别,最后被拒稿。

  即使面对复杂的分析过程,其透明度仍是可以实现的,比如千人基因组计划(1000 Genomes Project)就会仔细地公布其详细的工作流程,包括原始数据及其处理过程,还有使用软件的详细信息。这种做法很值得学术界学习,也很重要。