“基因组污染是一个大问题,但却不是一个新问题,”加州大学进化生物学家、美国能源部联合基因组研究所系统发育基因组学计划负责人Jonathan Eisen说:“这篇论文或可帮助提醒人们注意这一问题。”

  污染有可能在测序的任何一个阶段导入到基因组序列中。有可能是空气中的细菌落到了样品中,或是灭菌后仍残留在试剂中的DNA片段。但最常见的污染原因则可能是科学家自身,譬如在扩增前将自身的一个细胞落入了样品中。

  “研究人员戴手套进行实验操作不仅是对自身的保护,并且也可避免样品受到自身的污染,”论文的作者之一、康涅狄格大学分子遗传学家Rachel O"Neill说道。

  O"Neill实验室的一位大学生在对基因组数据库进行保守序列筛查时,兴奋地发现大量物种间均存在一个相同的序列。然而当他尝试在实验室重复这些结果时却失败了。这位学生不禁开始质疑数据库基因组是否存在污染,于是他与实验室的同事合作对四个公共数据库(UCSC Genome Browser数据库,NCBI的GenBank数据库,DOE Joint Genome Institute数据库以及Ensembl)中保存的所有非灵长类基因组进行了人类特异性重复序列Alu元件的筛查。