关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

测序污染有多危险,如何防范与去除[实验手册]

2015.10.21

  一些研究表明,目前已经公布的基因组存在多种污染,随着这个问题越来越突出,我们需要找出方法来应对

  生物通报道:Supratim Mukherjee在进行数据分析的时候,发现数以百计的微生物基因组中会重复出现同一种噬菌体序列,这令他感到很惊讶。这位来自劳伦斯伯克利国家实验室的生物信息学家最开始是为了比对这些微生物的代谢途径,但后来他发现了几乎无处不在的序列,“我以为我们发现了一些新的东西,”他回忆道,“在这些不同的微生物中,这整个噬菌体基因组是完整地保留下来的。”

  但当Mukherjee一开始分析这个噬菌体序列时,他就知道这就是 PhiX 序列,一种Illumina公司测序试剂盒中用做标准品的噬菌体。PhiX 本来是作为一种质控检测指标,用于追踪每个测序过程中出现的错误率的,但在上百个案例中,Mukherjee发现研究人员都没有从其公布的基因组序列中剔除Phi X的序列。

  并不是只有Mukherjee一人发现此种情况,最近大量的报告表明,发表的基因组出现污染要不之前想象的多得多。那么这些污染是如何出现的呢?我们有能做些什么,避免这些情况的出现呢?

  就此The Scientist杂志请教了几位研究人员,他们分享了他们的一些Tips,可以检测和预防出现“流氓序列”。

  广泛的基因污染

  在Mukherjee 研究组意识到 PhiX 污染可能会出现了多个公布的微生物基因组中之后,这一研究组觉得量化其出现频率。通过分析调查,Mukherjee等人发现在已出版的1.8万个细菌和古细菌基因组(Integrated Microbial Genomes database)中,超过1000个序列被PhiX 序列污染。今年Mukherjee等人已经将这一发现公布在Standards in Genomic Sciences上。而这些其中的10%也出现在了同行评审的期刊杂志中。

  PhiX 污染还只是冰山一角――现在问题呈指数级增长,NCBI总监David Lipman说,他也正在筛选过去五年间,呈递到GenBank中的数据。

  “我们检测到2012年细菌和古细菌的污染情况还只有2%-3%,” Lipman说,“但之后就急速攀升,到2014年,已经接近了10%。今年到目前为止,这一比率达到23%”。

  Sanger研究所的科学家们也发现,DNA提取试剂盒、化学试剂和实验室环境中的杂菌很容易造成污染,影响微生物组分析的结果。

  研究人员发现,没有污染的话对照样本应该只有一种菌,但有时却出现了270种不同的细菌。与高生物量的样本相比(粪便样本),来自血液或肺部的低生物量样本尤其容易受到污染。

  “现在的DNA测序技术允许人们进行深度测序,被广泛用于稀少微生物群体的分析。我们发现,这类样本很容易被其他来源的DNA污染,要么在收集样品的时候,要么在DNA提取和扩增过程中。污染会对研究结果产生很大的影响,这一点需要研究者们给予足够的重视,”Sanger研究所的Alan Walker博士说。

  而且微生物也不是唯一出现这么多污染的研究领域,去年伦敦大学学院的计算机专家William Langdon发现,千人基因组计划中至少7%受到了支原体遗传物质的污染(BioData Mining, 7:3, 2014),因此如果说你对污染的基因组感到头疼的话,放心,你不是唯一一个。

  污染从哪里来?

  来自圣地亚哥州立大学的生物信息学家Rob Edwards说,污染出现的来源很多,“首先就是实验室成员可能混淆了两个样品,不小心给文件或者样本贴上了错误的标签。这些都可以通过加强实验室管理,提高实验记录保存制度等很容易解决。”

  另一方面,污染也有可能来自其它本不应该出现在样品中的外来遗传物质,又或者来自培养细菌周围的环境,Edwards说。即使你认为自己测序的是单一培养产物,但是在一个测序循环中出现多个物种的情况,并不少见。

  此外,如果正在测序来自人类肠道的微生物,那么样品中自然会出现人体细胞,还有即使你只想要测序某个生物体的细胞核基因,也会出现细胞内线粒体和叶绿体基因,这些也都是污染。这些污染当然很难完全避免,但是可以采取一些措施:在测序之前清理样品,或者在测序结果中剔除污染的序列。

  Edwards的研究组聚焦于来自环境样品的宏基因组测序,他表示其研究组就常常利用过滤设备,根据大小对病毒和细菌混合物进行分离。如果他们推测样品中存在人体DNA的污染,那么就会先剔除这些序列,只留下微生物的基因样本。

推荐
热点排行
一周推荐
关闭