关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

真核基因组的组装,有纳米孔就够了

2016.11.09

  生物通报道 农业生物技术公司KeyGene近日只利用纳米孔测序仪MinION生成的序列,组装了立枯丝核菌(Rhizoctonia solani)的基因组。立枯丝核菌是一种农业害虫,感染一些重要的经济作物,包括玉米、水稻和大豆。

  在BioRxiv网站的预印本上,KeyGene的Martin de Vos及其同事介绍了他们的读长优化方法,这使得他们能够生成高度连续的组装,比之前利用短读长测序方法获得的组装要长得多。不过他们也指出,基于纳米孔的组装有着较高的错误率。尽管如此,研究人员认为,这仍是一种高性价比的方法。

  在这项研究中,研究人员利用大小选择,从立枯丝核菌的样品中筛掉小的DNA片段,只留下高分子量的DNA。他们从中生成了三个长插入片段的纳米孔文库:两个是用随机剪切的DNA制备的,片段的平均长度分别为12.5 kb和18.8 kb,而第三个则来自完整的基因组DNA。

  之后,研究人员利用Oxford Nanopore的MinION测序仪对这些文库进行测序,产生了近77,800条序列,转化成834 Mb,而平均读长为10.7 kb。他们指出,大多数长序列来自未剪切的文库。

  De Vos及其同事利用canu assembler将这些序列组装成606个contig,它们跨越54 Mb,其中N50 contig的长度为199 kb。研究人员表示,这是目前最为连续的立枯丝核菌组装,也是仅仅利用纳米孔序列组装成的最大基因组。

  研究人员进一步将他们的组装结果与Illumina MiSeq双端测序的结果进行比较。MiSeq运行产生了1390万条合并的序列,其平均读长为360个核苷酸,这些序列可组装成123,016个contig,总长度为71 Mb,而N50 contig的长度为1,029个核苷酸。

  研究人员报告称,如果他们假设MiSeq的数据是完美的,那么纳米孔组装的错误率如下:每2186个碱基有一个替换错误,每700个碱基有一个插入错误,每297个碱基有一个缺失错误。

  尽管这个错误率高于预期,但研究人员仍乐观表示,纳米孔测序技术和试剂的改进也许能够解决这个问题。他们指出,未来计划用高分子量DNA片段和高通量的PromethIon测序仪来对付高度重复的植物基因组。

推荐
热点排行
一周推荐
关闭