关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

测序平台的读长真的很重要吗?

2012.12.11

  在EdgeBio,我们一直关注如何提高效率,降低成本,并为我们的客户提供整体上更优质的服务。随之而来的是大量的R&D和新技术开发(NTD)费用。一个很好的例子是我们近期发布的一系列技术白皮书(共五篇),是关于定向重测序应用的,包括外显子组。您可以在这里找到。今天我将与大家分享一些使用Illumina MiSeq仪器的较长读取(2x250 bp)的经验。理论上说,您可以从单次制备中获得更多的数据,且运行时间的代价最低,然而,它也增加了一些成本。那么,究竟是否值得呢?

  我认为答案是“看情况”。对于de novo组装,较长的读取会使情况略有改善,但只是在修剪了大量碱基后。对于基于定位的应用,较长的读取似乎并不能使情况明显改善。我们在MiSeq上运行了2x150 和2x250的大肠杆菌DH10B,并通过一些定位和de novo管道分析了数据。下面是结果汇总及少量的解释。

  读取的QC

  您可以看到250bp运行中175-200之后的碱基质量明显下降。150bp运行与其他许多HiSeq/ MiSeq运行相似。150bp运行中所有碱基的平均质量分布(36)略高于250bp运行(34),但两次运行的整体质量不错。

  定位/比对结果

Sample Reads (M) Aligned % Aligned Pairs Aligned % Aligned
Ecoli-150-BaseSpace 26.020 24.848 95.50% 13.010 12.690 97.54%
Ecoli-150-EdgeBio 26.020 25.727 98.87% 13.010 12.726 97.82%
Ecoli-250-BaseSpace 18.928 18.147 95.88% 9.464 8.593 90.80%
Ecoli-250-EdgeBio 18.928 18.507 97.78% 9.464 8.768 92.65%


  250bp运行的读取通量较低,但有了较长的读取,总的碱基产量是相同的,甚至更高。Q30碱基的数量几乎是相同的。通量的差异可以归结为运行之间的正常差异,或者意味着我们还没有弄清250bp运行的簇密度数量。随着我们开始为客户提供2x250bp运行,我们将继续优化250bp运行的工作流程。两个读长之间单个读取的定位是相似的,但较长读取的配对定位下降了约5%。

  如果您正在开展定向测序,如外显子组,我不认为较长的读取会带来更多的见解,但是对于RNASeq、基因融合检测以及其他需要跨越重复的应用(如De novo组装),较长的读取将有所帮助。

  De novo组装结果(CLC Bio)

Sample N50 (Kb) Max (Kb) Mean (Kb) Count
Ecoli-150-CLC (UT) 95.3 326.3 35.7 126
Ecoli-150-CLC (T) 107.6 326.3 40.5 111
Ecoli-150-CLC (UT-SS) 95.3 326.3 35.4 127
Ecoli-250-CLC (UT) 96.9 326.3 7.9 585
Ecoli-250-CLC (T) 107.6 326.3 34.9 129
Ecoli-250-CLC (UT-SS) 97.1 326.3 41.6 108

     UT = Untrimmed      T = Trimmed      SS = Sub Sampled to 30X

  在我看来,这些结果的解释相当直截了当。通过De novo应用的积极修剪,N50(2Kb)有较小增益,且contig数量略有减少。因此,人们应自行决定是否要承担额外的运行时间和试剂所带来的成本,使统计结果略为上升一点。

  总结

  总的来说,考虑到我们利用MiSeq主要是为了支持开展人类定向重测序的客户,我们仍将建议使用150bp试剂盒。MiSeq和Ion Torrent在该领域的进步是令人兴奋的,但我们必须要立足现实。一些(并非全部)有关这些仪器可扩展性的大肆宣传是来自读长的延伸。

推荐
热点排行
一周推荐
关闭