关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

高通量测序技术的原理及各平台优势和实践应用的分析 5

2020.5.25

201653016651547.jpg

图5: 长读长实时测序原理。

长reads的合成

与真正测序的平台不同的是,合成长读长技术依赖于一个barcode系统来结合不同的片段,通过已有的短读长测序仪来获得长读长reads61。该方法将大的DNA分子分割成若干个小片段到微孔中或者乳液中。每个微孔或者乳液中的模板被切割并且加上了barcodes。这种方法允许在短读长测序仪上使用,测序后数据被通过barcode分开按照barcodes的序列进行拼接62。

合成法有两个系统:Illumina长片段合成平台(图5c)与10X Genomics乳液系统(图5d)。Illumina系统(Moleculo)分割DNA到小板上而不需要特殊仪器。然而,10X Genomics乳液系统(GemCode与Chromium)使用乳液分隔DNA并且需要微流体平台(microfluidic instrument)来进行测序前的准备工作。在其实浓度低至1ng的情况下,10X Genomics乳液系统可以任意切割长的DNA片段(最大达到100kb)到微粒(GEM)中,这种威力一般包含了≤0.3× 的基因组以及一个独特的barcode。

单分子测序与合成法测序的比较
人们对长读长测序越来越感兴趣,每个系统都有其优劣(表一)。最近长读长测序最受欢迎的是PacBioRS II。该设备可以产生超过50kb长度的单个read,长链建库测序平均长度为10-15kb。这种特性使得在基因组拼接与大范围基因组结构的应用中大有好处63,64。但是,长链的单个碱基错误率在15%左右65,使得人们对该仪器的使用有所顾虑66。不幸的是,这些错误随机分布每个reads,也因此必须有足够高的覆盖度来消除单个碱基错误率的负面影响67。

PacBio的环状模板有时候也会出现错误。单个碱基测序次数越多,结果就越可靠,其最高准确率达到99.999%59,68。其高准确率与Sanger测序相似,使得该方法与Sanger测序一道成为SNPs的研究方法65。该设备的运行时间与通量受测序读长的影响,长的模板需要更长的时间。举例来说,1kb的库运行1小时测序每个分子可以产生7500个碱基,平均大约重复8次;而运行4小时每个分子可以产生大约30000个碱基(大约重复30次)。相反的是,10kb的库运行4小时产生30000个碱基只能重复3次左右。通量的限制以及高企的成本(1000美元/G),加上较高的覆盖度使得PacBio RS II成为那些较小的实验室难以应用的技术。然而,考虑到这些问题,PacBio推出了Sequel系统,其通量与RS II相比高出了7倍,使得30×覆盖度的人类基因组测序成本大幅下降一半69。

ONT MinION是一个小的(~3 cm× 10 cm)USB设备,并且可以在个人电脑上运行,使得其成为最小的测序平台。这使得MinION具有极高的便携性,并且在临床诊断中以及那些不容易到达的地方有着广泛的应用前景。尽管周边设备依然只有在实验室中才有,如文库准备的恒温器,这依然可以大幅减少设备空间。与其他平台不同,MinION在片段大小上是有限制的。理论上来讲,任意大小的DNA分子都可以在该设备上测序,但是实际情况是在对长片段进行测序过程中,是有所制约的70。作为ONT技术本身的特性,ONT拥有超过1000种独立的信号,这使得ONT拥有巨大的错误率——1D read大约在30%左右(主要是indel)。有效的对核糖核酸复合物的测序也是ONT MinION面临的一大问题。当核糖核酸复合物超过k-mer长度,就很难准确鉴定前一个k-mer何时离开孔而下一个k-mer何时进入孔。因为修饰的碱基会改变原有的k-mer设定的电压变化,所以碱基的修饰对MinION而言同样也是一大挑战。幸运的是,最近的一系列的对试剂以及算法的改进使得其准确率提高不少71。


推荐
关闭