关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

高通量测序技术的原理及各平台优势和实践应用的分析 3

2020.5.25

边合成边测序:SNA(454,Ion Torrent)
与CRT不同的是,SNA方法依赖于单信号标记dNTP来对链进行延伸。四种核糖核酸都必须反复添加到测序反应过程中。不仅如此,SNA不需要将dNTP屏蔽,因为测序反应过程中下一个碱基的缺失会阻止链的延伸。碱基的寡聚体则是一个例外,在这种情况下,信号的强度会随着dNTP数量的增加而成比例的增强。

第一个NGS仪器是454焦磷酸测序仪24。这种SNA系统将结合有模板的珠子以及酶混合物分配到PicoTiterPlate中。由于一个dNTP只能结合到一条链上,酶复合物会对其产生生物荧光。一个特定的珠子中的一个或多个dNTPs可以通过电荷共轭偶联设备(charge-coupled device, CCD)检测到的荧光来确认(图4a)。

Ion Torrent是第一个没有光学感应的NGS平台25。与酶化学复合物产生的信号相比,Ion Torrent平台检测的是dNTP中释放出来的H离子。pH值的改变通过(integrated complementary metal-oxide-semiconductor,CMOS)以及(ion-sensitive field-effect transistor,ISFET)来检测(图4b)。传感器对pH的变化对于连续碱基的检测还不够完善,因此在测量同一碱基连续出现时的数量可能会有所误差。

201653016342634.jpg

图4: 边合成边测序:单核糖核酸添加法。

短读长平台的比较
每个平台在通量,成本,错误率以及read结构上都大相径庭(表一)。尽管有多家NGS技术供应商,NGS研究最常用的还是Illumina平台21。尽管该平台极为稳定,数据可靠,但是基于其使用的单一测序的方法26-28,既然具有系统偏好性的问题。因此,新技术的发展使得研究人员能够有完整的测序方案来获得完整的序列信息。

SOLiD与Complete Genomics系统使用的SBL技术准确率非常高(~99.999%)7,14,因为每个碱基都会被标记多次。虽然这些技术非常准确,但是在敏感性与特异性之间依然不能达到完美的平衡,当一些错误的碱基变化出现时,真实的碱基变化可能被忽略29-31。该类技术在应用上最大的限制可能就是其过短的读长。尽管所有的平台都能产生单末端和双末端的reads,SOLiD的最大读长只能达到75bp,Complete Genomics只能达到28-100bp33,使得其在基因组拼接和结构变异研究中的可操作性大大降低。不幸的是,SOLiD系统不仅受制于运行时间,还受制于其工业生产。另外,尽管cPAL计划准备在成本和通量上和Illumina竞争,却在2016年被迫下马,该技术仅在人类WGS中有所应用33,34。cPAS的BGISEQ-500系统则受制于中国大陆政府。

Illumina由于其技术成熟,平台之间高度互补性与交叉性,使得其在短读长测序上大占优势。Illumina的产品覆盖了从低通量的Mini-Seq到超高通量的HiSeq X系列,其中HiSeq X系列最多可以在一年内产生1800多个30×覆盖度的人类基因组数据量。此外,其运行时间,read结构以及read长度(最大300bp)都在不停的改进。但是,作为一个依赖于CRT技术的Illumina平台,相对于SNA平台的优势在于其在读取核糖核酸多聚体(同一种核糖核酸多次出现)时较低的错误率。尽管SNA平台总体上的准确率可以达到99.5%35,但是在读取那些高AT富集或者高GC富集的片段的时候错误率差强人意32,37,38。在2008年,据Bentley等报道,Illumina平台鉴定到的人类单核糖核酸多态性(SNPs)与基因芯片鉴定的SNPs具有惊人的一致性35。但是,这种高度的敏感性也随之带来了2.5%左右的错误率。因此,其他小组计划使用Sanger测序来对鉴定到的SNPs进行重新测序以便区分测序错误导致的SNPs与真实的基因突变导致的

SNPs35,39,40。在对所有的可能性都进行优化之后,Illumina平台被大量的研究人员认可,在大量的领域中均有涉及:WGS的基因组测序与外显子测序;遗传学应用如染色质免疫共沉淀——测序(chromatin immunoprecipitation followed by sequencing)41;ATAC-Seq(transposase-accessible chromatin using sequencing)42或者DNA甲基化测序(Methyl-Seq)43;RNA转录组测序(transcriptomics applications through RNA sequencing, RNA-seq)44等等。NextSeq与MiniDeq平台使用的双色标记系统通过降低双色通道的扫描与荧光基团的使用达到成本并且增加测序速度。然而,双通道系统却会略微增加测序的错误率45。HiSeq X是目前最高通量的仪器,但其由于通量过大,因此只在部分应用上得以使用,如WGS与全基因组甲基化测序。不仅如此,HiSeq X更大的局限在于其高昂的成本,以至于超过了绝大多数单位的可接受程度。

Qiagen的GeneReader是专为临床诊断设计的,其主要关注点在肿瘤基因panels46上,也因此其局限性较大。根据对其运行时间与功能的分析,GeneReader与Illumina的MiSeq较为相似46。尽管还没有使用数据,但是GeneReader和MiSeq平台有相同的优缺点。

454平台和Ion Torrent平台相比于其他的短读长平台而言,能够提供较长的read读长,分别大约在700bp与400bp,因此在基因组结构较为复杂的研究上应用较多。然而,由于同样都是基于SNA技术,它们都拥有相同的缺点。虽然,其在非碱基多聚体(non-homopolymer)的测序上正确率与其它NGS平台相差无几,但其插入与缺失(Insertion and deletion,indel)是最大的问题。同一碱基的多聚体是该类技术最大的问题所在。有报道,对同一碱基的多聚体的测序误差能够达到6-8个碱基之多47,48。不幸的是,尽管Ion Torrent依然在紧跟快速进化的NGS平台的步伐,454平台却由于成本与应用范围过于狭小却已经被罗氏公司停产。

Ion Torrent平台为不同的研究人员的不同需求提供了不同的芯片与设备,通量从50Mb到15Gb不等,运行时间也从2小时到7小时不等。这一点使得其几乎是所有目前的二代测序平台中最快的一个。这也使得其在基因panel与精准临床诊断上大有优势50,包括转录组与可变剪切鉴定51。Ion Torrent先后发布Ion Personal Genome Machine (PGM) Dx与Ion S5系列希望于在临床诊断上打开疆土。与Ion Chef文库制备试剂盒和芯片上样设备结合使用,S5系列希望能够成为最方便操作的设备,消除其它Ion Torrent设备对氩的依赖。但是,其最大的缺点在于Ion PGM Dx系统可以进行双向测序,更高通量的Ion Proton与S5系统却并不支持双向测序,也因此限制了其在大范围基因组测序与转录组结构上的应用。

长读长(read)的NGS测序
综述

基因组是一个复杂的复合物,其中包含了多种重复序列,拷贝数变化,结构变异。这些与进化,适应以及疾病密切相关54-56。然而,许多复合物元件由于过长,导致短读长测序并不能够完美的对其进行测序。长读长测序的reads可以达到几千个碱基,这使得可以对大的结构进行功能解析。此类的长读长测序产生的单一长序列可以跨越复合物或者重复序列。长读长测序在转录组测序过程中也大有益处,因为长读长的reads可以跨越完整的mRNA的转录本而不需要拼接。这可以使得研究人员可以鉴定到更多的基因亚型等。

最近,人们开发出了两种长读长测序的实验方案,分别是:单分子实时测序(single-molecule real-time sequencing )以及依赖于已有短读长技术体外构建长读长的合成法。单分子法与短读长测序完全不同,因为单分子法不需要对模板进行扩增来产生足够测序仪读取的信号,也不需要轮番添加dNTP。而合成法并非产生原始的长读长的reads,而是通过利用barcodes来进行拼接获得长片段。


推荐
关闭