关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

九大测序平台对比(二)

2021.7.02

Helicos
企业: Helicos Biosciences
推出时间: 2008年
主流型号: HeliScope™ Single Molecule Sequencer(2008年推出)
样品要求: 1-3 μg,起始DNA体积不超过100 μL.
测序原理: 边合成边测序,可逆阻断测序
待测DNA被随机打断成小片段,在每个小片段(~200 bp)的末端加上poly-dA,并于玻璃芯片上随机固定多个poly-dT引物,其末端皆带有荧光标记,以利于精确定位。首先,将小片段DNA模板与检测芯片上的poly-dT引物进行杂交并精确定位,然后逐一加入荧光标记的末端终止子。这个终止子与Illumina的终止子可不一样,不是四色的,是单色的,也就是说所有终止子都标有同一种染料。在掺入了单个荧光标记的核苷酸后,洗涤,单色成像,之后切开荧光染料和抑制基团,洗涤,加帽,允许下一个核苷酸的掺入。通过掺入、检测和切除的反复循环,即可实时读取大量序列。最后以软件系统辅助,可分析出完整的核酸序列。
文库制备: Fragment, Mate-pair
模板制备: 单分子检测
读长: 25-55 bp,平均35 bp
测序通量: 21 to 35 Gb/run
时间/run: 8 days
碱基精确度: >20X覆盖度时一致性超过99.995%
变异检测能力(DNA重测序方面): SNP, CNV
成本: 仪器$999,000/台,测序$0.45-0.60/Megabase.
数据格式: Raw data:srf或者sms格式
分析软件: 推荐用Helisphere开放资源软件进行过滤比对
优点: 真正的单分子测序,无需前期扩增,不引入偏向性;特别适合RNA-Seq或RNA直接测序的应用,因为它能直接测序RNA模板,而无需将其转化成cDNA。检测碱基替换突变的误差率非常低,~0.2%。
缺点: 错误率高,Insertion 1.5%,Deletion 3.0%;Heliscope在面对同聚物时也会遇到一些困难,但可以通过二次测序提高准确度;由于在合成中可能掺有未标记的碱基,因此其最主要的错误来源是缺失。
经典案例: 1.Single-molecule sequencing of an individual human genome.
Dmitry Pushkarev,Norma F Neff & Stephen R Quake.Nat Biotechnol, 27. (9): 847-852.
(更多详见
http://www.helicosbio.com/HeliSp ... id/169/Default.aspx)
备注: 特别适合RNA-Seq或RNA直接测序的应用




DNA Nanoball array

企业: Pacific Biosciences
推出时间: 2009年底Science论文发表,2010年推出
主流型号: DNA Nanoball array
样品要求: DNA 由
PicoGreen定量:推荐10ug,最少7.5ug。浓度:75-150ng/ul;体积:50-200ul;DNA长度:大分子量双链基因组DNA,大部分超过20kb.
测序原理: 边连接边测序
采用了高密度DNA(玻璃板)纳米芯片技术和非连续、非连锁联合探针锚定连接(cPAL)技术来进行测序。基因组随机打断成500bp随机长度的片段,两端接上接头,成环,限制性内切酶酶切,重复2次,最终连接成一个DNA环,现阶段4接头建库方法能够支持70bp单端测序(35bp双端测序)。接着,所示,每个DNA环在反应液中高速扩增,形成一个纳米球(DNB),这样每一个DNA环大约扩增了200次。然后把这些纳米球平铺到预先处理过的玻璃板上,形成纳米芯片。最后通过非连锁联合探针锚定连接(cPAL)技术进行测序,10bp长的探针上有一个锚定碱基(A or T or G or C),其他位置都是N,通过与模板的杂交连接反应,根据4种不同的碱基(A/T/G/C)会有四种不同的荧光信号,总共需要40种不同的锚定探针。每一种锚定探针杂交之后都会进行洗脱。通过DNB芯片的荧光显影结果及解码分析,我们可以确定每个DNB的核酸序列。
文库制备: 500bp
模板制备: 纳米球(DNB)
读长: 35PE
测序通量: 20-60G/run/flow slide,共18 个flow slide
时间/run: 9 days
碱基精确度: 99.999%
变异检测能力(DNA重测序方面): SNP、Indel、SV、CNV
成本: 只提供测序服务,不出售仪器。09年11月的WGS成本为$1726 (45×),$8005 (87×)
数据格式: 基础文本格式,*.tsv。可交付结果包括:序列变异、功能注释、数据总结报告 及一整套上述结果的支持数据。
数据由三部分组成,主要部分是reads和mappings,其次是assambly 和variations,summary report最少
分析软件: Genome comparison tools
Format conversion tools
Annotation tools
Reference tools
,在开发中的还有用于癌症基因组分析的肿瘤-正常样本比对工具和用于家族基因组分析的工具,还有大规模比对工具可以同时比对数百个基因组。Complete Genomics Assembly Pipeline version 1.5.0
优点: 测序自动化,成本低,通量大
缺点: 读长短,分析软件不公开,样品要求高
经典案例: Identification by whole-genome resequencing of gene defect responsible for severe hypercholesterolemia. Jonathan Rios, et al. Human Molecular Genetics, Volume19, Issue22 Pp. 4313-4318.
Human Genome Sequencing Using Unchained Base Reads on Self-Assembling DNA Nanoarrays.Radoje Drmanac1,et al. Science, Vol. 327 no. 5961 pp. 78-81 .
Analysis of Genetic Inheritance in a Family Quartet by Whole-Genome Sequencing. Jared C. Roach,et al. Science, Vol. 328 no. 5978 pp. 636-639
The mutation spectrum revealed by paired genome sequences from a lung cancer patient.William Lee,et al.Nature ,Volume:465, Pages: 473–477
备注: mapping reads:40X/genome




The PacBio RS system

企业: Pacific Biosciences
推出时间: 2010年2月开始早期试用
主流型号: PacBio RS
样品要求: 1kb以下500ng,纯化的基因组 DNA, BACs, cDNA 文库 或PCR 产物
测序原理: 边合成边测序,single molecule, real-time, or SMRT™, technology
这项技术的核心在于使用了Zero-Mode Waveguide(ZMW)(零波段边界)。测序的平台上有几万个小井,单个DNA聚合酶和要测序的DNA链固定在每一个小井里。带有荧光标记的脱氧核苷酸(A,T,C,G)被加入到每个小井里。每一种脱氧核苷酸在激化后分别能放出不同波长的荧光。小井的底部开了一个非常小的孔,小到比探测激光的单个波长还要短。根据我们的常识,这个孔太小了,激光无法从井的底部穿过去,从而无法激发脱氧核苷酸上的荧光物质。应此,底部的显微镜检测到的是一片黑暗。但是我们知道光线是一种波,它会衍射,激光虽然不能完全穿过小孔照亮整个小井,但它能透过小孔而勉强照亮小孔附近很小的一个区域。而DNA聚合酶正好被固定在这个小区域。当有单个脱氧核苷酸加载在DNA聚合酶上形成新的化学键时,这个脱氧核苷酸上的荧光物质被激活而发光,从而被显微镜观测到。这种特定颜色的荧光只持续一小段时间,应为这个碱基在DNA链上合成之后,它的荧光基团就会被剪切掉,从而继续下一个碱基的合成。当DNA链合成结束之时也是DNA链测序完成之时。但DNA聚合酶的活性会在激光照射下逐渐减弱,不能无限长度的进行合成反应,因此DNA链的测序长度也是有限的。
文库制备: Fragment, Mate-pair (250bp-6kb)
模板制备: SMRTbell™ library, 无需常规扩增,1kb以下的文库只需要500ng样品
读长: 1000bp
测序通量: 高灵活性的测序通量
时间/run: 模板制备到 primary basecall analysis只需不到一天,一般只需要不到4个小时.
碱基精确度: 准确率社会评价不高,2011年1月发表的NEJM杂志(关于海地霍乱的测序)在其supplementary提到它的单碱基准确率只有81-83%。
关于其准确率的社会评价不好,有网站称其准确度很差,单次测序平均错误率15%,循环测序后降至8%
变异检测能力(DNA重测序方面): SNP、Indel、SV、CNV,可以直接进行甲基化等修饰测序,方便表观研究
成本: $700,000 per machine,$99 per SMRTTMCell, each patterned with 15,000ZMW, each ZMW contain a single DNA polymerase.
数据格式: bas.h5 – Base File and Filtered Bases File - Documentation
cmp.h5 – Reference Mapped File and Consensus File - Documentation
分析软件: mapping:BLASR (Basic Linear Alignment with Successive Refinement);组装:ALLORA (A Long Read Assembler);SNP 和Indel : RCCS (Reference Circular Consensus Sequencing) 客户端软件:SMRT Portal;提供:experiment specific, data-rich reports in industry-standard output formats containing both primary and secondary analysis data。可以使用第三方软件。
优点: 读长长;无需PCR扩增,也避免了由此带来的bias;需要的样品量很少;样品制备时间花费少;用RS系统可以远程快速获取数据和选择测序参数;通量灵活;时间快
缺点: 准确性低,需要循环测序,
经典案例: The Origin of the Haitian Cholera Outbreak StrainChen-Shan Chin,et al.N Engl J Med 2011; 364:33-42January 6, 2011.
Real-Time DNA Sequencing from Single Polymerase Molecules.John Eid, et al.Science 2 January 2009:
Vol. 323 no. 5910 pp. 133-138
DOI: 10.1126/science.1162986
备注: 1.在样品制备好后,有一个run design的步骤,可以在客户电脑上用RS remote 软件来自主选择运行方式和后续的个性化分析服务,以及第一时间接受测序数据2.截止2011年5月份已正式发售了多台RS测序仪,其中包括美国国家生化防卫分析与对策中心(NBACC)和冷泉港实验室。



PGM

企业: Ion Torrent
推出时间: 2010年
主流型号: Ion Personal Genome Machine™(2010年)
样品要求: 5 μg DNA,起始DNA体积不超过130μL
测序原理: 半导体芯片测序
该测序仪使用了一种高密度半导体小孔芯片。该芯片置于一个离子敏感层和离子感受器之上,每当有核苷酸分子被掺入时就会释放出质子,而离子感受器就会感受到这种信号,知道是哪一个核苷酸被掺入,从而读出DNA序列。
文库制备: Fragment(185–210 bp)
模板制备: PCR扩增
读长:
314芯片,100 bp;
316芯片,100bp;                                                                  
318芯片,200 bp。
测序通量:
314芯片,10 Mb/run;
316芯片,100 Mb/run;
318芯片,1Gb/run。
时间/run: 2 hours
碱基精确度: 一致性超过99.99%,>99.5% raw accuracy.
变异检测能力(DNA重测序方面): SNP, Indel
成本: 仪器$50,000 /台,测序$500/run
数据格式: 标准的SFF或者FASTAQ格式
分析软件: 一系列商业软件进行变异检测,denovo组装
优点: 无以伦比的快速,2个小时完成测序工作;Ion Torrent的化学测序原理自然简单,无修饰的核苷酸、无激光器或光学检测设备,因而可达到极小的测序偏差和出色的测序覆盖均衡度。
缺点: 测序通量目前还不够大,增加半导体芯片的容量将有望提高测序仪的处理能力。
经典案例: 1德国大肠杆菌疫情爆发之后,华大基因利用第三代测序仪——Ion Torrent进行了该大肠杆菌的全基因组测序。在获得病毒样本后三天的时间内,华大基因完成了对该新型大肠杆菌的基因组测序。经过初步信息分析,发现该菌株是一种新的兼具侵袭、产毒、肠出血等特征的大肠杆菌。
备注: 特别适合微生物基因组测序及扩增子重测序



MiSeq

企业: Illumina
推出时间: 2011年
主流型号: MiSeq Personal Sequencing System(2011年)
样品要求: 使用Nextera,50 ng DNA;使用TruSeq,100 ng–1 μg DNA
测序原理: 边合成边测序
这种测序技术通过将基因组DNA的随机片断附着到光学透明的表面,这些DNA片断通过延长和桥梁扩增,形成了具有数以亿计cluster的Flowcell,每个cluster具有约1000拷贝的相同DNA模板,然后用4种末端被封闭的不同荧光标记的碱基进行边合成边测序。这种新方法确保了高精确度和真实的一个碱基接一个碱基的测序,排除了序列方面的特殊错误,能够测序同聚物和重复序列。
文库制备: Fragment
模板制备: 桥式扩增
读长:
1*35 bp
2*100 bp
2*150 bp
测序通量:
1*35 bp >120 Mb/run
2*100 bp >680 Mb/run
2*150 bp >1 Gb/run
时间/run:
      扩增测序总时间:
     1*35 bp 4 hours
     2*100 bp 19 hours
     2*150 bp 27 hours
碱基精确度:
>90% bases higher than Q30 at 1*35 bp
>80% bases higher than Q30 at 2*100 bp
>75% bases higher than Q30 at 2*150 bp
变异检测能力(DNA重测序方面):
成本: N/A
数据格式: 仪器$125,000/台,测序$750/run
分析软件: *.bcl, FASTQ, BAM, *.vcf和*.csv.
优点: 样品制备简单快速,在一台仪器上完成测序和数据处理;可靠的化学方法,可逆中止碱基边测序边合成法
缺点: N/A
经典案例: N/A
备注: 特别适合扩增子测序、克隆检查和小基因组测序

推荐
关闭