分析测试百科网 > 行业资讯 > 技术原理

九大测序平台对比（二）

2021.7.02

Helicos
企业: Helicos Biosciences
推出时间: 2008年
主流型号: HeliScope™ Single Molecule Sequencer（2008年推出）
样品要求: 1-3 μg，起始DNA体积不超过100 μL.
测序原理: 边合成边测序,可逆阻断测序
待测DNA被随机打断成小片段，在每个小片段（~200 bp）的末端加上poly-dA，并于玻璃芯片上随机固定多个poly-dT引物，其末端皆带有荧光标记，以利于精确定位。首先，将小片段DNA模板与检测芯片上的poly-dT引物进行杂交并精确定位，然后逐一加入荧光标记的末端终止子。这个终止子与Illumina的终止子可不一样，不是四色的，是单色的，也就是说所有终止子都标有同一种染料。在掺入了单个荧光标记的核苷酸后，洗涤，单色成像，之后切开荧光染料和抑制基团，洗涤，加帽，允许下一个核苷酸的掺入。通过掺入、检测和切除的反复循环，即可实时读取大量序列。最后以软件系统辅助，可分析出完整的核酸序列。
文库制备: Fragment, Mate-pair
模板制备: 单分子检测
读长: 25-55 bp，平均35 bp
测序通量: 21 to 35 Gb/run
时间/run: 8 days
碱基精确度: >20X覆盖度时一致性超过99.995%
变异检测能力(DNA重测序方面): SNP, CNV
成本: 仪器$999,000/台，测序$0.45-0.60/Megabase.
数据格式: Raw data：srf或者sms格式
分析软件: 推荐用Helisphere开放资源软件进行过滤比对
优点: 真正的单分子测序，无需前期扩增，不引入偏向性;特别适合RNA-Seq或RNA直接测序的应用，因为它能直接测序RNA模板，而无需将其转化成cDNA。检测碱基替换突变的误差率非常低，~0.2%。
缺点: 错误率高，Insertion 1.5%，Deletion 3.0%；Heliscope在面对同聚物时也会遇到一些困难，但可以通过二次测序提高准确度；由于在合成中可能掺有未标记的碱基，因此其最主要的错误来源是缺失。
经典案例: 1.Single-molecule sequencing of an individual human genome.
Dmitry Pushkarev,Norma F Neff & Stephen R Quake.Nat Biotechnol, 27. (9): 847-852.
(更多详见
http://www.helicosbio.com/HeliSp ... id/169/Default.aspx)
备注: 特别适合RNA-Seq或RNA直接测序的应用

DNA Nanoball array

企业: Pacific Biosciences
推出时间: 2009年底Science论文发表,2010年推出
主流型号: DNA Nanoball array
样品要求: DNA 由
PicoGreen定量：推荐10ug，最少7.5ug。浓度:75-150ng/ul;体积：50-200ul;DNA长度：大分子量双链基因组DNA，大部分超过20kb.
测序原理: 边连接边测序
采用了高密度DNA（玻璃板）纳米芯片技术和非连续、非连锁联合探针锚定连接（cPAL）技术来进行测序。基因组随机打断成500bp随机长度的片段，两端接上接头，成环，限制性内切酶酶切，重复2次，最终连接成一个DNA环，现阶段4接头建库方法能够支持70bp单端测序（35bp双端测序）。接着，所示，每个DNA环在反应液中高速扩增，形成一个纳米球（DNB），这样每一个DNA环大约扩增了200次。然后把这些纳米球平铺到预先处理过的玻璃板上，形成纳米芯片。最后通过非连锁联合探针锚定连接（cPAL）技术进行测序，10bp长的探针上有一个锚定碱基（A or T or G or C），其他位置都是N，通过与模板的杂交连接反应，根据4种不同的碱基（A/T/G/C）会有四种不同的荧光信号，总共需要40种不同的锚定探针。每一种锚定探针杂交之后都会进行洗脱。通过DNB芯片的荧光显影结果及解码分析，我们可以确定每个DNB的核酸序列。
文库制备: 500bp
模板制备: 纳米球（DNB）
读长: 35PE
测序通量: 20-60G/run/flow slide,共18 个flow slide
时间/run: 9 days
碱基精确度: 99.999%
变异检测能力(DNA重测序方面): SNP、Indel、SV、CNV
成本: 只提供测序服务，不出售仪器。09年11月的WGS成本为$1726 （45×），$8005 （87×）
数据格式: 基础文本格式，*.tsv。可交付结果包括：序列变异、功能注释、数据总结报告及一整套上述结果的支持数据。
数据由三部分组成，主要部分是reads和mappings，其次是assambly 和variations，summary report最少
分析软件: Genome comparison tools
Format conversion tools
Annotation tools
Reference tools
，在开发中的还有用于癌症基因组分析的肿瘤-正常样本比对工具和用于家族基因组分析的工具，还有大规模比对工具可以同时比对数百个基因组。Complete Genomics Assembly Pipeline version 1.5.0
优点: 测序自动化，成本低，通量大
缺点: 读长短，分析软件不公开，样品要求高
经典案例: Identification by whole-genome resequencing of gene defect responsible for severe hypercholesterolemia. Jonathan Rios, et al. Human Molecular Genetics, Volume19, Issue22 Pp. 4313-4318.
Human Genome Sequencing Using Unchained Base Reads on Self-Assembling DNA Nanoarrays.Radoje Drmanac1,et al. Science, Vol. 327 no. 5961 pp. 78-81 .
Analysis of Genetic Inheritance in a Family Quartet by Whole-Genome Sequencing. Jared C. Roach,et al. Science, Vol. 328 no. 5978 pp. 636-639
The mutation spectrum revealed by paired genome sequences from a lung cancer patient.William Lee,et al.Nature ,Volume:465, Pages: 473–477
备注: mapping reads：40X/genome

The PacBio RS system

企业: Pacific Biosciences
推出时间: 2010年2月开始早期试用
主流型号: PacBio RS
样品要求: 1kb以下500ng，纯化的基因组 DNA, BACs, cDNA 文库或PCR 产物
测序原理: 边合成边测序，single molecule, real-time, or SMRT™, technology
这项技术的核心在于使用了Zero-Mode Waveguide(ZMW)(零波段边界)。测序的平台上有几万个小井，单个DNA聚合酶和要测序的DNA链固定在每一个小井里。带有荧光标记的脱氧核苷酸(A,T,C,G)被加入到每个小井里。每一种脱氧核苷酸在激化后分别能放出不同波长的荧光。小井的底部开了一个非常小的孔，小到比探测激光的单个波长还要短。根据我们的常识，这个孔太小了，激光无法从井的底部穿过去，从而无法激发脱氧核苷酸上的荧光物质。应此，底部的显微镜检测到的是一片黑暗。但是我们知道光线是一种波，它会衍射，激光虽然不能完全穿过小孔照亮整个小井，但它能透过小孔而勉强照亮小孔附近很小的一个区域。而DNA聚合酶正好被固定在这个小区域。当有单个脱氧核苷酸加载在DNA聚合酶上形成新的化学键时，这个脱氧核苷酸上的荧光物质被激活而发光，从而被显微镜观测到。这种特定颜色的荧光只持续一小段时间，应为这个碱基在DNA链上合成之后，它的荧光基团就会被剪切掉，从而继续下一个碱基的合成。当DNA链合成结束之时也是DNA链测序完成之时。但DNA聚合酶的活性会在激光照射下逐渐减弱，不能无限长度的进行合成反应，因此DNA链的测序长度也是有限的。
文库制备: Fragment, Mate-pair (250bp-6kb)
模板制备: SMRTbell™ library, 无需常规扩增，1kb以下的文库只需要500ng样品
读长: 1000bp
测序通量: 高灵活性的测序通量
时间/run: 模板制备到 primary basecall analysis只需不到一天,一般只需要不到4个小时.
碱基精确度: 准确率社会评价不高，2011年1月发表的NEJM杂志（关于海地霍乱的测序）在其supplementary提到它的单碱基准确率只有81-83%。
关于其准确率的社会评价不好，有网站称其准确度很差，单次测序平均错误率15%，循环测序后降至8%
变异检测能力(DNA重测序方面): SNP、Indel、SV、CNV，可以直接进行甲基化等修饰测序，方便表观研究
成本: $700,000 per machine，$99 per SMRTTMCell, each patterned with 15,000ZMW, each ZMW contain a single DNA polymerase.
数据格式: bas.h5 – Base File and Filtered Bases File - Documentation
cmp.h5 – Reference Mapped File and Consensus File - Documentation
分析软件: mapping：BLASR (Basic Linear Alignment with Successive Refinement)；组装：ALLORA (A Long Read Assembler)；SNP 和Indel ： RCCS (Reference Circular Consensus Sequencing) 客户端软件：SMRT Portal；提供：experiment specific, data-rich reports in industry-standard output formats containing both primary and secondary analysis data。可以使用第三方软件。
优点: 读长长；无需PCR扩增，也避免了由此带来的bias；需要的样品量很少；样品制备时间花费少；用RS系统可以远程快速获取数据和选择测序参数；通量灵活；时间快
缺点: 准确性低，需要循环测序，
经典案例: The Origin of the Haitian Cholera Outbreak StrainChen-Shan Chin,et al.N Engl J Med 2011; 364:33-42January 6, 2011.
Real-Time DNA Sequencing from Single Polymerase Molecules.John Eid, et al.Science 2 January 2009:
Vol. 323 no. 5910 pp. 133-138
DOI: 10.1126/science.1162986
备注: 1.在样品制备好后，有一个run design的步骤，可以在客户电脑上用RS remote 软件来自主选择运行方式和后续的个性化分析服务，以及第一时间接受测序数据2.截止2011年5月份已正式发售了多台RS测序仪，其中包括美国国家生化防卫分析与对策中心（NBACC）和冷泉港实验室。

PGM

企业: Ion Torrent
推出时间: 2010年
主流型号: Ion Personal Genome Machine™（2010年）
样品要求: 5 μg DNA，起始DNA体积不超过130μL
测序原理: 半导体芯片测序
该测序仪使用了一种高密度半导体小孔芯片。该芯片置于一个离子敏感层和离子感受器之上，每当有核苷酸分子被掺入时就会释放出质子，而离子感受器就会感受到这种信号，知道是哪一个核苷酸被掺入，从而读出DNA序列。
文库制备: Fragment(185–210 bp)
模板制备: PCR扩增
读长:
314芯片，100 bp；
316芯片，100bp；
318芯片，200 bp。
测序通量:
314芯片，10 Mb/run；
316芯片，100 Mb/run；
318芯片，1Gb/run。
时间/run: 2 hours
碱基精确度: 一致性超过99.99%，>99.5% raw accuracy.
变异检测能力(DNA重测序方面): SNP, Indel
成本: 仪器$50,000 /台，测序$500/run
数据格式: 标准的SFF或者FASTAQ格式
分析软件: 一系列商业软件进行变异检测，denovo组装
优点: 无以伦比的快速，2个小时完成测序工作；Ion Torrent的化学测序原理自然简单，无修饰的核苷酸、无激光器或光学检测设备，因而可达到极小的测序偏差和出色的测序覆盖均衡度。
缺点: 测序通量目前还不够大，增加半导体芯片的容量将有望提高测序仪的处理能力。
经典案例: 1德国大肠杆菌疫情爆发之后，华大基因利用第三代测序仪——Ion Torrent进行了该大肠杆菌的全基因组测序。在获得病毒样本后三天的时间内，华大基因完成了对该新型大肠杆菌的基因组测序。经过初步信息分析，发现该菌株是一种新的兼具侵袭、产毒、肠出血等特征的大肠杆菌。
备注: 特别适合微生物基因组测序及扩增子重测序

MiSeq

企业: Illumina
推出时间: 2011年
主流型号: MiSeq Personal Sequencing System（2011年）
样品要求: 使用Nextera，50 ng DNA；使用TruSeq，100 ng–1 μg DNA
测序原理: 边合成边测序
这种测序技术通过将基因组DNA的随机片断附着到光学透明的表面，这些DNA片断通过延长和桥梁扩增，形成了具有数以亿计cluster的Flowcell，每个cluster具有约1000拷贝的相同DNA模板，然后用4种末端被封闭的不同荧光标记的碱基进行边合成边测序。这种新方法确保了高精确度和真实的一个碱基接一个碱基的测序，排除了序列方面的特殊错误，能够测序同聚物和重复序列。
文库制备: Fragment
模板制备: 桥式扩增
读长:
1*35 bp
2*100 bp
2*150 bp
测序通量:
1*35 bp >120 Mb/run
2*100 bp >680 Mb/run
2*150 bp >1 Gb/run
时间/run:
   扩增测序总时间：
   1*35 bp 4 hours
   2*100 bp 19 hours
   2*150 bp 27 hours
碱基精确度:
>90% bases higher than Q30 at 1*35 bp
>80% bases higher than Q30 at 2*100 bp
>75% bases higher than Q30 at 2*150 bp
变异检测能力(DNA重测序方面):
成本: N/A
数据格式: 仪器$125,000/台，测序$750/run
分析软件: *.bcl, FASTQ, BAM, *.vcf和*.csv.
优点: 样品制备简单快速，在一台仪器上完成测序和数据处理；可靠的化学方法，可逆中止碱基边测序边合成法
缺点: N/A
经典案例: N/A
备注: 特别适合扩增子测序、克隆检查和小基因组测序

互联网

喜欢作者我要约稿

九大测序平台对比（二）

柔荑含莲

Ritata

南州

Chloe

杨莹

喜欢作者

打赏方式

九大测序平台对比（二）

柔荑含莲

Ritata

南州

Chloe

杨莹