关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

高通量测序(NGS)的过程及原理介绍

2023.11.07

  高通量测序技术的一般过程是将DNA(或cDNA)随机片段化,加上接头序列,制备用于上机测序的文库,通过对文库中数以万计的克隆(colony)进行延伸反应,检测对应的信号获取序列信息,最终通过数据分析来挖掘序列中的科学问题。

441520_202311071629261.jpg

几种不同测序平台的原理及步骤如下:

(1)Roche 454平台

  Roche 454测序系统是第一个商业化运营二代测序技术的平台,也是首选将焦磷酸测序应用在测序技术上的平台。测序原理如下:

1)DNA文库制备

  454测序系统的文件构建方式和illumina的不同,它是利用喷雾法将待测DNA打断成300-800bp长的小片段,并在片段两端加上不同的接头,或将待测DNA变性后用杂交引物进行PCR扩增,连接载体,构建单链DNA文库。

2)Emulsion PCR (乳液PCR,其实是一个注水到油的独特过程)

  454当然DNA扩增过程也和illumina的截然不同,它将这些单链DNA结合在水油包被的直径约28um的磁珠上,并在其上面孵育、退火。

  乳液PCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA扩增。其关键技术是“注水到油”(水包油),基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR反应空间。理想状态下,每个小水滴只含一个DNA模板和一个磁珠。

  这些被小水滴包被的磁珠表面含有与接头互补的DNA序列,因此这些单链DNA序列能够特异地结合在磁珠上。同时孵育体系中含有PCR反应试剂,所以保证了每个与磁珠结合的小片段都能独立进行PCR扩增,并且扩增产物仍可以结合到磁珠上。当反应完成后,可以破坏孵育体系并将带有DNA的磁珠富集下来。进过扩增,每个小片段都将被扩增约100万倍,从而达到下一步测序所要求的DNA量。

3)焦磷酸测序

  测序前需要先用一种聚合酶和单链结合蛋白处理带有DNA的磁珠,接着将磁珠放在一种PTP平板上。这种平板上特制有许多直径约为44um的小孔,每个小孔仅能容纳一个磁珠,通过这种方法来固定每个磁珠的位置,以便检测接下来的测序反应过程。

  测序方法采用焦磷酸测序法,将一种比PTP板上小孔直径更小的磁珠放入小孔中,启动测序反应。测序反应以磁珠上大量扩增出的单链DNA为模板,每次反应加入一种dNTP进行合成反应。如果dNTP能与待测序列配对,则会在合成后释放焦磷酸基团。释放的焦磷酸基团会与反应体系中的ATP硫酸化学酶反应生成ATP。生成的ATP和荧光素酶共同氧化使测序反应中的荧光素分子并发出荧光,同时由PTP板另一侧的CCD照相机记录,最后通过计算机进行光信号处理而获得最终的测序结果。由于每一种dNTP在反应中产生的荧光颜色不同,因此可以根据荧光的颜色来判断被测分子的序列。反应结束后,游离的dNTP会在双磷酸酶的作用下降解ATP,从而导致荧光淬灭,以便使测序反应进入下一个循环。

  由于454测序技术中,每个测序反应都在PTP板上独立的小孔中进行,因而能大大降低相互间的干扰和测序偏差。454技术最大的优势在于其能获得较长的测序读长,当前454技术的平均读长可达400bp,并且454技术和illumina的Solexa和Hiseq技术不同,它最主要的一个缺点是无法准确测量同聚物的长度,如当序列中存在类似于PolyA的情况时,测序反应会一次加入多个T,而所加入的T的个数只能通过荧光强度推测获得,这就有可能导致结果不准确。也正是由于这一原因,454技术会在测序过程中引入插入和缺失的测序错误。

(2)Illumina Solexa平台

  Illumina公司的Solexa和Hiseq应该说是目前全球使用量最大的第二代测序机器,这两个系列的技术核心原理是相同的,都是采用边合成边测序的方法,它的测序过程主要分为以下4步:

  Illumina Solexa原理:桥式PCR+4色荧光可逆终止+激光扫描成像

①DNA文库制备——超声打断加接头

  利用超声波把待测的DNA样本打断成小片段,目前除了组装之外和一些其他的特殊要求之外,主要是打断成200-500bp长的序列片段,并在这些小片段的两端添加上不同的接头,构建出单链DNA文库。

②Flowcell——吸附流动DNA片段

  Flowcell是用于吸附流动DNA片段的槽道,当文库建好后,这些文库中的DNA在通过flowcell的时候会随机附着在flowcell表面的channel上。每个Flowcell有8个channel,每个channel的表面都附有很多接头,这些接头能和建库过程中加在DNA片段两端的接头相互配对(这就是为什么flowcell能吸附建库后的DNA的原因),并能支持DNA在其表面进行桥式PCR的扩增。这样就形成了数千份相同的单分子簇,被用做测序模板。

③桥式PCR扩增与变性——放大信号

  桥式PCR以Flowcell表面所固定的接头为模板,进行桥形扩增,如图4.a所示。经过不断的扩增和变性循环,最终每个DNA片段都将在各自的位置上集中成束,每一个束都含有单个DNA模板的很多分拷贝,进行这一过程的目的在于实现将碱基的信号强度放大,以达到测序所需的信号要求。

④测序——测序碱基转化为光学信号

  测序方法采用边合成边测序的方法。向反应体系中同时添加DNA聚合酶、接头引物和带有碱基特异荧光标记的4中dNTP(如同Sanger测序法)。这些dNTP的3’-OH被化学方法所保护,因而每次只能添加一个dNTP。在dNTP被添加到合成链上后,所有未使用的游离dNTP和DNA聚合酶会被洗脱掉。接着,再加入激发荧光所需的缓冲液,用激光激发荧光信号,并有光学设备完成荧光信号的记录,最后利用计算机分析将光学信号转化为测序碱基。这样荧光信号记录完成后,再加入化学试剂淬灭荧光信号并去除dNTP 3’-OH保护基团,以便能进行下一轮的测序反应。Illumina的这种测序技术每次只添加一个dNTP的特点能够很好的地解决同聚物长度的准确测量问题,它的主要测序错误来源是碱基的替换,目前它的测序错误率在1%-1.5%之间,测序周期以人类基因组重测序为例,30x测序深度大约为1周。

(3)ABI Solid平台

  Solid测序技术是ABI公司于2007年开始投入用于商业测序应用的仪器。它基于连接酶法,即利用DNA连接酶在连接过程之中测序,其流程及原理如下:

1)DNA文库构建

  片段打断并在片段两端加上测序接头,连接载体,构建单链DNA文库。

2)Emulsion PCR

  Solid的PCR过程也和454的方法类似,同样采用小水滴emulsion PCR,但这些微珠比起454系统来说则要小得多,只有1um。在扩增的同时对扩增产物的3’端进行修饰,这是为下一步的测序过程作的准备。3’修饰的微珠会被沉积在一块玻片上。在微珠上样的过程中,沉积小室将每张玻片分成1个、4个或8个测序区域(图6-a)。Solid系统最大的优点就是每张玻片能容纳比454更高密度的微珠,在同一系统中轻松实现更高的通量。

3)连接酶测序

  这一步是Solid测序的独特之处。它并没有采用以前测序时所常用的DNA聚合酶,而是采用了连接酶。Solid连接反应的底物是8碱基单链荧光探针混合物,这里将其简单表示为:3’-XXnnnzzz-5’。连接反应中,这些探针按照碱基互补规则与单链DNA模板链配对。探针的5’末端分别标记了CY5、Texas Red、CY3、6-FAM这4种颜色的荧光染料(图6-a)。这个8碱基单链荧光探针中,第1和第2位碱基(XX)上的碱基是确定的,并根据种类的不同在6-8位(zzz)上加上了不同的荧光标记。这是Solid的独特测序法,两个碱基确定一个荧光信号,相当于一次能决定两个碱基。这种测序方法也称之为两碱基测序法。当荧光探针能够与DNA模板链配对而连接上时,就会发出代表第1,2位碱基的荧光信号,图6-a和图6-b中的比色版所表示的是第1,2位碱基的不同组合与荧光颜色的关系。在记录下荧光信号后,通过化学方法在第5和第6位碱基之间进行切割,这样就能移除荧光信号,以便进行下一个位置的测序。不过值得注意的是,通过这种测序方法,每次测序的位置都相差5位。即第一次是第1、2位,第二次是第6、7位……在测到末尾后,要将新合成的链变性,洗脱。接着用引物n-1进行第二轮测序。引物n-1与引物n的区别是,二者在与接头配对的位置上相差一个碱基(图6-a. 8)。也即是,通过引物n-1在引物n的基础上将测序位置往3’端移动一个碱基位置,因而就能测定第0、1位和第5、6位……第二轮测序完成,依此类推,直至第五轮测序,最终可以完成所有位置的碱基测序,并且每个位置的碱基均被检测了两次。该技术的读长在2×50bp,后续序列拼接同样比较复杂。由于双次检测,这一技术的原始测序准确性高达99.94%,而15x覆盖率时的准确性更是达到了99.999%,应该说是目前第二代测序技术中准确性最高的了。但在荧光解码阶段,鉴于其是双碱基确定一个荧光信号,因而一旦发生错误就容易产生连锁的解码错误。

(4)Thermo Fisher Scientific Ion Torrent平台

  Ion Torrent 测序仪是第一个不需要光学系统的商业测序仪,所采用的技术为半导体测序,通过半导体芯片直接将化学信号转换为数字信号,不同于前面提到的任何测序仪,可以称之为“二代半”测序仪。其测序原理如下:

  该技术使用了一种布满小孔的高密度半导体芯片,一个小孔就是一个测序反应池。在半导体芯片的微孔中固定DNA链,随后依次掺入ACGT,当DNA聚合酶把核苷酸聚合到延伸中的DNA链上时,会释放出一个氢离子,反应池中的PH发生改变,位于池下的离子感受器感受到H+离子信号,H+离子信号再直接转化为数字信号,从而读出DNA序列。如果检测的DNA链上有两个相同的碱基,将会检测到电压双倍,芯片则记录两个相同的碱基。

  a.测序流程图,b.文库制备,c.乳液PCR(前三个步骤与454技术类似),d. 测序过程

  Ion Torrent半导体测序技术的发明人也是454测序技术的发明人之一——Jonathan Rothberg,它的文库和样本制备跟454技术很像,甚至可以说就是454的翻版,只是测序过程中不是通过检测焦磷酸荧光显色,而是通过检测H+信号的变化来获得序列碱基信息。由于对对个相同碱基的判读是通过电信号来传导,Ion Torrent平台在聚合酶上进行了优化,新推出的Hi-Q酶聚合反应非常快,它产生的PH值变化的峰更高、更尖、更利于判读,这在很大程度上提高了Ion Torrent测序仪判读Homoploymer区域时的准确性。

  Ion Torrent相比于其他测序技术来说,不需要昂贵的物理成像等设备,因此,成本相对来说会低,体积也会比较小,同时操作也要更为简单,速度也相当快速,除了2天文库制作时间,整个上机测序可在2-3.5小时内完成,通量目前是10G左右,但非常适合小基因组和外显子验证的测序。是一种经济、快速、简单、规模可扩展的测序技术,非常适合扩增子测序的革命性技术。

(5)华大基因BGISEQ平台

  自2013年华大基因收购Complete Genomics公司后,华大基因致力于开发基因测序平台,还喊出了“打造中国人自己的测序平台”的口号。2014年华大推出BGISEQ-1000、BGISEQ-100两款测序仪,这两款测序仪主要用于基因测序诊断领域,并于2018年1月被申请注销,测序平台已从原有的BGISEQ-100、BGISEQ-1000升级为BGISEQ-50、BGISEQ-500。BGISEQ-500及BGISEQ-50分别于2015、2016年推出,致力于拓展生育健康类测序业务。2017年华大又推出两款测序仪MGISEQ-200和MGISEQ-2000,这两款测序系统充分实现了低成本购机和低成本运行,其广泛的应用领域,包括科学研究、临床医学、农业、公安司法、环境工程等,实现了医疗和科研领域高通量测序系统的全面普及。

  华大基因测序仪的与之前提到的4个测序平台有所区别, BGISEQ/MGISEQ系列测序仪采用先进的联合探针锚定聚合技术(cPAS)和改进的DNA纳米球(DNB)核心测序技术,将DNA分子锚与荧光探针在DNA纳米球上进行聚合,利用高分辨率成像系统对光信号进行采集,并通过对光信号的数字化处理,最终获得待测DNA序列信息。具体步骤如下:

1. DNA提取与片段化

  准备样本 → DNA提取 → DNA片段化处理 → DNA片段末端修复

2. DNA片段扩增(纳米球技术DNB)

  加接头序列 → 分离出单股DNA → 成环 → 滚环扩增 → 形成DNA纳米球(DNB)

  基因组DNA首先经过片段化处理,末端修复后再加上接头序列,分离出单股DNA后并环化形成单链环状DNA。环装DNA在DNA聚合酶的作用下绕着DNA环不停地转圈,复制出的上百份拷贝都在一股新DNA上,就像一股毛线卷成了毛线团一样,最后形成一团DNA纳米球(DNB, DNA Nano Ball),这一步即为滚环扩增技术(Rolling circle amplification, RCA),可将单链环状DNA扩增2-3个数量级。

3. DNA序列识别

  DNA纳米球附着芯片 → 组合探针锚定连接法测序

  DNB纳米球经过装载技术固定在阵列化(Patterned Array)的硅芯片上,芯片每个位点的蛋白质上自动附着上去一个DNB纳米球并且不会发生堆叠。接下来就是测序过程了,华大测序仪采用了联合探针锚定聚合(combinatorial Probe Anchor Synthesis,cPAS)技术进行测序,首先DNA分子锚和荧光探针在DNB上进行聚合,随后高分辨率成像系统对光信号进行采集,光信号经过数字化处理后即可获得待测序列。

4. 分析

  碱基读取 → 数据比对和组装 → 基因组 → 结果分析

5. 技术优势

  与其他二代测序技术相比较,DNB测序技术具有以下几个优势:

   (1)DNB通过增加待测DNA的拷贝数而增强了信号强度,从而提高测序准确度;

   (2)不同于PCR指数扩增,滚环扩增技术的扩增错误不会累积;

   (3)DNB与芯片上活化位点的大小相同,每个位点只固定一个DNB,保证信号点之间不产生相互干扰;

   (4)阵列化测序芯片和DNB测序技术的结合,使得成像系统像素和测序芯片的面积得到最大化利用。 

推荐
关闭