关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

浅谈NGS的这10年(一)

2021.7.02

  随着人类基因组计划(human genome project )在2003年顺利完成,基因组测序技术取得了长足的进步,这直接导至了每兆基因组成本的大幅下降以及检测的基因组数量越来越多。人们对基因组的复杂性深 感震惊,这也引导着测序技术的进一步发展。最近的一些突破性技术使得测序技术在更短的时间内可以获得更多的数据量。与之对应的是,还有一些技术的进步使得 单条序列的测序读长变得更长——这对解析结构性的复合区段是极其必要的。这些进展给科研人员以及医疗诊断人员提供了一个绝佳的平台使得人们对基因组变异导 致的表型变化以及疾病发生有了进一步的了解。


  近日,美国冷泉港实验室联合加州大学戴维斯分校的研究人员在国际著名评论型综述杂志Nature Reviews Genetics(影响因子41)上发表了一篇评论型综述。该综述对高通量测序的技术原理以及各平台的优势比较和实践应用进行了深入浅出的分析。


  16297c79b5124b64a56445850e471b8c_th.jpg

  介绍

  自 从DNA的双螺旋结构被人们解析开始1,人们在探究健康与疾病的基因组的复杂性与差异性上做出了巨大的努力。为了支持人类基因组计划的顺利进行2,人们在 仪器和试剂上做出了巨大的改进。该计划的完成使得人们强烈的意识到人们需要更多更好的技术与数据分析能力来回答随之而来的一系列生物学问题。然而,通量的 限制以及居高不下的测序成本成为了人们进一步了解基因组的一道坎。2000年之后推出的高通量测序平台很好地解决了这个问题,人类基因组测序的成本直接因 此下降50000倍,并且由此产生了一个新的名词:下一代测序(next-generation sequencing,NGS)3。在过去的十年中,NGS技术不停的在进步——测序的数据量增加了100-1000倍4。这些技术上的进展使得人们甚至 可以在一条read上读出整条基因组序列。根据Veritas Genomics的数据5,人类基因组测序的成本也已经下降到1000美元/人。不仅如此,该技术已经广泛在临床诊断上得到应用3,6。


  但 是,尽管NGS技术非常重要,却并非完美。与NGS技术一道出现的是该技术带来的一系列问题。NGS可以提供海量的数据量,但是其质量却有待提高(有报 道,NGS在序列拼接过程中,错误率在0.1-15%范围内),并且NGS的序列读长普遍较低(每条read的长度在35-700bp之内7,这比普通的 Sanger测序要短),这意味着需要更严格复杂的序列拼接。尽管长读长测序可以克服NGS的这一大弱点,但相对而言,成本较高并且通量较低,这也限制了 该技术的进一步应用。最后,NGS同时还和其他的技术之间存在着竞争的关系。


  短读长(read)的NGS测序

  测序模版克隆法生成综述

  短 读长测序方法包含两种:边连接边测序(sequencing by ligation, SBL)以及边合成边测序(sequencing by synthesis, SBS)。在SBL方法中,带有荧光基团的探针与DNA片段杂交并且与临近的寡核糖核酸连接从而得以成像。人们通过荧光基团的发射波长来判断碱基或者其互 补碱基的序列。SBS方法通常使用聚合酶,而且,诸如荧光基团在链的延伸过程中被插入其中。绝大多数的SBL和SBS方法,DNA都是在一个固体的表面上 被克隆。一个特定区域内成千上万个拷贝的DNA分子可以增加信号和背景信号的区分度。大量的平行同样对上百万的reads的读取大有帮助,每个平行只有唯 一的DNA模板。一个测序平台可以同时从上百万的类似反应中读取数据,因此可以同时对上百万的DNA分子进行测序。


  产生模板的克隆有几个方 法:基于磁珠(bead-based),固相介质(solid-state)以及DNA微球技术(DNA nanoball)(图1)。DNA模板产生的第一步就是样本DNA的片段化,接着是连接到一个为了克隆和测序而设计的接头上。在磁珠法的准备过程中,一 个接头和寡核糖核酸片段互补并且固定在珠子上(图1a)。DNA模板通过使用油包水PCR(emulsion PCR,emPCR)8得以扩增。单个珠子上被克隆得到的DNA片段可以达到上百万个9。这些珠子可以被分为glass surface10或者PicoTiterPlate(罗氏诊断)11。固相介质扩增12避免了油包水PCR,取而代之的是在固相介质上直接进行 PCR13(图1b,c)。该方法中,正向和反向引物结合在芯片的表面,这些引物给单链DNA(single-stranded DNA,ssDNA)提供了末端的互补序列供其结合。最近,几个NGS的平台都是用了模块化的flow cells。


  BGI使用的 Complete Genomics technology测序技术是唯一一个在溶液中完成模板富集的技术。在这种情况下,DNA被多次连接,成环以及剪切从而为了产生一个包含4个不同接头的 环状的模板。通过旋转环状扩增(rolling circle amplification,RCA),可以最多产生超过200亿的DNA微球(图1d)。微球混合物随后被分配到芯片表面上,使得每个微球可以占据芯片 的一个位点14。

  477504f2df8c4189bda34d723a636c24_th.jpg

  图1:模板扩增策略。


推荐
热点排行
一周推荐
关闭