关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

一文读懂高通量测序技术与研究(套路和实例分析)

2023.10.27

导语

  高通量测序技术和普通基因测序最大的不同在于,高通量测序能一次并行对几十万到几百万条DNA分子进行序列测定,也就是基因测序里的“批处理”。

  高通量测序经过近十年来的迅猛发展,已经深入到生命科学的各个领域,不仅有力地推动了基础研究的发展,也在逐渐征服临床应用。所谓的高通量测序技术,又名大规模平行测序,是将DNA(或者cDNA)随机片段化、加接头,制备测序文库,通过对文库中数以万计的克隆(Colony)进行延伸反应,检测对应的信号,最终获取序列信息。与Sanger法为代表的传统测序法相比,高通量测序技术在处理大规模样品时具有显著的优势,又快(两天)又多(数百万克隆),成为目前组学研究的主要技术。

  当前主要的测序技术平台,主要分为:

  solexa测序技术(即大家耳熟能详的illumina测序平台);

  454测序技术(读长长,但是准确度较低,成本较高,即焦磷酸测序技术,少量市场占有);

  solid测序技术(双色编码技术,目前基本在市场上见不到了)

  那么高通量测序技术可以帮助我们做到什么呢?

基因组层面的应用

  对于疾病诊断领域,全基因组重测序技术是一种非常有力的手段。所谓的全基因组重测序,即对基因组序列已知物种的个体(比如人,小鼠等)进行基因组测序,并进行差异信息分析的方法。基于全基因组测序,可以快速的寻找到大量的遗传差异,从而实现遗传进化分析及重要性状候选基因的预测,找到大量的SNP,InDel,结构变异(SVs)等变异信息,从而获取生物群体的遗传特征。

  临床上,常规的产前诊断技术是需要通过穿刺(绒毛穿刺、羊膜腔穿刺等)的方法取得胎儿的组织进行遗传学检测,这可能导致一定的流产风险。而在1997年,Lo团队[1]发现了孕妇外周血中存在有胎儿的游离DNA,而高通量测序技术可以针对短序列DNA进行精准的测序。

  2010年,Lo团队借助测序技术完成了母血中胎儿的全部组基因组图谱的绘制,证实了利用cffDNA(cell free fetal DNA)进行胎儿基因检测是完全可行的。目前应用高通量测序技术的三体综合征产前基因诊断技术已经开展临床试点。

  动植物基因组分析流程(引用自诺禾致源)

  一个人样品的全基因组测序,目前的价格在1.3万人民币左右。然而大量的基因组区域是不编码蛋白质的,甚至对于特定疾病或者表型来说,参与调控的关键基因是已知的,所以研究者更关心的是某一个特定区域的表达情况。这时候,外显子组和目标区域测序就非常适合了。

  所谓的外显子组(exome)是一个物种基因组中全部外显子区域的总和,通过探针法捕获基因组中全部外显子序列,然后使用高通量测序技术对外显子组测序,可以直接的发现与蛋白质功能变异相关的遗传突变。相对于全基因组测序,外显子测序更加的经济,只需9000人民币。而对于感兴趣的特定基因组区域,可以进行目标区域的深度测序。这就更便宜了,200个扩增子(产物长度<300bp),如果来自同一个模板,则只需400块!

  那么,除了以上介绍的两种主流的基因组测序方法之外,还衍生出了其他的分析方法,比如简化基因组测序,可以对重要的和复杂性高的QTLS(quantitative trait loci,数量性状位点)精细定位。简化代表文库测序,对群体中不同基因型的个体采用相同的内切酶酶切,回收相同大小范围的酶切片段并测序,可以降低基因组分析的复杂性。酶切位点相关DNA测序(RAD-seq)等一些新兴的测序分析技术。

转录组测序

  在基因组分析上更进一步,我们会对基因表达,可变剪切,基因结构变化等内容感兴趣。所以我们需要使用到转录组测序,即RNA-seq。也就是从总的RNA中富集出单链mRNA,再反转录成双链cDNA,随后进行高通量测序,并与基因组DNA序列进行比对。

  通过RNA-seq,还可以发现新的转录物。长链非编码RNA(lncRNA)是当前研究的热点,其功能广泛,涉及到个体发育、干细胞分化、细胞代谢、肿瘤发生发展等众多方面。最早的大规模发掘lncRNA的工作是通过芯片完成的,但是后来人们发现,高通量测序特别适合用于发掘新的lncRNA。

  RNA-seq分析标准流程(引用自诺禾致源)

  近年来,在人、小鼠、大鼠、果蝇、斑马鱼、猪等物种中,通过RNA-seq,发现了一大批的lncRNA。进一步研究证实有的lncRNA具有调控各种生物过程的能力。这方面的工作比较简单,也形成了一定的套路,对于广大的生命科学研究人员来说是较容易出成果的一个领域。

  除lncRNA外,环状RNA(circRNAs)研究也是RNA-seq的一个重要应用方向。circRNAs是一类特殊的非编码RNA分子,也是RNA领域最新的研究热点。与传统的线性RNA不同,circRNA分子呈封闭环状结构,不受RNA外切酶影响,表达更稳定,不易降解。

  有研究表明circRNA可能通过miRNA-sponge的方式来调控miRNA对靶基因的抑制作用,在某些疾病中具有重要意义。通过RNA-seq,可以找到融合(fusion)的序列接口,从而发掘新的circRNA。这项技术已经得到了许多重要的应用。

  同时,我们也常常用到DGE(digital gene expression)技术。其基本原理是对cDNA进行双酶切,从而每一条mRNA都会得到一个对应的标签,随后进行高通量测序,比较不同样本之间各种标签的数目,从而找出差异化的标签,即差异化的mRNA。

microRNA测序

  microRNA是一类内源小分子RNA,通常在转录后水平,负调节基因表达来发挥作用,控制了多种生物和代谢途径中众多基因的表达,在生物生长和发育中扮演重要角色,目前microRNA测序技术普遍用于动植物表观遗传学研究。

  除以上介绍的测序技术之外,常用的测序技术还有:

  MeDIP-Seq技术(methylation DNA immunoprecipitationsequencing,甲基化DNA免疫共沉淀),是研究甲基化的一种有效的手段。由于在哺乳动物中甲基化一般发生在CpG的胞嘧啶5位碳原子上,所以可通过特异性结合甲基化DNA的蛋白MBD2b或5’-甲基胞嘧啶抗体富集高甲基化的DNA片段,并结合第二代高通量测序,对富集到的DNA片段进行测序,从而检测全基因组范围内的甲基化位点。

  ChIP-seq,染色质免疫共沉淀技术,研究体内蛋白与DNA相互作用的一种方法先通过ChIP 特异性地富集与目的蛋白相结合的DNA片段, 而后对所得DNA片段进行高通量测序。

  下面是两个在CNS研究中运用高通量的实例。

高通亮案例:经典之作及牛文推荐

案例1:FPR1突变与蒽环类药物肿瘤治疗

  Chemotherapy-induced antitumor immunity requiresformyl peptide receptor 1

  作为精准治疗的一部分,尤其是高通量测序在基础研究和临床治疗中的应用,本文算是一篇典范文章了。从它临床样本的测序结果入手,分析得到了靶向基因,不但为该药物的个性化治疗提供了依据和检测指标,也为深入挖掘药物的治疗机制提供了切入点,值得大家学习。

  这篇文章中,研究人员通过遗传测序方法,试图发现与蒽环类药物引起的抗肿瘤免疫相关的基因。这里主要集中在测序结果的单核苷酸多态性(SNPs)分析,发现有一个SNP相关的基因,FPR1功能缺失性突变可以显著降低蒽环类药物的作用。

  之后通过进一步分析发现FPR1作用于宿主的免疫细胞,而非肿瘤细胞本身。既然免疫细胞表达受体蛋白FPR1起抗肿瘤作用,那么肿瘤细胞必然需要表达该受体的配体蛋白参与进来。对FPR1已知的四个配体排查,发现其中annexin A1配体,在介导免疫细胞和肿瘤细胞之间的相互接触中起关键性作用。

  作为精准治疗的一部分,尤其是高通量测序在基础研究和临床治疗中的应用,本文也算是一篇典范文章了。从临床样本的测序结果入手,分析得到了靶向基因,不但为该药物的个性化治疗提供了依据和检测指标,也为深入挖掘药物的治疗机制提供了切入点。

案例2:高通量测序与结直肠癌

  ErikaVacchelli, et al. Chemotherapy-induced antitumor immunity requiresformyl peptide receptor 1, Science, aad0779.

  该文通过对KRAS正常的结直肠癌病人的样本进行了高通量测序分析,检测单抗治疗(包括帕尼单抗和西妥昔单抗)后肿瘤细胞的遗传学突变。该文作为高通量测序在精准治疗应用中的实例,实在是不可多得的一篇好文。研究结果对于指导临床治疗也是具有非常重要的意义,尤其是抗体治疗增敏突变的发现,应该也算首次报道。

  首先实验流程主要包括以下三部分:一是临床病人的肿瘤标本,包括原位结直肠癌和肝转移;二是利用临床肿瘤建立小鼠的移植瘤模型;三是针对移植瘤模型的抗体治疗反应设计联合靶向治疗策略。整体如下:

  第二步,根据上述实验设计建立移植瘤模型,对116个标本进行全基因组测序,分别发现了针对抗体治疗具有抗性和增敏作用的基因突变。

  第三步,对测序得到的几种基因突变分别在原位瘤和转移瘤中进行了比较,验证抗体治疗抗性突变的作用。

  最后,利用移植瘤模型,分析抗体治疗抗性突变和增敏突变后重新设计联合靶向治疗,达到个性化治疗目的。

  总体来说,高通量测序技术的诞生可以说是基因组学研究领域一个具有里程碑意义的事件。该技术使得核酸测序的单碱基成本与第一代测序技术相比急剧下降。但是同时由于数据量的大幅度上升,全基因组测序临床应用的瓶颈在于信息的分析和解读能力不足。

  如何更好的分析数据,挖掘数据,验证结果,成为一个更大的难点,是当前生物研究的关键步骤, 具有巨大的现实意义。因此学习“高通量测序与数据分析”大势所趋,帮您跻身科研前列。

推荐
关闭