关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

real-time PCR 数据分析

2020.7.13

无论所使用的real-time PCR是何种型号,正确的数据分析对于获得有效的实验结果都是至关重要的。这里介绍有关real-time PCR数据分析的知识。

 

在讨论基本分析过程之前,先介绍如何设计一个好的实验。如果你是自己设计的引物和探针,那有助于下一步的工作。但是在有些情况下,人们使用出版文献上的序列会更方便。记住,即便是出版物提供的序列也不能保证会得到优化的实验结果。而且排版错误的可能性也需要考虑在内。所以进入实验室之前使用BLAST对全部序列进行核实确保他们是正确的。下订单前先检察引物和探针的序列和Tm值是实验设计的基本要求。

 

标准曲线是判断实验质量的重要手段。使用一个已知的模板,PCR产物,合成的寡核苷酸或转录的RNA做个标准曲线能够确定PCR的效率,敏感性,动态范围和其他的参数。建立标准曲线时使用OD260的模板样本。模板的总量以DNA分子的数量来描述,把质量转化为DNA含量的公式如下:

 

(质量(克)*阿伏伽德罗常数)每个碱基的平均质量*模板的长度。

 

例如,合成70-mer的单链DNA,样本质量为0.8*10ˆ-11gm。代入公式得:

 

(0.8*10ˆ-11*6.023*10ˆ23molecules/mole)330gm/mole/base*70 base。

 

如果使用双链的模板,则碱基的平均质量为660gm/mole/base。

 

标准曲线使用的模板含量从1*10ˆ7开始连续稀释7次每次稀释10倍,最终得到10个模板拷贝。这样的浓度有助于得到最高的ΔRn和最低的Ct。用Excel画曲线时以模板数量的对数值为X,Ct(cycle threshold)值为Y轴。标准曲线的计算公式如下:

 

y=mx+b。y就是Ct,m是斜率,x=log10template amount,b=y-intercept。

 

用斜率计算出实验效率Efficiency【10ˆ(-1/斜率)】-1。实验效率告诉我们PCR反应的执行情况。鉴定系数rˆ2是实际结果和理论值相符程度,表示稀释和移液的准确性。y-intercept说明实验的敏感度和模板含量的精确度。

 

通过已知的模板含量,可以计算合成一定的DNA含量需要多少次循环:

 

n=Log(Nn)-Log(N0)/Log(1+E)

 

Nn是n次循环后的模板含量,N0是原来的模板含量,E是实验效率Efficiency,n是所需的循环数。

 

一个完美实验的斜率是-3.32,效率Efficiency是100%,y-intercept在33到37次循环之间,r^2是1.00。如果效率(Efficiency)较低,y-intercept较高,这意味着循环开始时DNA的含量不足或需要多跑几个循环。可以接受效率Efficiency在95-100%之间的实验结果,但如果y-intercept大大高于37或低于33,这说明没有准确的查明样本数量。通常偏高的y-intercept值是以低浓度存储,反复冷冻解冻造成样本变性的结果。以标准曲线证实实验有效后,就能把同样的规范用于cDNA或RNA来优化样本准备。

 

设备运行后的数据分析建议按照以下的步骤进行。

 

1. Amplification curves。

 

如果没有这个曲线或看上去不正常,一定要查明原因解决问题。首先应检查染色层(dye layer)和指定的reporter,看似简单的方法确是最有可能的解释。如果曲线看上去很不规则,可能是样本中没有荧光剂,或者是加样口根本没有样本。具体是那种情况大约在40次循环后就可以判明,解决方法是调节设备放弃那些无用的加样口,使曲线得以连贯。

 

2. Baseline

 

所有的real-time PCR都用基线(Baseline)在早先的几次循环时来检测背景噪音和荧光剂里的试剂。这样不完整的弧线出现在正式的读出数据之前,大约在第1个到第10个循环之间。如果Ct的最低值小于基线的上限,应该调整基线值。通常设置2-3个循环基线的上限低于Ct最低值。判断基线设置是否合适可以观察增扩曲线(amplification curve)Y轴(ΔRn)的线性表达而不是对数方式,有时对数曲线上看似较好的趋势在线性图上则能反映出问题。如果上限过高,会出现在基线之下很低的Ct。调节基线直到曲线的直线部分与基线相仿。正确的调节会使得彩虹状残缺的对数曲线消失。同样地,极限的上限可能会过低,也可以观察线性增扩曲线来了解。调节基线的影响主要在于低Ct的样本或高含量的模板,如果必须重复试验,稀释模板2倍就相当于把Ct系数改变1。


下一步的重点在设置正确的阈值。当所有增扩标定点处于指数级增长阶段,用对数值显示Y轴。不太可能设置阈值能适合所有的曲线,一个实验里采用多种阈值只适用于mRNA含量低造成ΔRn非常低的情况。有人认为阈值尽可能比较好,有些分析软件调整阈值造成标准曲线有很高的R^2。还有人认为最精确的Ct来源于选择SDM最大的曲率。其实并没有最佳的阈值,设置低造成低Ct也许有益于某些情况。样本含量上2倍的差异带来Ct值1倍的变化,对效率(efficiency)的影响接近100%。

 

3. 污染控制(No template controls,NTC)

 

确保测试的是样本为不是污染物,建议在正式样本前的加样孔中加入2-3个无模板对照样本。加入正式样本前先封闭对照组,同样准备2-3对照样本在加样完成后加入。这个步骤能发现样本是否被污染及其程度。NTC显示Ct值低于40,可以检查增扩曲线来了解详情。如果曲线平稳的增加不存在指数级的提高,或增扩速度很慢,用线性图观察ΔRn图形。一种情况是下降的ROX同时FAM不变。另一种是FAM上升但ROX不变。使用多重试图检查每个加样孔的所有荧光试剂,搞清楚报告的信号和有关染料的关系。如果是轻度污染,可以调节阈值来消除影响或移除有关的加样孔。如果NTC出现指数级增扩,会是先前实验留下的PCR产物造成的。处理方法:用dUTP (2’deoxyurindine 5’triphosphate)和酶UNG(uracil-N-glycosylase)替换dTTP。

 

4. 无逆转录控制(No reverse transcription control)

 

如果real-time PCR用于mRNA定量分析,需要评估样本中染色体污染物的总量。加入一个不含逆转录酶的样本(-RT)。如果-RT的结果是阳性的,可以用DNase处理样本去掉主要的污染物但会减低RNA的产量,或设计引物/探针跨基因间区,或一直使用逆转录控制。

 

阳性控制

 

阳性控制最好的方法是标准曲线。用它来做量化分析,斜率和y-intercept反映了实验质量。如果不能使用一条人工标准曲线,一条覆盖小段DNA或全长RNA的标准曲线能反映出实验的效率。如果实验没有增扩效果,把注意力放在试剂和模板可能存在的问题上。

 

5. 实验样本

 

不同厂商的探针会有不同的表现和不同的最大ΔRn值,这个差别能从实质上影响ΔRn。但它们不会妨碍指数级增扩,只要增扩期间在设置好阈值相关数据就可用于分析工作。

有可能出现当ROX平稳下降,一些曲线在指数级增扩前是平行的状况。还有可能看似存在增扩的曲线其实是假的。分析软件会尽其所能处理数据,然而如果ΔRn大大的低于1,应该直接怀疑没有真正的增扩存在无论曲线看上去如何。

 

6. CV(coefficient of variance)

 

CV(coefficient of variance)是标准偏差除以算数平均,用来测量实验内的再现性和实验的变化。如果CV值较小对实验没有影响。如果一个加样口的值明显不同于其他的,重复后的实验任然出现这样的结果,使用多成分窗口(multicomponent view)或光谱窗口(raw spectra)检查增扩情况。如确实没增扩就需检查是否加入了探针荧光剂,也要可能缺少了探针。排除了探针的可能性后再检查是否加入了模板。如果异常加样口的Ct较低,可能模板被加了2次。重复加入模板只会降低Ct 1,如果CV值大,这个想象不会被发觉。另一个推测是容器没有很好的密封,一些加样口或试管里的试剂蒸发了。

 

7. 定量数据

 

完成初步的实验和分析后,下一步要决定如何有意义地比对数据。量化mRNA和DNA的标准曲线有时作为绝对量化的参考。标准曲线允许在质量基础上计算总量未知的样本,但是无论材料浓度的精确性如何,最终结果是相对于一个单位的定义。大部分设备的软件可以按事先指定的单位计算总量,也可按以下的公式:

 

Log10 copy number = Ct–y-intercept/slope。

 

重要的是检验你的试剂能够给出100%的反应效率。没必要指望你的样本里会有一个能给出精确的基因表达测量。有关规范化和相对量化的内容本文不做展开讨论。

 

8. 数据统计

 

实验完成了,数据也分析了,还有什么可做的?还有很多,real-time PCR统计与大量参数有关,如实验过程中的细胞收获,核苷酸,提取技术,逆转录,PCR条件和试剂等情况。使用你的数据之前有必要先进行统计整理。数据的表达取决于实验的目的,如测试受某因素影响前和后的基因表达,正常细胞对比癌症细胞,时间的影响等等。另一类如食物、水、环境中的微生物含量,确认生物芯片、siRNA的结果等等。

 

根据实验的类型,有关数据应该按一定的原则整理有助于读者观察到变化,包括数据含义,标准差,置信区间。有些统计用于告诉读者存在重大差异的可能性,大多数real-time PCR是检验假设的结果,有时这些差异很明显统计步骤只是走过场。但是生物系统是不断变化的,不精确的,有时统计能说明数据的排他性。


推荐
关闭