关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

利用实时定量 PCR技术通过2 -△△CT 方法分析相对基因表达差

2021.5.24

Kenneth J. Livak and Thomas D. Schmittgen

Department of Pharmaceutical Sciences, College of Pharmacy.

Washington State University, Washington 99164-6534

     现在最常用的两种分析实时定量 PCR 实验数据的方法是绝对定量和相对定量。绝对定量通过标准曲线计算起始模板的拷贝数;相对定量方法则是比较经过处理的样品和未经处理的样品目标转录本之间的表达差异。 2 - △△ CT 方法是实时定量 PCR 实验中分析基因表达相对变化的一种简便方法。本文介绍了该方法的推导,假设及其应用。另外,在本文中我们还介绍了两种 2 - △△ CT 衍生方法的推导和应用,它们在实时定量 PCR 数据分析中可能会被用到。

关键词:反转录 PCR 定量PCR 相对定量 实时PCR Taqman

反转录 PCR ( RT-PCR )是基因表达定量非常有用的一种方法( 1 - 3 )。实时 PCR 技术和 RT-PCR 的结合产生了反转录定量 PCR 技术( 4 , 5 )。实时定量 PCR 的数据分析方法有两种:绝对定量和相对定量。绝对定量一般通过定量标准曲线来确定我们所感兴趣的转录本的拷贝数;相对定量方法则是用来确定经过不同处理的样品目标转录本之间的表达差异或是目标转录本在不同时相的表达差异。

绝对定量通常在需要确定转录本绝对拷贝数的条件下使用。通过实时 PCR 进行绝对定量已有多篇报道( 6 - 9 ),包括已发表的两篇研究论文( 10 , 11 )。在有些情况下,并不需要对转录本进行绝对定量,只需要给出相对基因表达差异即可。显然,我们说 X 基因在经过某种处理后表达量增加 2.5 倍比说该基因的表达从 1000 拷贝 / 细胞增加到 2500 拷贝 / 细胞更加直观。

用实时 PCR 对基因表达进行相对定量分析需要特殊的公式、假设以及对这些假设的验证。 2 - △△ CT 方法可用于定量 PCR 实验来计算基因表达的相对变化: 2 - △△ CT 公式的推导 , 以及实验设计,有效性评估在 Applied Biosystems User Bulletin No.2(P/N4303859) 中有介绍。用 2 - △△ CT 方法分析基因表达数据在文献中也有报道 (5, 6) 。本文介绍了该方法的推导、假设以及应用。另外,本文还介绍了 2 - △△ CT 两种衍生方法的推导和应用,它们在实时定量 PCR 数据分析中都可能被用到。

  2 - △△ CT 方法

  2 - △△ CT 方法的推导

PCR 指数扩增的公式是:

 

Xn 是第 n 个循环后目标分子数。

X 0 是初始目标分子数。

Ex 是目标分子扩增效率。

n 是循环数

C T 代表目标扩增产物达到设定阈值所经历的循环数

因此: 

X T 是目标分子达到设定的阈值时的分子数。

C T,X 是目标分子扩增达到阈值时的循环数。

Kx 是一个常数

对于内参反应而言,也有同样的公式:

 

用 X T 除以 R T 得到:

 

对于使用 Taqman 探针的实时扩增而言, X T 和 R T 的值由一系列因素决定:包括探针所带的荧光报导基团、探针序列对探针荧光特性的影响、探针的水解效率和纯度以及荧光阈值的设定。因此常数 K 并不一定等于 1 。

假设目标序列与内参序列扩增效率相同:

 

 

或:

 

X N 代表经过均一化处理过的初始目标分子量; △ C T 表示目标基因和内标基因 C T 值的差异( C T,X -C T,R )

整理上式得:

 

最后用任一样本 q 的 X N 除以参照因子( calibrator , cb )的 X N 得到:

 

在这里 

对于一个少于 150bp 的扩增片断而言,如果 Mg 2+ 浓度、引物都进行了适当的优化,扩增效率接近于 1 。因此目标序列的量通过内均一化处理之后相对于参照因子而言就是:      

1.2 方法的假设和应用

要使△△ C T 计算方法有效,目标序列和内参序列的扩增效率必须相等。看两个反应是否具有相同的扩增效率的方法是看他们模板浓度梯度稀释后扩增产物△ C T 如何变化。

图 1 显示的是 cDNA 样品在 100 倍稀释范围内的实验结果。对于每一个稀释样本,都用 GAPDH 和 c-myc 特异的荧光探针及引物进行扩增。计算出 c-myc 和 GAPDH 的平均 C T 值以及△ C T 值,通过 cDNA 浓度梯度的 log 值对△ C T 值作图,如果所得直线斜率绝对值接近于 0 ,说明目标基因和内标基因的扩增效率相同,就可以通过△△ C T 方法进行相对定量。在图 1 中,直线斜率是 0.047 ,因而假设成立,△△ C T 方法可以用来分析数据。如果两个扩增反应效率不同,则需要通过定量标准曲线和绝对定量的方法来进行相对定量;或者也可以重新设计引物,优化反应条件使得目标序列和内参序列具有相同的扩增效率。

 

1.3 内标和参照因子的选择

使用内标基因的目的是为了对加入到反转录反应中的 RNA 进行均一化处理。标准的看家基因一般都可被用作内标基因。适合于实时 PCR 反应内标基因包括 GAPDH ,β -actin, β 2 -microglobulin 以及 rRNA 。当然,其它的看家基因也同样能被用作内标。我们推荐在应用某一基因作为内标之前首先确证该基因的表达不会受实验处理的影响。验证实验处理是否对内标基因表达产生影响的方法在 2.2 部分有描述。

方法中参照因子的选择决定于基因表达定量实验的类型。最简单的设计就是把未经处理的样品作为参照因子( calibrator )。经内标基因均一化处理后,通过 方法计算,目标基因表达差异通过经过处理的样本相对于未经处理的样本的倍数来表示。对于未经处理的参照样,△△ C T = 0 ,而 2 0 = 1 。 所以根据定义,未处理样本的倍数变化为 1 。而对于那些经过处理的样本, 相对于参考因子基因表达的倍数为 。同样的分析也可用于不同时相的基因表达差异,在这种情况下,一般选 0 时刻的样本作为参照因子。

有些情况下,并不是比较不同处理样本基因表达差异。例如,有的是想看某一器官中特定 mRNA 的表达。在这种情况下,参照因子可能是另一器官中该 mRNA 的表达。表 1 显示了大脑和肾脏总 RNA 中 c-myc 和 GAPDH 转录本的 CT 值。在这一个例子中,大脑被人为的选择为参照因子,通过计算得到肾脏 c-myc 表达量经 GAPDH 校正后相对于大脑的表达量的结果。尽管相对定量方法可用于这种组织之间的比较,但结果的生物学解释是相当复杂的。不同种类细胞中目标和参照转录本单一的相对量变化可能在任何特定的组织中都存在。

 

  1.4 方法的数据分析

实时定量 PCR 所得到 C T 值可以很容易的输出到表格程序如 Microsoft Excel 中去。为了显示数据分析过程,我们在这里给出了一个基因表达定量的实验数据和样本列表。通过 β -actin 均一化处理,我们对目标基因 fos-glo-myc 的表达变化进行了监测。在 8h 的时间范围内,在每一时间点都取 3 个重复样本,每一样本在 cDNA 合成之后都做定量 PCR ,数据分析用到了公式 9 ,即:

 

Time x 表示任意时间点, Time 0 表示经 β -actin 校正后 1 倍量的目标基因表达。

0 时刻目标基因和内标基因的平均 C T (见图 2 第 8 栏)被用于公式 9 中。通过公式 9 计算出每一个样本目标基因表达通过 β -actin 均一化处理后相对于 0 时刻的倍数(见图 2 第 9 栏)。平均 SD , CV 由每一个时间点所取的三个重复样求得。用这种分析方法,在 0 时刻的平均倍数变化接近于 1 。我们发现通过检测在 0 时刻平均倍数变化是否为 1 可以很方便的验证三个重复样品之间是否有错误或者误差。如果得到的结果与 1 偏差很大 , 则表明存在计算错误或者是很高的实验误差。

在前面的例子中,在每一时间点上分别取了三个独立的 RNA 样本进行了分析。因此对每一个样本分别处理,通过 计算后取结果的平均值就非常重要。如果是同一样本进行 PCR 扩增的重复,这就需要首先求出平均 C T, 然后再进行 计算。怎么样计算平均值就要看目标基因和内参基因是在同一个管子中扩增还是在不同的管子中扩增。表 1 给出了目标基因( c- myc )和内参基因( GAPDH )在不同管中扩增的实验数据。在这里不应该把任一单个的 c-myc 管子和 GAPDH 管子作比较,而应该分别计算出 c-myc 和 GAPDH 的平均 C T 来计算△ C T 。 重复实验中 C T 值的估计偏差通过标准的指数计算转化成最后结果中相对量的变化。但其中的一个难点是 C T 值与相应的拷贝数成指数关系(见第 4 部分) , 因此,在最后的计算中, 的误差通过△△ C T 加上标准偏差和△△ C T 减去标准偏差来评估,这就使得求得的数值相对于平均值呈不对称分布。不对称分布是因为结果经指数处理后转化成量的线性比较造成的。

通过不同荧光染料标记的探针,我们可以在同一管中同时扩增目标序列和内标序列。表 2 给出了目标基因( c- myc )和内标基因( GAPDH )在同一管中扩增的实验数据。对于任意一个管子,目标基因( c- myc )和内参基因( GAPDH )扩增时加入的 cDNA 量都是一样多的,所以可以分别对每个管子计算△ C T 值,这些值取平均后再进行 计算。 在这里估计误差值也是一个不对称的范围,反映了误差经指数处理转化为线性差异。

在表 1 和表 2 中,估计误差在从△ C T 到△△ C T 的计算中未见有增加,这是因为我们把参照基因和检测基因的误差都显示出来了。我们把△ C T,cb 当作一个人为设定的常数来减去,得到△△ C T 。这样得到的结果就与图 2 所显示的在求平均之前对不同重复样本分别通过各自的 C T 值求 所得结果 相当。另一种方法是将参照基因当作没有任何误差的1倍的量,在这种情况下,平均△ C T,cb 的误差值被引入到每一样本的△△ C T 中。在表1中,肾脏中△△ C T 变成- 2.50±0.20 而经过校正的 c-myc 量是 5.6 倍,范围从 4.9 到 5.6 。而在大脑中的结果是没有误差的1倍。

 

 

2.  2 -ΔCT ’ 方法

2.1 2 - △ CT ’ 方法的推导

通过内标 RNA 可以对加入 RNA 的量的差异进行校正。 方法的数据分析的一个特点就是能够利用实时 PCR 实验的一部分数据来完成这种校正。在其它的方法不能定量初始 RNA 量的时候:例如,在能得到的 RNA 量非常有限的时候或者需要处理高通量的样品的时候,这一方法的优势就格外明显。当然我们也可以利用 PCR 实验以外的方法来完成这种校正。最常用的一种方法就是用紫外吸收来确定用于 cDNA 合成的 RNA 量,然后将相同的 RNA 反转录产生的 cDNA 用于 PCR 定量反应。这种外标法校正的一个应用例子就是研究某种实验处理是否影响内标基因的表达。在这里,目标基因和内标合二为一。在这个例子中,公式 [2] 不被公式 [3] 除,公式[ 5 ]变成:

 

整理得:

 

任一样品X 0,q 除以参照品 X 0,cb 得:

 

在这里△ CT’=C T ,q-C T ,cb 。△ C T’ 与前面计算中用的△ C T (用目标基因 C T 值减去参照基因 C T 值)相互区别。

就象在 1.1 部分所描述的,如果条件优化较好,效率接近于 1 ,内标相对于参照因子为:

 

 

2.2 2 -△CT ’ 方法的应用

2 - △ CT , 方法的一个应用就是确定实验处理对某一候选内标基因的影响。为了显示这一过程,我们做了血清饥饿 / 诱导实验 (7) 。血清饥饿 / 诱导是研究某些 mRNA 降解的常用方法 (8) 。然而,血清可能影响一些基因的表达包括标准的看家基因的表达。

在 24-h 血清饥饿培养之后,在 NIH 3T3 细胞中加入 15% 血清诱导基因表达。从细胞中提取 Poly(A) + RNA ,并将之反转录成 cDNA 。利用 SYBR Green 通过实时定量 PCR 检测 GAPDH ,β 2 -microglobulin cDNA 的量。 GAPDH 和β 2 -microglobulin 各自的相对量通过 2 - △ CT ‘ 公式 求得。细胞处理对于 GAPDH 的基因表达有明显影响,但对β 2 -microglobulin 没有什么影响。因此β 2 -microglobulin 很适合做血清刺激定量实验的内标,而 GAPDH 并不适合。这一例子向大家展示了在只研究一个基因的时候怎么用 2 - △ CT ‘ 的方法分析基因相对表达数据。

 

3. 实时 PCR 数据的统计学分析

实时 PCR 最终分析的是阈值循环或 C 。 C T 值通过 PCR 信号的对数值和循环数来确定。 因此 C T 值是一个指数而非线性概念 。因此,在任何统计分析中都不要用原始的 C T 值来表示结果。正如我们在前文中所描述的一样, PCR 相对量通常和内标和参照样本一起计算而很少直接用 C T 值来表示,除非我们想检验重复样本之间的差别。为了向大家显示这一点,我们用 SYBR Green 通过 real-time PCR 来检测相同 cDNA 的 96 个重复反应。所有反应组分在同一管中混好后分装到 96 个管中,做实时 PCR 分析,得到了每一个样本的 C T 值。为了比较样品间变化,计算了 96 个样本的平均 ±SD ,如果通过原始 C T 值计算,平均 ±SD 是 20.00±0.193 , CV 为 0.971% 。但是如果把原始 Ct 值用 2 -CT 转化成线性形式,平均 ±SD 是 9.08 × 10 -7 ±1.33 × 10 -7 , CV 为 13.5 %。从这个简单的例子我们可以看出,通过原始 CT 值来反映变化是错误的,应该避免。用 2 -CT 将单个数据转化成线性形式来说明重复样本之间的变化和差异更准确可靠。

结论:

实时定量 PCR 实验设计和数据分析可以采用相对定量和绝对定量两种方法,研究人员在设计实时定量 PCR 实验分析基因表达的时候首先要问的一个问题就是:数据最后会以一个什么样的形式得到。如果需要知道绝对的拷贝数,就必须用绝对定量的方法,否则只需要给出基因表达相对量就足够了。相对定量可能比绝对定量要更容易一些,因为它不需要作标准曲线。

本文所给出的公式对于每个用相对定量的方法分析基因表达差异的研究人员都足够了。下面,我们总结一下实验设计和评估中的一些重要步骤:

  选择一个内标基因。

  确定内标的有效性,确保它不会受到实验处理的影响。

  通过 PCR 扩增目标基因和内标基因 RNA 或 cDNA 的一系列梯度稀释模板确保它们的扩增效率相同。

最后通过 2 - △ CT 计算将统计数据转化成线性形式而不是原始 C T 值。

参考文献

  Murphy, L. D., Herzog, C. E., Rudick, J. B., Fojo, A. T., and Bates, S. E. (1990) Biochemistry 29, 10351–10356.

  Noonan, K. E., Beck, C., Holzmayer, T. A., Chin, J. E., Wunder,J. S., Andrulis, I. L., Gazdar, A. F., Willman, C. L., Griffith, B.,Von-Hoff, D. D., and Robinson, I. B. (1990) Proc. Natl. Acad. Sci. to a linear form using 2 2 C T more accurately depicts the USA 87, 7160–7164.

  Horikoshi, T., et al. (1992) Cancer Res. 52, 108–116.

  Heid, C. A., Stevens, J., Livak, K. J., and Williams, P. M. (1996) Genome Res. 6, 986–994.

  Winer, J., Jung, C. K., Shackel, I., and Williams, P. M. (1999) Anal. Biochem. 270, 41–9.

  Schmittgen, T. D., Zakrajsek, B. A., Mills, A. G., Gorn, V., Singer, M. J., and Reed, M. W. (2000) Anal. Biochem. 285, 194–204.

  Schmittgen, T. D., and Zakrajsek, B. A. (2000) J. Biochem. Biophys.Methods 46, 69–81.

  Chen, C. Y., and Shyu, A. B. (1994) Mol. Cell. Biol. 14, 8471–8482.

  Iyer, V. R., et al. (1999) Science 283, 83–87.

  Giulietti, A., Overbergh, L., Valckx, D., Decallone, B., Bouillon, R., and Mathieu, C. (2001) Methods 25, 386–401.

  Niesters, H. G. M. (2001) Methods 25, 419–429.


推荐
关闭