关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

Genome research:不同RNA m5C甲基化修饰存在巨大差异

2020.8.18

  近年来,RNA修饰的研究已成为当今生命科学领域最前沿最热门的研究方向之一,不断有CNS的文章问世,m5C RNA修饰的分子机理研究越来越清晰,也不断有学者探寻如何更全面的获得贴近真实的m5C修饰的原貌。近期,来自德国的Frank Lyko和Mark Helm团队在GENOME RESEARCH(IF=11.922)上发表一篇题为“Statistically robust methylation calling for whole-transcriptome bisulfite sequencing reveals distinct methylation patterns for mouse RNAs” 的文章。在本文中,他们运用了综合的甲基化分析方法检测了小鼠胚胎干细胞中tRNAs、rRNAs和mRNAs的m5C修饰。

  文中指出,基于重亚硫酸盐转换的技术是检测m5C修饰的经典方法,而二代测序为此提供了检测转录组水平整体修饰图谱的机会。将m5C RNA修饰位点直接匹配到其天然序列上的方法目前仅由基于重亚硫酸盐处理的转录组测序提供。(Schaefer et al. 2009)。 这一测序原理是选择性脱氨基:把那些非甲基化的胞嘧啶(C)转化为尿嘧啶(U),然后通过二代测揭示甲基化相关序列多态性。

  在本研究中,研究者通过基于重亚硫酸盐转换的全转录组测序发现了所有已知的tRNA甲基化位点及两个以往未知的但是在28S rRNA中进化保守的位点。此外,他们发现mRNAs的甲基化位点稀疏或完全不甲基化。研究者称他们的方法可用于许多实验中描述m5C RNA甲基化模式探索,帮助我们更深的理解RNA生物学和人类疾病中m5C RNA甲基化的功能。

  1. 基于重亚硫酸盐转换的m5C RNA甲基化全转录组测序

  研究者建立了一套自己的完整分析流程,对小鼠胚胎干细胞进行了基于重亚硫酸盐处理的m5C RNA甲基化全转录组测序。他们将总RNA样本分为小RNA(<200nt)和长RNA(>200nt)的两个部分。基于是否要检测样本内的rRNA,一个去除rRNA的步骤被选择性地添加。长RNA部分还进行了进一步的片段化以满足Illumina测序流程。在进行深度测序之前,两个部分的RNA都用DNase处理,随后进过重亚硫酸盐转化,末端补齐加接头以进行cDNA文库构建。经过详细质控和测序比对数据库后,得到一系列原始数据。考虑到候选RNA甲基化位点的不完全转化,他们设置了一套专门的数据过滤条件。在甲基化peak calling阶段,每个样本都进行了泊松分布,并计算非转换率p值。最后,对3个生物学重复都进行了计算,并计算一个综合的非转换率p值。

  图1:基于重亚硫酸盐处理的m5C RNA甲基化全转录组测序示意图

  2. 对第一个文库原始数据进行mRNA相关甲基化位点分析

  研究者发现大部分的胞嘧啶的转化率都>90%.为了进一步分析那些未转化的胞嘧啶reads,他们设置了一个泊松参数λp,计为在每个覆盖范围层内(10X-1200X)未转化胞嘧啶的计数Nn;并计算了一个比率r=λp/(Nn+Nc),其中Nc为转化的胞嘧啶计数,N= Nn+Nc为覆盖范围层(coverage)。在随后的步骤中,他们比较了非转化率和非转化率高于λp/coverage的每个胞嘧啶位点的基础分布。在3,338,384个胞嘧啶中,53,510个未转化率高于或等于0.2,这和前人的发现一致。然而在Benjamini-Hochberg纠正多重测试后,53,510个胞嘧啶中只有266个符合p<0.05。大量的未符合p值的数据说明,在整个转录本组氨酸亚基测序数据集的分析中需要统计方法来衡量。他们的这套泊松参数方法在对3个生物学重复的数据都进行了非转化率数据过滤后得到肯定。

  图2:对小鼠ES细胞mRNA的测序结果数据分析

  3. 对泊松检验数据分析法的进一步衡量

  为了评估这一统计学分析方法的I型误差,他们还通过模拟几百个随机未转换胞嘧啶的实例来评估由泊松检验产生的假阳性的比例。结果就是这套分析方法能够可靠地(统计功率= 99.9±0.04%)检测到在20X以上的非转换率低至20%的位点。 在他们的测序数据集中,> 50%的胞嘧啶残基的覆盖度> 20X,因此显示出足够的统计功效。

  然而,尽管在进行了泊松检验方法后,一些候选位点依然不能被认为是真正的甲基化位点。为了进一步验证候选甲基化位点的可重复检出性,他们挑选了10个候选位点,这些位点有着最小的标准化p值,以及补充了4个额外的候选位点,他们的甲基化水平几近于1.0并且p值达到显著标准。这14个位点被用于扩增子重测序。结果表明这14个位点中有4个并没有发生甲基化修饰。这再一次证明有极低一部分候选甲基化位点有一定的假阳性。

  图3:进一步的数据分析

  4. LC-MS/MS检测mRNA的整体甲基化水平

  接下来,研究者用LC-MS/MS技术检测mRNA的整体甲基化水平。总RNA经过连续的两轮polyA-seleciton富集出mRNA,去除小RNA,连续两轮去除rRNA。每一步都取样进行RNA-seq看三种RNA的组成,并用LC-MS/MS看碱基改变。RNA-seq的结果显示这一分流过程富集到越来越多的mRNA。然而在最后一步富集仍然检测到了7.1%的rRNA,这可能是由于不完全的rRNA碎片去除。LC-MS/MS的结果说明随着富集的进行,m5C修饰剧烈减少,并且和测序观察到的rRNA去除密切相关。此外,他们没有检测到任何的mRNA 5-羟甲基化修饰。使用果蝇S2细胞进行同样的检测,得到相似的结果。这显然与前人的研究相悖,这一实验的结果也揭示mRNA的m5C甲基化修饰非常稀疏甚至是完全不甲基化。

  图4:LC-MS/MS检测mRNA的整体甲基化水平

  5. LC-MS/MS检测mRNA的整体甲基化水平

  接下来,研究者用LC-MS/MS技术检测mRNA的整体甲基化水平。总RNA经过连续的两轮polyA-seleciton富集出mRNA,去除小RNA,连续两轮去除rRNA。每一步都取样进行RNA-seq看三种RNA的组成,并用LC-MS/MS看碱基改变。RNA-seq的结果显示这一分流过程富集到越来越多的mRNA。然而在最后一步富集仍然检测到了7.1%的rRNA,这可能是由于不完全的rRNA碎片去除。LC-MS/MS的结果说明随着富集的进行,m5C修饰剧烈减少,并且和测序观察到的rRNA去除密切相关。此外,他们没有检测到任何的mRNA 5-羟甲基化修饰。使用果蝇S2细胞进行同样的检测,得到相似的结果。这显然与前人的研究相悖,这一实验的结果也揭示mRNA的m5C甲基化修饰非常稀疏甚至是完全不甲基化。

  图5:比较mRNA、rRNA、tRNA3种RNA的甲基化水平

  6. 运用泊松检验法检测m5C相关甲基化酶的影响

  研究者最后对RNA m5C酶特异性表征进行了检测。基于新开发的计算流程,以提供特定类型RNA的标准分析,并比较不同基因型之间的甲基化模式。他们按照存在或不存在tRNA甲基转移酶DNMT2,确定了对tRNA,rRNA和mRNA甲基化水平的影响。结果显示DNMT2是一个高度特异性的酶,DNMT2突变的一组数据显示,tRNA(Asp)、tRNA(Gly)和tRNA(Val)中C38位点的甲基化修饰缺失。rRNA的分析则揭示了28S rRNA中存在2个新的完全甲基化的胞嘧啶,即C3438和C4099。

  图6:散点图显示野生型和DNMT2敲除小鼠ES细胞中tRNA(A),rRNA(B),mRNA(C)的未转化胞嘧啶

  小结:本文确定了全转录组重亚硫酸盐测序为m5C RNA甲基化单碱基分析最为可靠方法,并表明tRNA,rRNA和mRNA上m5C甲基化模式存在巨大差异,预测其与不同RNA行使特定生理功能密切相关。


推荐
热点排行
一周推荐
关闭