关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

中国首发纳米孔RNA直接测序揭示其在全长转录本中的作用

2019.5.27

  近日发表在RNA Biology上的研究中,来自中国科学院北京生命科学研究院、动物研究所及中国科学院大学等多家单位的科学家们首次通过5’-Cap捕获法对蝗虫的 RNA直接测序,揭示了Piwi 外显子化模式的广泛建立以及蝗虫转录组中的转座子(TEs)对RNA剪接的重要作用。

  转座子(TEs)在后生动物物种中表现出广泛的转录活性,它们的表达受到Piwi 蛋白通过转录沉默和转录后沉默两种模式的限制。TEs插入到内含子中被剪切机制识别,当做外显子添加到RNA转录本中的过程被称为外显子化,外显子化TEs包含许多剪接供体和受体位点,这有助于形成可变剪切转录本。插入宿主基因的TE外显子能够生成新的外显子可变剪接,这些新的可变剪接可能作用于新的基因,但很少有在全基因组规模上进行TEs的转录本研究,这主要由于短读长测序技术不能够精准组装转录组或者读取重复区域。

  文章中提到:

  准确测定全长RNA转录本序列是转录组研究的基础,短读长高通量RNA测序曾是研究真核转录本最流行的方法,它为基因结构的鉴定、新亚型、选择性剪接和选择性多聚腺苷酸化提供了重要的工具。然而,目前基于cDNA合成的转录方法受限于第一条链合成过程中,由于转录物的降解和逆转录酶的自然效率降低而导致基因结构的5‘端表达不足,因此短读长测序技术的缺陷限制了其在复杂转录本事件如重建包含TE序列的转录本异构体等的应用;此外,短读长测序基于聚脱氧胸苷引物或者随机六聚体引物,接下来是cDNA的合成。在这一过程中,逆转录或扩增可引入偏倚,与总mRNA混合物相比,PCR扩增文库的复杂性有降低的趋势,且PCR 扩增重复序列容易生成如重组或者嵌合体的PCR介导伪迹。

  最近开发的长读长测序技术进行cDNA全长测序的方法基于模板转换反应,依赖于在逆转录酶到达RNA5’末端时,添加非模板化的多胞嘧啶尾,这种方法同样有不足之处,包括模板转换寡核苷酸时引发非特异性,产生人工嵌合的cDNA,将含有poly-A尾的降解RNA转化为cDNA等。除此之外,包含在这种测序方法内的反转录由于TEs重复序列之间的模板切换,同样会产生剪切位点伪迹。

  因此基于cDNA合成的转录组测序方法对含有TE序列的RNA转录组测序具有局限性。

  纳米孔测序技术是由英国Oxford Nanopore Technologies公司研发的新一代单分子长读长测序技术。其独特优势在于,它是一种基于电信号的测序技术,无需通过检测光或者荧光信号来实现碱基序列的读取。可以实现对原始DNA或RNA模板进行直接、准确的测序。对于RNA,它能够用于表征全长转录本,识别碱基修饰,以及对异构体、剪接变体和融合转录本进行量化和分析,且无测序偏好性。

  飞蝗(Locusta migratoria)基因组较大,高达6.5Gb,其中转座子(TEs)序列占比高于65%,且大部分具有转录活性。因此,飞蝗可作为研究大型基因组TE结构和功能的理想模型。该研究组之前用短读长RNA数据中鉴定出蝗虫转录组的105个TEs,发现其中只有7个是全长形式的TEs。因此研究组通过 5’-Cap捕获的方法富集全长RNA转录本,5’-生物素化的RNA转录本通过耦合的链霉亲和素免疫磁珠捕获,通过Nanopore对RNA直接进行测序,结果表明

  1. 5ʹ-Cap捕获方法可富集全长RNA转录本:RNA转录本5ʹ-末端合成的RNA接头(分为短接头文库和长接头文库)用作序列标签评估RNA转录本的完整性,短接头文库和长接头文库分别产生457,470和269,712条高质量reads。

  2. 大量的RNA转录本包含外显子化的TEs:以最长的RNA转录本作为每个转录本单元的代表序列,在60,908条代表序列中,51.88%(31,599)至少包含1个TE衍生序列,TEs序列长度占整个蝗虫转录组的19.94%。

  3. Piwi 的表达影响包含TE衍生序列的RNA转录本的长度:80%以上包含TE衍生序列的RNA转录本被认为是蝗虫的转座子,大量的转座子随着Piwi 的沉默表达量上调,RNA干扰的Piwi 表达对蝗虫转录组中编码基因的表达有重要影响。

  文章最后提到:与短读长基于组装的测序数据相比,纳米孔长读长测序显示了全长转录组测序应用上的优势,为RNA测序提供了无需组装片段来解析全长转录组的机会。

  参考文献:

  https://www.tandfonline.com/doi/full/10.1080/15476286.2019.1602437


推荐
热点排行
一周推荐
关闭