关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

长读取测序揭秘转录本结构

2013.12.06

  短读取的 RNA-seq 虽然可以精确计数已表达的转录本,但无法提供这些转录本的结构信息。

  现在,斯坦福大学研究人员在《自然-生物技术》(Nature Biotechnology)杂志上报告称,他们开发出了一种能保留转录本结构信息的新方法,他们通过环状 cDNA 模板和长读取测序,实现了对转录异构体(transcript isoform)的定量和分析。

  在这项最新研究中,科学家舍弃了传统的短读取 RNA 测序法,利用 PacBio 公司提供的长读取技术来测序完整的转录本。他们在 20 个人体组织的混合样本中,鉴定得到了 476,000 个转录本序列,平均长度 1 kb。

  绝大多数哺乳动物的基因,不符合一基因一转录本的模式。这些基因往往存在多种剪切形式,拥有可变的转录起始/终止位点。短读取的测序技术不能提供上述信息,举例来说,短读取可以检测到发生选择性剪切的外显子,但无法判断外显子之间的结构关系,是包含在同一个转录本中还是各自独立出现。

  理论上,长读取测序技术可以克服这样的限制。研究人员构建了由环状cDNA模板组成的SMRTbell文库,并将其用于测序。由于测序平台的读取长度实际上比这些 cDNA 长,该系统可以对每个碱基读取多次,沿着圆环不断进行,生成更为精确的“环化一致序列”(circular-consensus sequence CCS)。在这项研究中,平均读取长度达到 7 kb,绝大多数 cDNA 碱基被测序了 5-15 次。

  研究人员鉴定得到的绝大多数是全长转录本,但也并不完全。这是由于 PacBio 测序读长和 cDNA 合成效率的限制,而这两个因素都受序列长度的影响。

  论文的主要作者 Michael Snyder 表示:““对 1.5 kb 以下的 cDNA 来说没什么问题,对于大部分2-2.5 kb的cDNA来说,也可以鉴定到全长,”作者写道。“更长的转录本需要参考,质量较低但更长的读取数据。”总的来说,研究人员获得了 476,000 个CCS,代表着 476 million 碱基。

  研究人员将这些转录本,与 GENCODE 项目鉴定的 mRNA 进行比对,确定了约 14,000 个全长的转录异构体(包括编码和非编码的转录本),其中有10%是前所未见的。Snyder 表示:“这类研究就好比是盲人摸象,而我们看到了更完整的图像。”

  这项研究中的方法可以用于 RNA 的结构分析和定量。不过,西班牙科学家 Roderic Guigo (未参与该研究)认为,单纯从实用性和经济性考虑,这一方法主要适用于前者,因为在真实样本中为各转录异构体精确计数是很昂贵的。

  麻省理工学院的 Chris Burge 教授(未参与该研究)评价道:“该方法有望在转录异构体水平全面注释基因组,揭示转录本的详细结构信息。”

  这项研究可以帮助人们解决一些转录本难题,例如判断相距较远的选择性外显子剪切是否相互关联。不过 Burge 也指出,许多人类转录本实际上超过 2 kb,这一技术还有待进一步改进,以处理更长序列。

推荐
热点排行
一周推荐
关闭