关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

一种全新肿瘤发生机制:增强子劫持

2021.6.04

  肿瘤细胞中有着大量的基因组结构变异(Structural Variation/SV),比如基因组的缺失、重复、倒位、异位等。一些很重要的结构变异已被证明和肿瘤的发生息息相关,并被用于肿瘤的分型与预后诊断,成为设计靶向治疗药物的重要依据。然而过去的研究大多数集中在SV介导的融合基因,比如由白血病中的费城染色体所形成的BCR-ABL融合基因。最近几年,作为一种全新肿瘤发生机制,增强子劫持(enhancer hijacking)开始引起了人们的关注。在此类癌细胞中,由于癌症基因组发生重组,本处于同一染色体远端甚至是源于不同的染色体上的增强子被SV转移到致癌基因的附近,通过3D空间上的折叠,激活或增强了致癌基因的高表达,从而导致了癌症的发生。

  迄今为止,由于没有准确的算法和系统性的研究,人们目前对增强子劫持的识别仅仅停留在个例,而且这些个例的发现主要依赖于已有知识和手工识别,没法在全基因组层面作出预测和发现。来自美国西北大学的Duane and Susan Burnham 讲席教授和癌症组学中心主任岳峰课题组及其合作者2018年发表于Nature Genetics的工作是世界首次使用染色质空间互作技术(Hi-C)在全基因组水平寻找肿瘤细胞里不同种类的SV(Nature Genetics |岳峰组等找到检测癌症基因组里的结构变异和三维结构变化的新方法——蓝斐点评)。根据与全基因组或光学测序的结果比较,该技术对SV的识别有极高的敏感性。尽管这项工作目前已经被广泛应用,但是找到SV之后的后续工作,比如癌症基因组的拼接和寻找致癌基因的调控元件,对寻找肿瘤的靶向显然更为重要。

  2021年6月2日,岳峰课题组在Nature Methods上发表了题为Genome-wide detection of enhancer-hijacking events from chromatin interaction data in re-arranged genomes的论文。该研究首次提出并实现了一个基于Hi-C数据的预测增强子劫持的完整计算框架(NeoLoopFinder)。这个框架的核心在于根据染色质互作和SV来构建肿瘤的局部基因组图谱,进而识别由SV介导的“新染色质环”(neo-loop)。在计算中,NeoLoopFinder提出了一整套专门针对癌症基因组优化的Hi-C数据标准化方法,包括更精准的全基因组拷贝数变异(copy number variation)识别,以及针对SV杂合性(heterozygosity)和异质性(heterogeneity)的判断。对于复杂SV(complex SVs),NeoLoopFinder基于染色质互作频率随基因组线性距离增长而衰减的规律,综合利用主成分分析(PCA)、回归分析和图论算法来对复杂SV进行装配。NeoLoopFinder是第一个完全基于Hi-C数据进行复杂SV装配的算法。作者们进一步比较了他们的结果,发现其得到得到的癌症局部装配与先前通过整合WGS、光学图谱和Hi-C得到的复杂SV装配间具有高度一致性。

294023_202106041624051.jpg

  在Neoloop的识别环节,NeoLoopFinder整合了该课题组最近开发的基于机器学习的染色质环(chromatin loop)识别方法Peakachu。相比传统的基于统计学的方法,Peakachu的优势在于能够在超低测序深度的Hi-C数据上识别染色质环。此外,NeoLoopFinder还内嵌了可视化模块,专门用于SV局部重排基因组(SV local assembly)上染色质互作和其他基因组(genomics)、表观基因组(epigenomics)数据的可视化。运行NeoLoopFinder可以直接输出高质量可以用在文章里的PDF图片。

  在这项工作里,作者们系统性地在50个癌症细胞系和病人样本中找到了上千个neo-loops,其中的大部分也是由绝缘子蛋白CTCF所介导的。更重要的是,大量的已知致癌基因,比如MYC、ETV1、PVT1、CDK12等等,位于这些Neo-loop的两端。这些基因大多具有癌症类型特异性,其表达与癌症病人的存活率紧密相关。通过整合ENCODE计划中的ChIP-Seq、DNase-Seq和RNA-Seq数据,该研究进一步在识别到的neo-loop中注释了增强子劫持事件(enhancer-hijacking events)。相比具有相同组织起源的正常细胞,这些有劫持增强子加持的致癌基因在癌细胞中表达被显著上调。为了验证方法的准确性,该研究在前列腺癌细胞系LNCaP中利用CRISPR/Cas9技术敲除了两个劫持增强子(hijacked enhancer),并显示靶标基因ETV1的表达量相应地也得到大幅下降。

  除了癌症,该研究还可以应用于其他的由SV引发3D基因组混乱的疾病。在本文中,作者们将NeoLoopFinder应用到利本伯格综合症(Liebenberg syndrome)和库克综合症(Cooks syndrome)中,成功识别出先前已被大量功能性实验所证实的增强子劫持事件。

  综上所述,NeoLoopFinder是基于全基因组染色质构象捕获数据来识别由SV介导的新染色质环的全新分析框架,可以广泛应用于各种由SV引发的疾病中,对理解癌症和部分发育性疾病的发生机理,寻找药物靶标具有潜在的重要作用。值得注意的是,这是岳峰课题组今年在癌症3D基因组中发表的第三篇高质量论文。课题组关于膀胱癌亚型分类的研究与今年4月发表于Genome Biology ,关于儿童胶质瘤的研究本周发表在Science Advances。NeoLoopFinder也为这两篇文章的分析做出了重要的贡献。

  美国西北大学的岳峰教授为该论文的通讯作者,实验室的博士后王小滔为该论文的第一作者。实验室博士后徐洁、张宝珍(现为北京大学肿瘤医院副教授)、侯晔,实验室博士研究生宋凡、吕慧珏参与了该研究。

  对岳峰课题组感兴趣的同学可以参观实验室网站:http://yuelab.org/。如有兴趣加入,可以直接和岳峰教授联系。


推荐
关闭