关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

eLife:新方法来识别癌症发生过程中的突变标签

2021.4.02

  确定癌症突变的原因是当代癌症研究领域科学家们所面临的基本挑战之一,不同的突变过程会诱导不同类型的DNA突变,从而就会提供相应的突变特征来帮助解析癌症的病因,在评估基因组数据时研究人员最广泛使用的特征就是基于未监督的模式,随后才能追溯到与癌症的某些特征相关。日前,一篇发表在国际杂志eLife上的研究报告中,来自约翰霍普金斯基墨尔癌症中心等机构的科学家们通过研究成功利用机器学习技术来检测癌症患者机体的突变特征,这一算法优于当前的标准分析手段,同时还揭示了与肥胖相关的新型突变特征;如今癌症预防研究者预测,肥胖正在成为美国和大多数西方国家导致人群癌症发生的最重要的生活方式因素。

图片来源:https://elifesciences.org/articles/61082

  研究者Cristian Tomasetti博士表示,突变特征非常对于当前癌症研究非常重要,因为其能让我们看到潜在风险因素所留下的迹象,比如衰老、吸烟、饮酒、紫外线以及导致癌症发生的BRCA遗传性突变等。研究人员开发的新技术能利用称之为机器学习的人工智能应用(SuperSigs),其通过计算机算法来访问并分析相关数据,分析突变特征来揭示诱发癌症的因素所产生的遗传性效应。这类算法被归类为“监督”状态(supervised),因为其在算法的训练过程中能将已知的暴露因素纳入到对癌症的遗传分析中去;用于评估基因组数据的最广泛使用的突变特征则被归类为“非监督”状态(unsupervised),因为其并不会考虑已知的暴露因素,相反,其注意到了模式的变化并能将其与暴露因素相关联起来;此外,这种新方法还能允许研究人员使用监督和非监督的方法,控制或阻断已知的致癌物暴露所产生的影响,并能深入探索潜在已知因素所产生的可能性影响。

  研究人员发现,这种新型的监督技术在预测准确性方面优于非监督的方法,在监督方法下,曲线下面积(AUC)中位数为0.73,对所有其他因素的曲线下面积中位数为0.90;而非监督方法的两个中位数则分别为0.57和0.77。研究者Bahman Afsari博士说道,AUC为0.5或低于0.5意味着该方法并不比纯偶然性要好,我们所能得到的最高值为1。而且文章中,研究人员还揭示了与肥胖患者癌症发生相关的第一个突变信号,这就为阐明肥胖和癌症起源相关的突变机体提供了一定的证据。

  肥胖被认为是导致癌症发生的最重要的生活方式因素,但目前研究人员一直并不清楚其诱发癌症的分子机制,由于肥胖患者所发生的癌症通常并不会出现突变数量的增加,因此有些研究者就认为机体肥胖增加癌症风险的机制或许并不是通过突变来介导的,而本文研究表明,至少部分是通过突变来影响的。同时研究者还表示,背后的潜在因素或许并不总是会对所有组织产生相同的突变效应,这一发现与非监测方法的假设恰恰相反。

预测突变特征的监督方法流程图

图片来源:Bahman Afsari, et al. eLife (2021). DOI:10.7554/eLife.61082

  衰老会在不同组织中产生不同的突变特征,吸烟和多种其它环境暴露也是如此;此外,在肺部,衰老的特征和吸烟的特征并不相同,但在其它组织中,吸烟的特征与衰老的特征就较为相似,这就表明,炎症或许就是其主要机制了。文章中,研究人员还证实了随机突变在癌症发生过程中所扮演的关键角色,随机突变及在DNA复制期间其所发生的正常错误。研究者Tomasetti解释道,每次当细胞分裂时,其都要复制DNA,当复制和修复及其复制出了数十亿个碱基时就会出现错误;据估计,每次细胞分裂时DNA都会发生3-6次突变;而导致癌症发生的突变的主要来源似乎是这些内源性的过程,这与遗传缺陷基因和有害暴露似乎无关。

  综上,在这种名为SuperSigs的新型算法的帮助下,研究人员发现,在所有肿瘤类型中,癌症患者机体中69%的突变都可以归因于随机发生的突变,而研究者还需要投入更大的精力和资源来关注如何进行癌症的早期诊断。如果无法避免癌症的发生,那么要做的就是在癌症发生前及时发现它,如果能在早期阶段及时发现癌症,那么研究人员就能有效及时挽救患者的生命。

推荐
热点排行
一周推荐
关闭