关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

Nature子刊:省时,省钱,又精准!药物研发AI法开创

2023.10.24

  中国科学院上海药物研究所郑明月课题组在 Nature 子刊 Nature Computational Science 上发表了题为:Computing Relative Binding Affinity of Ligands Based on a Pairwise Binding Comparison Network 的研究论文。

446158_202310241134031.jpg

  该研究提出了一种先导化合物优化的人工智能方法——PBCNet(Pairwise Binding Comparison Network)。该方法采用孪生图卷积神经网络架构,通过比较一组相似配体的结合模式差异来预测二者之间的相对结合亲和力,可以较好的兼顾计算速度和精度。此外,研究团队还开发了易于操作的图形界面网络计算服务(https://pbcnet.alphama.com.cn/index)。

  近年来,人工智能技术已逐渐成为药物研发领域中重要的技术手段之一。基于已知的结构和活性数据,如何引入合理的关系归纳偏置使得AI模型可以更有效的提取其中蕴含的物理化学知识和分子相互作用规律,是开发先导化合物优化方法的关键。在PBCNet中,模型采用了一种孪生网络架构(图1),可以较好的消除不同来源或实验测定条件下结合亲和力数据中存在的系统误差;考虑到分子间非键相互作用往往服从严格的几何先验,模型将原子之间的距离和化学键之间的角度信息编码作为注意力偏置项,有助于分子间相互作用信息的交互;此外,相对于二维拓扑图,模型同时引入距离和角度信息得到三维分子图,可以更全面的描述了蛋白-配体之间的分子结合信息。

446158_202310241134033.jpg

  图1:PBCNet网络主体框架。A. 信息传递阶段,实现配体与蛋白质分子之间相互作用的信息交互,并获得配体原子级别的表征信息;B. 读出阶段,获取配体分子级别的隐空间表征,并实现成对配体之间的信息交互;C. 预测阶段,配体分子对表征经过两支独立的3层前馈神经网络,分别输出:(1)两个配体分子对在该蛋白体系下的∆pIC_50预测值y^((i,j) );(2)第一个配体分子的结合亲和力高于第二个配体分子结合亲和力的预测概率p^((i,j) )。

  研究团队设计了多种测试场景,对包括PBCNet在内的多种先导化合物优化方法进行了性能比较。在零样本学习方面, PBCNet的排序能力和预测精度均显著优于Schrödinger Glide、MM-GB/SA和多个近期报道的深度学习模型,在部分测试体系上的误差已接近于化学精度;在小样本学习方面,仅使用少量的结构活性数据对模型进行微调后PBCNet的排序性能已经可以接近或超过Schrödinger FEP+(图2),并且在计算速度方面相对FEP+有多个数量级的优势。对比结果显示,使用PBCNet可以使先导化合物优化项目平均加速约4.7倍,平均节省约30%的资源投入。此外,模型在原子和官能团水平的可解释性分析也反映了PBCNet预测结果的合理性。

446158_202310241134032.jpg

  图2:小样本学习中PBCNet的性能随微调样本量(已知活性化合物数量)的变化趋势。x轴表示微调样本的数量,y轴表示PBCNet的预测性能,蓝色虚线为文献报道的Schrödinger FEP+的预测性能。误差线表示10次独立运行的标准偏差。

  上海药物所研究生虞杰和苏州阿尔脉生物科技有限公司李召军博士为论文共同第一作者。上海药物所郑明月研究员、罗小民研究员、博士后李叙潼为论文共同通讯作者。


推荐
热点排行
一周推荐
关闭