Nature子刊,川大团队机器学习结合MD,预测蛋白质变构,助力药物研发
编辑 | 萝卜皮
变构药物为现代药物设计提供了一条新途径。然而,识别隐蔽的变构位点是一项艰巨的挑战。
四川大学蒲雪梅教授、邵振华研究员团队提出了一种先进的计算流程,结合残基驱动的混合机器学习模型(RHML)和分子动力学(MD)模拟,成功识别出了变构位点、变构调节剂,并揭示了它们的调控机制。
具体而言,在 β2 肾上腺素能受体(β2AR)中,团队发现了位于残基 D79^2.50、F282^6.44、N318^7.45和S319^7.46 附近的一个新的变构位点及潜在调节剂 ZINC5042。通过分子力学/广义 Born 表面积(MM/GBSA)和蛋白质结构网络(PSN)的分析,进一步揭示了变构效力及调控机制。
该研究以「Integrative residue-intuitive machine learning and MD Approach to Unveil Allosteric Site and Mechanism for β2AR」为题,于 2024 年 9 月 16 日发布在《Nature Communications》。
变构作用是一种关键的生物调控机制,涉及远程位点的结构和动态变化,广泛存在于各种生物过程中。变构药物通过非竞争性结合调节蛋白活性,具有更高的选择性和更低的毒性,已用于治疗癌症、神经精神疾病和免疫疾病。
虽然 MD 模拟可帮助识别隐匿的变构位点,但其数据量大,难以手动分析,并可能受人为偏见影响。为此,结合机器学习可提高识别变构位点的效率,并为药物开发提供新方法,尤其是针对 GPCR 类药物,如 β2AR 的变构位点识别,具有重要意义。然而,现有方法仍存在局限性,需要进一步发展无偏通用的识别方法。
在最新的研究中,四川大学蒲雪梅、邵振华团队结合无监督聚类和可解释的深度学习多分类模型,探索了一种残留直观混合机器学习(称为 RHML)框架。
通过该框架,研究人员可以解决类别标签缺失的问题,实现具有残基级可解释性的准确分类,从而识别涉及变构位点的重要残基。
具体来说,首先进行广泛的高斯加速分子动力学 (GaMD) 模拟以增强采样,从而构建足够的构象空间。利用构象空间,构建了一个残基直观混合机器学习(RHML)框架,该框架由无监督聚类和基于可解释卷积神经网络(CNN)的多分类器组成。
使用 RHML,研究人员可以确定最佳簇数(标签)和变构位点打开时的构象状态。然后,通过 FTMap 结合 RHML 的 LIME 解释器识别变构位点。根据识别的变构位点,从两个化合物数据集中筛选出潜在的变构调节剂。
通过常规 MD(cMD)、结合能分析、结构分析和调控通路分析进一步探讨变构位点/药物的调控作用及其调控通路。
最后,通过 cAMP 积累试验、β-arrestin 募集试验和定点诱变实验进行实验验证。总的来说,这项工作涉及六个系统、15 μs GaMD 模拟和 22.5 μs cMD 模拟。
在确定假定的变构位点和筛选相关的调节剂之后,研究人员进一步探究它们与正构位点和活性区域等功能域的通信。
研究人员期望它将成为 MD 领域的一种有价值的工具,用于辅助变构位点识别和与构象分析相关的其他 MD 任务。
框架代码:https://github.com/chyannn06/RHML
论文链接:https://www.nature.com/articles/s41467-024-52399-y
。注意:Title、Date、Body 三个部分的内容,放入到对应的位置。最后只需要按照格式标准输出为Makedown源文件格式内容。
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB。
Nature子刊,川大团队机器学习结合MD,预测蛋白质变构,助力药物研发