识别精度高达76.32%,浙大、之江团队用深度学习加速大规模药物发现和再利用
编辑 | 萝卜皮
大规模药物研发和再利用具有挑战性。确定作用机制 (MOA) 至关重要,但目前的方法成本高昂且通量低。
在这里,浙江大学、之江实验室以及斯坦福大学的研究人员介绍了一种通过分析线粒体表型变化来识别 MOA 的方法。
通过对线粒体形态和膜电位进行时间成像,研究人员建立了监测时间分辨线粒体图像的流程,得到了一个数据集,其中包含 570,096 张暴露于 1,068 种美国食品和药物管理局批准药物的细胞单细胞图像。
该团队开发了一种名为 MitoReID 的深度学习模型,该模型使用重新识别 (ReID) 框架和 Inflated 3D ResNet 主干。它提供了一种自动化且经济高效的靶标识别替代方法,可以加速大规模药物发现和再利用。
该研究以「Deep learning large-scale drug discovery and repurposing」为题,于 2024 年 8 月 21 日发布在《Nature Computational Science》。
线粒体形态、膜电位和氧化还原状态已被用于识别功能化合物或遗传扰动的影响;然而,过去的研究仅侧重于提取有限数量的形态特征,导致大量有助于改善目标识别的信息丢失。
为了解决这一限制,浙江大学、之江实验室以及斯坦福大学的研究人员在此引入了时间维度来评估暴露于具有不同作用机理的化合物后的线粒体形态和膜电位。
具体来说,研究人员生成了一个由 1,000 多种美国食品药品管理局 (FDA) 批准的药物治疗的线粒体表型数据集,涵盖 16 个时间点的 570,096 张单细胞图像。
传统的机器学习技术无法充分区分线粒体表型和 MOA 之间的关系,因为在识别时间数据的复杂性方面缺乏兼容性。
因此,该团队通过一种名为 MitoReID 的深度学习模型开发了一种基于线粒体分析的 MOA 识别方法。通过将大规模纵向线粒体动力学监测与深度学习方法相结合,研究人员成功建立了一种快速、自动化、无偏的预测化学物质 MOA 的方法。
深度学习识别MOA框架
MitoReID 框架由四个基本部分组成。
首先,建立一个强大的细胞损伤模型,并将其暴露于 1,068 种 FDA 批准的药物中,以观察应激反应。通过严格的高通量方法,特别关注线粒体形态和膜电位,收集时间序列图像,作为原始数据集的基础。
随后,在重新识别 (ReID) 框架内对这些图像序列进行了创新的深度学习模型 MitoReID 的训练。
在后续阶段,使用训练后的模型提取未见药物和天然化合物的特征。然后使用余弦距离将这些特征与 FDA 批准药物的特征进行匹配,并将与最接近的药物相关的 MOA 推断为预测。
最后,进行了体外生化实验,以验证未鉴定天然化合物的假设作用机理。
这个全面的概念框架提供了一种方法来观察细胞对各种 FDA 批准的化合物和天然物质的复杂应激反应,有可能产生新的候选药物并阐明以前未知的作用机理。
更高效更准确
经过评估,该算法能够将 477 种 FDA 批准药物准确地分类为 38 种已知的 MOA,并正确识别六种未知的 FDA 批准药物和数十种天然化合物的 MOA。
它在测试集上实现了 76.32% 的 Rank-1 和 65.92% 的平均精度,并根据线粒体表型成功识别了六种未经训练的药物的 MOA。
此外,MitoReID 还确定环氧合酶 2 抑制是茶中天然化合物表儿茶素的作用机制,并在体外成功验证。
MitoReID 表现出预测未见药物和天然化合物的 MOA 的潜力,这可能促进基于细胞器表型相似性的大规模药物发现和重新利用。
MitoReID 的一个突出优势是它能够捕捉全面的线粒体特征,超越了传统形态测量技术的能力。该模型自主学习并整合线粒体形状和时间动态等全局特征,无需…
论文链接:https://www.nature.com/articles/s43588-024-00679-4
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB。
识别精度高达76.32%,浙大、之江团队用深度学习加速大规模药物发现和再利用