登Nature子刊,中科院计算所团队开发CarbonDesign,进行准确且稳健的蛋白质序列设计

大家好,我是ByteAILab,今天我将会和大家分享关于中国科学院计算技术研究所团队开发的蛋白质序列设计新方法CarbonDesign在《Nature Machine Intelligence》上发表的论文内容。

蛋白质是生物体内执行生物功能的基础元件,在催化、免疫和信号传递等生物过程中起着重要作用。


蛋白质序列设计是蛋白质结构预测的逆问题,即从给定的蛋白质三维结构出发,设计出能够折叠成为目标蛋白结构、具有目标蛋白功能的序列。这在药物设计、酶工程等领域具有重要应用。

CarbonDesign是蛋白质序列设计版的AlphaFold,在AlphaFold模型的基础上进行了算法改进,可以准确且稳健地设计蛋白质序列,适用于不同蛋白质设计场景,并能预测蛋白质突变的功能影响。

CarbonDesign 整体模型架构

CarbonDesign的核心是利用新颖的网络架构Inverseformer作为主链结构编码器,并利用马尔可夫随机场(MRF)模块作为序列解码器。Inverseformer反转了信息流,学习蛋白质结构到序列的映射。此外,CarbonDesign采用网络循环策略,引入蛋白质序列语言模型和多任务学习策略,提高了序列生成能力。

在RFdiffusion生成的de novo主链结构上评估CarbonDesign的性能

研究结果显示,在晶体结构、预测结构和扩散模型生成的主链结构上,CarbonDesign显示出准确且稳健的序列生成能力,在多种从头蛋白质设计场景中具有实用性。此外,CarbonDesign能够以零样本学习的方式来预测序列变异的功能效应。

CarbonDesign作为CarbonMatrix-蛋白质AI设计平台的一部分,旨在提供全方位的蛋白质设计解决方案。CarbonMatrix平台包括了CarbonDesign、CarbonNovo和AbX,分别用于蛋白质序列设计、端到端的蛋白质结构和序列设计以及抗体设计。这些软件将会在近期全部开源。

CarbonMatrix平台相关图示

CarbonMatrix团队将继续致力于AI蛋白质设计模型的开发,也欢迎业界人士使用其平台。论文链接如下:

希望以上内容能为您带来一些启发。如果您对此有兴趣,也欢迎访问GitHub地址进行更多了解:CarbonMatrix GitHub地址

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

登Nature子刊,中科院计算所团队开发CarbonDesign,进行准确且稳健的蛋白质序列设计

https://www.gptnb.com/2024/05/30/2024-05-29-auto5-4RDlbS/

作者

ByteAILab

发布于

2024-05-30

更新于

2025-03-21

许可协议