当前位置:首页 >娱乐 >蛋白质侧链预测新方法DiffPack:扩散模型也能精准预测侧链构象! 设计催化效果更强的酶

蛋白质侧链预测新方法DiffPack:扩散模型也能精准预测侧链构象! 设计催化效果更强的酶

2024-06-18 11:40:31 [百科] 来源:避面尹邢网

蛋白质侧链预测新方法DiffPack:扩散模型也能精准预测侧链构象!蛋白

作者:机器之心 人工智能 新闻 近日,质侧来自 Mila 的链预唐建团队提出了一种新的侧链构象预测方法 DiffPack。该方法使用扭转角空间中的测新侧链自回归扩散模型,与目前已知的扩散最优方法相比,在 CASP13 和 CASP14 上取得了大幅提升实现了超过 10% 的模型提升。

蛋白质由氨基酸经脱水缩合反应形成,也能预测可折叠为复杂的精准 3D 空间结构,是构象生物体内执行各种功能(催化生物化学反应、传递信号)的蛋白主要分子,而其中蛋白质的质侧侧链结构对其功能至关重要。侧链的链预化学性质和空间排列决定了蛋白质如何折叠,以及蛋白质如何与其他分子(包括其他蛋白质、测新侧链DNA、扩散RNA、模型小分子等)相互作用。这些相互作用可以是氢键、离子键、疏水相互作用和范德华力等。理解这些相互作用,可以帮助我们更好的寻找药物与受体的结合位点,设计催化效果更强的酶。因此,准确预测蛋白质的侧链构象对于理解蛋白质的功能和设计新的药物至关重要。

传统的蛋白质侧链构象预测算法(如 RosettaPacker)通常通过在能量函数定义的概率分布中采样得到蛋白质侧链构象,此类算法通常依赖于人为设计的能量函数,受限于能量函数设计的精准度。另一方面,尽管以 AlphaFold2 为首的一系列深度学习模型在蛋白质结构预测方面取得了比较大的突破,但其对侧链构象的预测通常依赖于端对端的学习,无法捕捉侧链构象的整体分布,因此准确度上受到了一定的限制。

蛋白质侧链预测新方法DiffPack:扩散模型也能精准预测侧链构象! 设计催化效果更强的酶

近日,来自 Mila 的唐建团队提出了一种新的侧链构象预测方法 DiffPack。该方法使用扭转角空间中的自回归扩散模型,与目前已知的最优方法相比,在 CASP13 和 CASP14 上取得了大幅提升实现了超过 10% 的提升,且仅需要 1/60 的参数量。此外,作者进一步验证了 DiffPack 能够给有效改进 AlphaFold2 的侧链预测结果。

蛋白质侧链预测新方法DiffPack:扩散模型也能精准预测侧链构象! 设计催化效果更强的酶

图片图片

蛋白质侧链预测新方法DiffPack:扩散模型也能精准预测侧链构象! 设计催化效果更强的酶


  • 论文链接:https://arxiv.org/abs/2306.01794
  • 代码链接:https://github.com/DeepGraphLearning/DiffPack

方法

过去的 AI 算法以端对端的方式从原子位置的均方根偏差 (RMSD)定义损失函数。尽管此类方法存在速度上的优势,但他们通常被端对端的建模方式所限制,无法捕捉蛋白质侧链构象的整体分布,倾向于生成侧链的 「平均构象」。DiffPack 基于扩散模型提出了一种新颖的侧链构象预测方法。通过对蛋白质侧链构象加入噪声并学习去噪过程,模型能够更准确地学习到蛋白质侧链构象的整体概率分布。

蛋白质侧链的构象通常较为复杂,如果直接使用空间坐标的扩散过程建模会引入过多的自由度从而增加问题的复杂性。同时由于蛋白质的侧链构象由至多四个扭转角(χ1, χ2, χ3, χ4)构成,研究人员选择将扩散过程定义在四个扭转角构成的扭转空间中,在前向扩散过程中引入非欧几里得噪声,同时通过针对蛋白质结构设计的图神经网络 GearNet 学习对四个扭转角的逆向去噪过程。

图片图片

在实验中,研究人员发现对四个扭转角的联合加噪过程会会产生偏差累积效应,从而降低预测的准确度。研究人员由此进一步提出了一种新颖的自回归扩散模型,将四个扭转角的联合概率分布分解为一系列条件概率分布,在每一个概率分布中引入扩散模型。通过将扩散模型与自回归过程结合,DiffPack 能够以很小的模型规模实现高精度的侧链构象预测。

图片

图片图片

实验

研究人员在包括天然主链结构和由 AlphaFold2 预测得到的非天然主链结构上进行了实验。DiffPack 在预测蛋白质侧链构象中超越了基于传统能量函数的方法和其他端对端的深度学习模型。表 1 总结了在 CASP13 中的实验结果,DiffPack 无论是在内部残基(82.7%)和表面残基(57.3%)上,都表现出了最高的角度精度。对于表面残基,其精度比之前的最先进模型 AttnPacker 提高了 20.4%。

图片图片

同样,DiffPack 在 CASP14 数据集的表现也优于其他方法(表 2),尽管没有将损失函数直接定义在原子位置上,DiffPack 在内部残基原子位置的均方根偏差精度上依然相比于之前的 SOTA 提高了 23%。

由于 AlphaFold2 等计算结构生物学技术的发展,当前人们的关注重心逐渐转移到非天然主链结构的应用上。因此研究人员将 DiffPack 进一步应用到有 AlphaFold2 生成的非天然主链结构,表 3 给出了包括 AlphaFold2 自身的侧链预测算法在内的不同算法在非天然主链结构测试集上的定量结果。DiffPack 在大多数指标上实现了最先进的水平,这说明了 DiffPack 可以进一步优化 AlphaFold2 预测的潜力。

图片图片

DiffPack 除了在对侧链构象的准确度上优于其他方法,其模型的总参数量要显著(3,043,363)少于此前的 SOTA 模型(208,098,163),这使得 DiffPack 成为预测侧链构象的更具计算可行性和可扩展性的解决方案。

总结

  • 研究人员基于扩散模型提出了一种新的针对蛋白质侧链构象的预测算法 DiffPack,DiffPack 将扭转空间中的扩散模型与自回归过程结合,能够更好地捕捉蛋白质侧链构象分布。
  • DiffPack 在天然主链结构与非天然主链结构的预测上都表现出了一定的优势,同时其模型规模要显著小于其他方法。
责任编辑:张燕妮 来源: 机器之心 模型性能

(责任编辑:时尚)

    推荐文章
    • 棠记控股(08305.HK)预计年度亏损不少于50万港元 毛利严重下降

      棠记控股(08305.HK)预计年度亏损不少于50万港元 毛利严重下降棠记控股(08305.HK)公布,惟与截至2019年12月31日止的综合盈利220万港元相比,集团预期于截至2020年12月31日止年度将录得综合亏损不少于50万港元。预期2020年度综合盈利下跌主要 ...[详细]
    • 人类的三大本质,注定了这游戏就得火

      人类的三大本质,注定了这游戏就得火来源:游戏研究社1月25日,《暗区突围》上线了全新大版本“导火索”。从玩法层面讲,新版本已开放普瑞森矿洞,未来还将解锁埃尔米拉矿区和全新载具等一大票内容。随着新版本的曝光,相关资讯、信息解读随之集中爆 ...[详细]
    • 天津“福彩嘉年华生肖票首卖式”启动

      天津“福彩嘉年华生肖票首卖式”启动彩市动态1月27日、28日,天津福彩连续两天在南开区鲁能城负一层举办“福彩嘉年华,生肖票首卖式”活动。活动现场有著名歌手及舞蹈表演助兴,用动听的歌声、激情的舞姿,点燃新春的热情;更有精心设计的魔术表演 ...[详细]
    • AI大爆炸,你准备好了吗?

      AI大爆炸,你准备好了吗?来源:36氪2024必将成为AI应用元年,AI即将赋能万物。 ...[详细]
    • 恒生科技指数跳水 科技股跌幅明显

      恒生科技指数跳水 科技股跌幅明显港股开盘后快速走低,其中,科技股跌幅明显,恒生科技指数一度跳水跌1.83%,恒指跌0.7%。恒生科技指数成分股中,美团、快手均跌超5%,腾讯跌近1%,阿里巴巴逆势上涨。美团上周五公布业绩显示,2020 ...[详细]
    • 24小时不打烊 银行理财争相开“夜市”

      24小时不打烊 银行理财争相开“夜市”“24小时理财不打烊,财富跟着转”“闲钱不闲置,下班也能买”……近期,光大理财、平安理财、招银理财、广银理财、宁波银行等多家银行、理财公司陆续推出“理财夜市”,延长部分现金管理类理财产品的交易时间,起 ...[详细]
    • 世界数字教育联盟在上海正式宣布成立

      世界数字教育联盟在上海正式宣布成立转自:红星新闻1月30日,以“数字教育:应用、共享、创新”为主题的2024世界数字教育大会在上海开幕。会议期间,世界数字教育联盟正式宣布成立。联盟发起方代表,中国教育国际交流协会会长刘利民向与会嘉宾介 ...[详细]
    • 全国古树名木保护管理一张图初步建成

      全国古树名木保护管理一张图初步建成【环保时空】    科技日报讯 记者马爱平)记者1月28日从国家林业和草原局获悉,第二次全国古树名木资源普查结果显示,我国普查范围内现有古树名木共计508.19万株,包括散生122.13万株和群状38 ...[详细]
    • 不符合快贷准入标准能恢复吗?要找到原因才能解决

      不符合快贷准入标准能恢复吗?要找到原因才能解决建行快贷能够为个人客户提供大额借款服务,满足借款人的大额消费需求,但并不是人人都能办下来的。有不少人在办理建行快贷时提示不符合快贷准入标准,会问不符合快贷准入标准能恢复吗?这要找到原因才能解决,这里就 ...[详细]
    • 国内大模型与GPT

      国内大模型与GPT1月30日,上海人工智能实验室发布了大模型开源开放评测体系司南OpenCompass2.0),同时在对部分主流大模型评测诊断的基础上,揭晓了年度大模型评测榜单,提到了国内大模型的优势与短板。根据评测, ...[详细]
    热点阅读