将复杂的化学反应分解为基本反应有助于理解反应机制和设计反应途径。然而,这些基本反应涉及的中间和过渡态难以通过实验分离和表征。为了解决这个问题,通常要使用像密度泛函理论(DFT)这样的高通量量子化学计算来理解潜在的反应机制。这些计算通过构建全面的反应网络来完成。但是由于势能表面的复杂性,这些方法都需要经过大量繁琐的量子化学计算。
为解决这个问题,麻省理工学院的段辰儒和 Heather Kulik 团队开发了一个对象感知的 SE(3) 等变扩散模型,它能够生成反应物、过渡态和产物的结构组,同时满足所有的物理对称性和约束条件。通过提供反应物和产物,该模型在几秒钟内就能生成过渡态结构,而此前通常需要数小时的量子化学优化。生成的过渡态结构达到了与真实过渡态相比的 0.08 Å 均方根偏差的中值。
日前,相关研究以“Accurate transition state generation with an object-aware equivariant elementary reaction diffusion model”为题发表在《自然·计算科学》上,并被评选为封面文章,其中麻省理工学院的段辰儒博士是第一作者及通讯作者。此外,康奈尔大学博士生杜沅岂,麻省理工学院博士生贾皓钧以及麻省理工学院 Heather Kulik教授为该论文的共同作者。
研究背景
传统的过渡态(TS)搜索算法计算量大且难以收敛,导致成功率低并浪费计算资源。近年来,人们关注使用机器学习技术进行 TS 搜索,但这些方法在描述基本反应时并不遵守所有物理对称性,且需要进一步重建和优化。这些方法远未达到估算 TS 势垒高度所需的高精度,因此需要改进现有方法以实现高精度要求。
另一方面,扩散模型在多个物理科学领域中得到了应用,如有机分子生成、蛋白质-配体对接以及基于结构的药物设计。这些模型利用 SE(3) 等变图神经网络(GNN)作为评分函数,确保了 3D 对象(如分子或蛋白质)在欧几里得空间中的对称性,尤其适用于单个对象的系统。
然而,在化学和材料科学中,许多系统由多个对象组成,这些对象的相对位置并不影响系统的性质。例如,设计包含多个构建块的化合物(如金属有机框架)、具有相似化学但表现出不同属性的分子对(如蛋白质结合中的活性悬崖),以及涉及多个不同结构的化学过程(如化学反应)。
现有的扩散模型,虽然利用了 SE(3) 等变 GNN,但在处理这些多对象系统时存在局限性。它们无法完全满足这些系统所需的所有对称性和约束,因此需要进一步改进和优化。
针对以上问题,作者们提出了一种全新的方法,通过调整 SE(3) 等变 GNN,以适应包含多个对象的系统,确保满足各种对称性和约束条件。这些对称性涵盖了反应物或产物片段中原子之间的置换、片段之间的置换,以及每个片段的旋转和翻译。通过这一调整,可以成功地避免在过渡态搜索过程中所需的原子顺序映射和片段对齐步骤,仅依赖反应物和产物片段的 3D 几何形状来生成过渡态结构。
在扩散模型框架下应用这种“对象感知” SE(3) GNN,可以生成基本反应中的 3D 分子集合,因此称为 OA-ReactDiff。使用 OA-ReactDiff 预测的过渡态结构与真实结构非常相似,平均 RMSD 仅为 0.18Å,在单个 GPU 上 6 秒内即可完成。
OA-ReactDif 简介
扩散模型在正向传递过程中会向数据中添加噪声,而在反向传递过程中则会通过去噪网络来去除噪声。对于分子模型,为了尊重其对称性,去噪网络必须具有 SE(3) 等变性。然而,传统的 SE(3) 等变模型在处理具有多个相互作用对象的系统时,往往缺乏必要的对称性。
为了尊重所需的对称性,作者开发了一种具有对象感知的 SE(3) 等变 GNN。通过将这种网络应用于任何 SE(3) 等变模型,可以轻松地实现对象感知,而无需进行大量的修改。
一个基本反应包括反应物、过渡态(TS)和产物这三个单独的对象。进行 SE(3) 变换时,应该确保变换不会改变反应的性质。OA-ReactDiff 模型将基本反应视为反应物、TS 和产物结构的联合分布。它可以从头开始无条件生成,也可以根据条件进行生成,例如进行 TS 搜索。
OA-ReactDiff 所采用的基础模型 LEFTNet 是作者开发的一种 SE(3) GNN,它得能够在尊重所有物理对称性和约束条件的同时,学习并模拟化学反应。
训练 OA-ReactDiff
OA-ReactDiff 在 Transition1x 数据集上进行训练,该数据集包含了 10,073 个有机反应的反应物、过渡态(TS)和产物结构,这些结构是在 ωB97x/6-31G(d) 理论水平下计算的。每个反应涉及最多 7 个重原子(C、N、O),总原子数最多为 23 个。通过使用爬升图像 NEB 方法,可以确保获得准确的 TS 结构。
Transition1x 数据集中的 9,000 个反应被用于训练,剩余的 1,073 个未见过的反应则用于进行测试。在 OA-ReactDiff 中,分子由单热编码的原子类型和笛卡尔坐标表示,而坐标是进行扩散/去噪处理的。由于原子类型在反应中是守恒的,因此只有坐标需要处理。
OA-ReactDiff 不需要进行像原子排序或对齐这样的预处理,因为它对这类变换具有等变性。此外,它还可以区分手性分子。而且它对反应物和产物的顺序是不变的,不需要进行数据增强或结构优化,可以直接输出坐标。这些优势使得 OA-ReactDiff 成为一个端到端的模型,用于反应生成和过渡态搜索,无需其他额外步骤。
用置信度排名克服扩散模型的随机性
OA-ReactDiff 能够通过建模反应物、TS 和产物的联合分布,无条件地生成新的反应。然而,评估这些生成的反应却需要进行复杂的 DFT 计算,并可能引入偏差。因此这里使用已知的反应物-产物对来评估 OA-ReactDiff 的 TS 搜索能力。
在 3 个示例反应中,作者采样了 128 个不同的 TS 结构,其中许多结构具有单一的虚频率。经过优化后,他们发现多种不同的 TS 结构可以导致不同的反应物/产物构象。由于 OA-ReactDiff 的随机性,生成的 TS 结构是非确定性的。
为了解决这个问题,他们训练了一个置信度模型,以预测生成的 TS 结构是否为真实基本反应的概率。该模型成功地区分了 TS 结构,并始终将最高概率分配给最接近真实 TS 的结构。
如果没有置信度排名,随机选择 TS 结构可能会导致错误的连接/几何形状和不准确的预测反应速率。置信度模型虽然不能保证选择具有最低 RMSD 的结构,但却能够避免选择偏差较大的结构。
由 OA-ReactDiff 得到的高质量 TS 结构
作者通过 RMSD 评估了 OA-ReactDiff 与真实 TS 结构的结构相似性,测试了 1,073 个未见反应,这些反应来自 Transition1x 数据集。与传统的 DFT 计算相比,OA-ReactDiff 能够在平均 6 秒钟内生成 TS 结构,显著提高了计算效率。
对于每个反应随机选择的 40 个样品,平均 RMSD 为 0.183 Å,中位数为 0.076 Å。令人惊讶的是,超过一半的 RMSD 小于 0.1 Å,而三分之二的 RMSD 小于 0.2 Å。这些结果表明 OA-ReactDiff 能够准确预测 TS 结构。
有趣的是,即使在反应中原子数高达 15 的情况下,模型的表现仍然相似,这展示了 OA-ReactDiff 的扩展性。为了进一步提高预测的准确性,他们使用了一个置信度模型来推荐样本作为预测的 TS 结构。这种方法显著改善了平均和中值 RMSD,分别降至 0.129 和 0.058 Å。更关键的是,现在三分之二的预测 RMSD 小于 0.1 Å。
推荐器功能避免了生成与真实 TS 结构存在不正确连接或较大偏差的 TS 结构。随着运行次数增加,模型的性能得到系统性地提升,平衡了运行时间和准确性。这种推荐功能对于机器学习模型的端到端应用非常有用。
接近TS搜索所需的能量精度
在化学反应的研究中,除了获得精确的 3D 结构,另一个至关重要的任务是准确预测反应速率的势垒高度。这一指标对于 TS 搜索具有决定性的意义。为了评估 OA-ReactDiff 在预测势垒高度方面的性能,作者对其进行了详尽的测试。测试结果显示,预测和真实 TS 之间的电子能量差(即预测的势垒高度)与它们之间的 RMSD 呈现正相关性。
在使用 OA-ReactDiff 结合推荐器的情况下,预测和真实TS之间的绝对能量差 ΔETS 平均为 4.4 kcal/mol,中值为 1.6 kcal/mol。这意味着在 71% 的情况下,预测值与真实的势垒高度相差不到 3 kcal/mol。与 DFTB 方法相比,OA-ReactDiff 的表现更为出色,其平均绝对误差(MAE)为 16.1 kcal/mol。
无论是涉及多个反应物/产物的反应还是单一反应物/产物的反应,这个方法都表现出了相似的性能,证明了其广泛的适用性。值得一提的是,势垒高度对 DFT 泛函的选择并不敏感,因此使用其他泛函也可以获得相似的准确性。这为研究人员提供了更大的灵活性和选择空间。
总的来说,与传统的 TS 搜索方法相比,结合 OA-ReactDiff 和推荐器的方法在 RMSD 和势垒高度误差方面都表现出了显著的优势。随着 RMSD的增加,ΔETS 逐渐增大,这表明在给定的结构相似性下可以获得更准确的势垒预测。而使用置信度评分能够量化不确定性并平衡精度与 DFT 计算成本之间的关系。这为研究人员提供了一种有效的工具,以在精度和资源消耗之间做出权衡。
综上所述,结合 OA-ReactDiff、推荐器和 DFT-NEB 的混合方法为准确生成 TS 结构提供了一种高效且可靠的解决方案。
参考资料:
C. Duan*, Y. Du, H. Jia, and H. J. Kulik, “Accurate transition state generation with an object-aware equivariant elementary reaction diffusion model”, Nat. Comput. Sci., ASAP, https://rdcu.be/dtGSF, https://www.nature.com/articles/s43588-023-00563-7
声明:本文仅供科研分享,助力科学传播,不做盈利使用,如有侵权,请联系后台删除。