快多个数量级,清华更高精度、更泛化的深度学习电子结构计算方法

ScienceAI

编辑 |KX

两年前,清华大学物理系徐勇、段文晖研究组开发出高效精确的第一性原理电子结构深度学习方法DeePH,可极大加速电子结构计算。

近日,该团队开发了一种准确而有效的实空间重构方法(real-space reconstruction),将 DeepH 方法从原先仅支持原子基组推广至适用于平面波基组,使得 DeepH 方法可与所有密度泛函理论(DFT)程序兼容。而且,该重构方法比传统的基于投影的方法快几个数量级。

这给深度学习电子结构计算方法带来了更高的精度和更好的泛化能力,并打通了其利用电子结构大数据作深度学习的通道。

相关研究以「Generalizing deep learning electronic structure calculation to the plane-wave basis」为题,于 10 月 3 日发布在《Nature Computational Science》上。

论文链接:https://www.nature.com/articles/s43588-024-00701-9

DeepH 成功与局限性

近年来,从头计算与 AI 相结合取得了显著进展。这大大扩展了理论和计算材料研究的范围,达到了前所未有的精度和效率。

深度学习方法 DeepH 取得了巨大的成功,在比传统 DFT 方法快多个数量级的速度下仍能保持亚毫电子伏的精度。

然而,此类方法只支持局域原子轨道 (AO) 基组下的 DFT 程序,而完全不兼容使用平面波 (PW)基组的 DFT 程序。事实上,平面波基组相对原子轨道基组有其独特的优势,如容易收敛、精度高、应用更广泛等,因此将 DeepH 方法推广至平面波基组对深度学习电子结构计算的未来发展具有重要的意义。

比传统方法快几个数量级

为了解决以上问题,清华研究团队提出了一种基于 PW DFT 结果的实空间重构方法来重构 AO 哈密顿量。该方法比直接投影 PW 哈密顿量或波函数的传统方法快几个数量级。

此外,研究表明,使用该方法生成的 AO 哈密顿量不仅可以很好地再现 PW 电子结构,而且非常容易被神经网络模型学习。因此,解决了 PW 基下的深度学习 DFT 哈密顿量的关键问题。新方法的高精度和高效性有利于构建更通用、更准确的深度学习电子结构计算方法,这不仅使它们能够为更广泛的科学界所使用,而且极大地提高了它们在一般应用中的适用性。

图 1:PW 基下的深度学习 DFT 哈密顿量的思想及其在旋转双层石墨烯中的应用。(来源:论文)

将 PW 汉密尔顿量转换为 AO 基组的三种方法

该方法的实际工作流程为:一组小型非扭曲结构的 PW DFT 结果用于在 AO 基下重构汉密尔顿量。然后可以推广在这些重构汉密尔顿量上训练的神经网络来预测大型扭曲结构的汉密尔顿量。

PW 汉密尔顿量和 AO 汉密尔顿量实际上是在不同基组下表达的相同物理量。原则上,一旦有了 PW 汉密尔顿量

在此,研究人员简要讨论了将 PW 汉密尔顿量转换为 AO 基组的三种方法。

投影(projectio)方法被广泛用于弥合 PW 和 AO 之间的差距。其最初是为了评估 AO 基组的质量而开发的,投影方法可以修改为直接将哈密顿量从 PW 基转换为 AO 基:

这里,PW 基在 Born–von Kármán (BvK) 超晶胞中被归一化:

方程 (1) 被称为Hk(G, G′) 投影法

如果得到了 PW 哈密顿量的特征值 εnk 和波函数 |ψnk〉,则方程 (1) 可以进一步写成:

方程 (2) 被称为ψnk(G) 投影法。

虽然方程 (1) 和 (2) 是将 PW 哈密顿量转换为 AO 基的直接方法,但它们的计算效率较低。此外,它们都相对于系统中的原子数量以立方比例缩放,这限制了它们的应用范围。

事实上,可以利用实空间中的局部性来大大加快计算速度。原子单位下的实空间中的哈密顿量为:

其中,各个项分别对应于动能、Hartree 势、交换关联势以及伪势的局部和非局部部分。本研究仅考虑交换和关联的半局部函数。方括号中的三个项称为总有效局部势:

该方法称为实空间重构方法。

尽管它们在理论上是等效的,并且在收敛时会产生相同的结果,但所提出的实空间重构方法比前两种基于投影的方法效率高得多。

两个研究案例

应用于扭曲双层石墨烯

深度学习 DFT 汉密尔顿量方法最显著的能力是神经网络模型可以在小结构上进行训练,并推广到预测更大结构的汉密尔顿量。

在双层石墨烯的研究中,训练集由 300 个 4 × 4 双层石墨烯超晶胞组成,这些超晶胞具有不同的堆叠和每个原子位置的随机扰动。研究人员在根据 PW DFT 结果重建的 AO 汉密尔顿量训练神经网络模型后,可以使用该模型系统地研究具有任意扭曲角度的莫尔扭曲超结构。

首先,在训练集的一个结构上对重建的哈密顿量进行基准测试,将其能带结构与使用 PW 计算的能带结构绘制在一起。如图 1c 所示,两个能带结构非常吻合。

在训练神经网络模型后,用它来研究众所周知的「魔角」扭曲双层石墨烯,θ = 1.08°,莫尔超晶胞中有 11,164 个原子。有了深度学习 DFT 哈密顿量方法,计算成本可以大大降低。如图 1d 所示,与 PW DFT 基准相比,在重建的 AO 哈密顿量上训练的神经网络能够给出非常准确的预测,误差仅为几毫电子伏。

此外,当使用从 PW DFT 输出重建的 AO 汉密尔顿量训练神经网络时,预测的能带结构(图 1d 中的 PW-NN)与 Lucignano 等人的 PW DFT 结果相比,与使用 AO DFT 计算的汉密尔顿量(图 1d 中的 AO-NN)训练神经网络的情况相比,具有更好的一致性。

这表明与 PW DFT 接口的深度学习汉密尔顿量确实可以给出更高精度的结果。这种高精度与 PW 方法的灵活性和广泛适用性相结合,将大大增强深度学习从头计算的能力,并将对未来的研究大有裨益。

应用于双层 MoS2

接下来,在双层 MoS2系统研究中比较了三种方法。首先,研究人员在由六个原子组成的 AB 堆叠双层晶胞上测试了重构方法,从重构的 AO 哈密顿量获得的能带结构与 PW DFT 结果非常吻合。然后,绘制了三种不同方法给出的能带结构,它们几乎相同,只是 ψnk(G) 投影方法给出的能带结构与其他两种方法略有不同,因为在方程 (2) 时仅使用了有限数量的能带。

图 2:应用 PW 基下的深度学习 DFT 哈密顿量研究扭曲双层 MoS2。(来源:论文)

然后,进一步比较了三种方法的计算时间。正如预期的那样,两种基于投影的方法显示出大致的立方缩放。它们甚至比完全自洽场计算更耗时。相反,由于 AO 基的局部性,实空间重建方法实现了线性缩放,并且可以比投影方法快几个数量级。

研究人员表示:「我们工作的一个直接影响是,使深度学习电子结构方法适用于那些已经熟悉 PW 方法但在 AO DFT 方面经验较少的人。另一个有前途的未来应用是,建立通用的深度学习模型,可以处理不同类型的材料并准确预测它们的电子结构。」

更新于:4天前