從薛定谔方程的問世開始,第一性原理電子結構計算就成為了自然科學研究的重要方法,尤其是對物理學、化學和材料學的研究起到了重要的推動作用。對物質電子結構的精确求解意味着人們可以預測基于電磁相互作用力的系統的宏觀性質,因此,基态波函數能夠表征一個體系最根本的性質,是發展電子結構計算方法的重中之重。其中變分蒙特卡洛(Variational Monte Carlo, VMC)和擴散蒙特卡洛(diffusion Monte Carlo, DMC)等量子蒙特卡洛(Quantum Monte Carlo, QMC)方法是電子結構計算方法中最精确的代表者之一。然而,傳統的VMC方法和DMC方法都有局限性,前者結果嚴重依賴于人為設定的波函數拟設,後者則受困于“符号問題”導緻的試探波函數的節點問題。近些年,得益于深層神經網絡等機器學習技術的發展,采用神經網絡作為多體電子波函數的拟設并結合VMC的電子結構計算方法展現出了非常強的潛力,是一種能夠通過非監督式機器學習逐漸逼近多電子體系基态的方法。然而,神經網絡龐大的參數量帶來的漫長收斂過程和昂貴計算代價使得機器學習量子蒙特卡洛在大型體系上的應用依然具有巨大的挑戰性。
近日,beat365官方网站凝聚态物理與材料物理研究所陳基研究員課題組與字節跳動研究部任維絡博士等合作,将深度學習神經網絡波函數方法與DMC方法相結合,開發了一個新的GPU友好、可高度并行化的神經網絡DMC方法,大幅提升了分子體系電子結構總能計算的精度(圖1)。相關研究成果以“以神經網絡擴散蒙特卡洛逼近分子基态”(Towards the ground state of molecules via diffusion Monte Carlo on neural networks)為題,在線發表于《自然·通訊》(Nature Communications 2023, 14, 1860)。

圖1.a, VMC方法可以将波函數優化至接近基态,但由于函數模型表達能力有限,其精度存在一個上限。DMC方法通過虛時演化的方法将波函數向基态投影從而得以突破這一精度上限。b,構建一個滿足費米子交換反對稱性的神經網絡函數模型從而可以表示多體電子波函數。c, GPU友好、可高度并行化的DMC算法以及算法中遊走子的随機擴散動力學簡單示意圖。d, DMC算法中的三個重要步驟:遊走子的擴散、繁衍和湮滅。
圖2展示了神經網絡DMC計算在一系列體系上的結果的優越性。神經網絡DMC方法在效率、精度上相較于已有方法均有着較大的提升。在氮氣、環丁二烯、水二聚物團簇等一系列具有挑戰性的分子體系上比最精确的量子化學方法更準确,能夠非常好的符合實驗結果。此外,該工作是領域内首個用神經網絡QMC方法對苯環二聚體這個規模的分子體系進行計算的工作。苯環二聚體的結合能是标定電子結構計算方法精度的一個重要體系,神經網絡DMC方法相比于VMC等方法進步顯著。

圖2.各類體系上的計算結果展示。a,氮氣分子的計算結果,其中藍線為神經網絡VMC方法,橙線為神經網絡DMC方法,綠線為該體系上最精确的量子化學方法。b,環丁二烯的平衡态構型(下)和過渡态構型(上)。c,環丁二烯的平衡态構型計算曲線(主圖)和轉變勢壘計算結果(小圖)。d,水二聚物團簇的不同方法計算結果。
該工作中實現的神經網絡DMC方法對于研究凝聚态物理中的電子關聯問題、複雜材料的電子結構以及精準量子化學等具有重要的意義,将成為電子結構計算領域新的标杆式計算方法。此項研究是合作研究團隊在發展機器學習QMC算法的系列工作中的又一重要進展。此前,雙方已先後合作開發了機器學習QMC方法中的原子有效核勢(Phys. Rev. Research 2022, 4, 013021);實現了機器學習QMC方法中原子間作用力的計算(J. Chem. Phys. 2022, 157, 164104);開發了領域内首個适用于研究固體等周期性體系的神經網絡波函數模型DeepSolid(Nature Communications 2022, 13, 7895)。未來,将神經網絡DMC方法與已經開發的這些方法相結合可以進一步提高各類體系的計算精度。
任維絡和beat365官方网站2021級博士生付偉中是本文的共同第一作者,任維絡和陳基是文章的共同通訊作者,文章作者還包括字節跳動研究部吳小傑博士。陳基課題組的工作得到了國家重點研發計劃、國家自然科學基金、中國科學院戰略性先導科技專項的支持。
原文鍊接:https://www.nature.com/articles/s41467-023-37609-3