
新模型預測化學反應的不可逆點
化學家可以利用這種快速的計算方法來設計更高效的反應,從而產生有用的化合物,從燃料到藥品。
安妮·特拉夫頓 | MIT新聞
出版日期:2025年4月23日
當化學家設計新的化學反應時,反應的過渡態——即反應必須進行的不可逆點——是一個非常有用的信息。這些信息使化學家能夠嘗試創造合適的條件來促成所需的反應。然而,目前預測過渡態和化學反應路徑的方法相當複雜,並且需要龐大的計算能力。
麻省理工學院的研究人員現在開發了一種機器學習模型,可以在不到一秒的時間內,高精度地進行這些預測。該模型能使化學家更容易設計能生成各種有用化合物的化學反應,例如藥品或燃料。
“我們希望最終能夠設計出將豐富的自然資源轉化為我們需要的分子的過程,例如材料和治療藥物。計算化學對於設計更可持續的過程以將反應物轉化為產品至關重要,”化學工程系的拉莫特·杜邦教授海瑟·庫利克(Heather Kulik)說,她是這項新研究的主要作者。
這篇論文的主要作者包括前麻省理工學院研究生陳如端(Chenru Duan)博士(現任Deep Principle)、前喬治亞理工學院研究生劉冠宏(Guan-Horng Liu,現任Meta)和康奈爾大學研究生杜元奇(Yuanqi Du),該研究於《自然機器智能》上發表。
更好的估算
任何給定的化學反應都必須通過一個過渡態,這個過渡態在反應達到所需的能量閾值時發生。這些過渡態是如此短暫,以至於幾乎無法實驗觀察。
作為替代方案,研究人員可以使用基於量子化學的技術來計算過渡態的結構。然而,這一過程需要大量的計算能力,計算單個過渡態可能需要數小時或數天。
“理想情況下,我們希望能利用計算化學設計出更可持續的過程,但這一計算本身就需要大量的能源和資源來找到這些過渡態,”庫利克說。
在2023年,庫利克、陳及其他人報告了一種機器學習策略,該策略能預測反應的過渡態。這一策略比使用量子化學技術更快,但仍然不如理想情況,因為它需要模型生成大約40個結構,然後通過“信心模型”來預測哪些狀態最有可能發生。
之所以需要多次運行模型,是因為它使用隨機生成的過渡態結構初始點,然後進行數十次計算,直到達到最終的最佳估算。這些隨機生成的起始點可能與實際的過渡態相距甚遠,這就是為什麼需要這麼多步驟的原因。
研究人員的新模型React-OT在《自然機器智能》論文中描述,採用了不同的策略。在這項工作中,研究人員訓練了他們的模型,使其從通過線性插值生成的過渡態估算值開始——這是一種通過將每個原子的位置在反應物和產物之間移動一半來估算的位置的技術。
“線性估算是一個良好的起始點,用於近似過渡態最終會到達的地方,”庫利克說。“模型的運行是從比完全隨機的估算更好的初始猜測開始的,這是前期工作中的一個改進。”
因此,該模型生成預測所需的步驟和時間更少。在新的研究中,研究人員展示了他們的模型僅需約五步,約0.4秒即可完成預測。這些預測無需通過信心模型,並且比之前模型生成的預測準確性高出約25%。
“這使得React-OT成為一個實用的模型,我們可以直接將其整合到現有的高通量篩選計算工作流程中,以生成最佳的過渡態結構,”陳如端說。
廣泛的化學應用
為了創建React-OT,研究人員使用了與訓練其舊模型相同的數據集。這些數據包含使用量子化學方法計算的反應物、產物和過渡態的結構,涵蓋了9,000種不同的化學反應,主要涉及小型有機或無機分子。
一旦訓練完成,該模型在其他未納入訓練數據的反應中表現良好。它在未經訓練的其他類型反應中也表現出色,能對涉及較大反應物的反應進行準確預測,這些反應物通常有不直接參與反應的側鏈。
“這一點非常重要,因為在許多聚合反應中,會有一個大型大分子,但反應僅在其中一個部分發生。擁有一個能在不同系統大小中進行泛化的模型意味著它可以處理各種化學反應,”庫利克說。
研究人員目前正在努力訓練該模型,以便它能預測包含其他元素(如硫、磷、氯、矽和鋰)之間的反應的過渡態。
“快速預測過渡態結構是所有化學理解的關鍵,”蘇黎世聯邦理工學院的理論化學教授馬庫斯·雷赫爾(Markus Reiher)說,他並未參與該研究。“論文中提出的新方法可能會大大加速我們的搜索和優化過程,使我們能更快達到最終結果。因此,在這些高性能計算活動中消耗的能源也會減少。任何加速這一優化的進展都將惠及各種計算化學研究。”
麻省理工學院團隊希望其他科學家能利用他們的方法來設計自己的反應,並已為此創建了一個應用程序。
“只要你有一個反應物和產物,就可以將它們輸入模型,模型將生成過渡態,從中你可以估算預期反應的能量障礙,並查看其發生的可能性,”陳如端說。
這項研究得到了美國陸軍研究辦公室、美國國防部基礎研究辦公室、美國空軍科學研究辦公室、國家科學基金會和美國海軍研究辦公室的資助。
—
這篇報導展示了機器學習在化學研究中的潛力,特別是在預測化學反應的過渡態方面。這不僅提高了反應設計的效率,還可能對環境可持續性產生積極影響。隨著這項技術的發展,未來的化學合成過程將變得更加高效和環保,這對於應對全球資源短缺和環境問題至關重要。這種新模型的實用性和準確性為化學界帶來了新的希望,並可能促進新藥物和材料的開發,改變我們對化學合成的理解和應用。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。