麻省理工學院研究人員推出Boltz-1:一個完全開源的生物分子結構預測模型
麻省理工學院的科學家們最近發布了一個強大的開源人工智能模型,名為Boltz-1,這一模型有望顯著加速生物醫學研究和藥物開發。
Boltz-1是由麻省理工學院Jameel健康機器學習中心的研究團隊開發的,這是第一個在性能上達到Google DeepMind的AlphaFold3水平的完全開源模型,後者能夠預測蛋白質及其他生物分子的三維結構。
麻省理工學院的研究生Jeremy Wohlwend和Gabriele Corso是Boltz-1的主要開發者,還有Jameel健康機器學習中心的研究合夥人Saro Passaro,以及麻省理工學院電機工程和計算機科學的教授Regina Barzilay和Tommi Jaakkola。Wohlwend和Corso在12月5日於麻省理工學院Stata中心舉行的活動中介紹了這一模型,他們表示,最終目標是促進全球合作,加速發現,並提供一個強大的平台來推進生物分子建模。
Corso表示:“我們希望這能成為社區的起點。我們稱之為Boltz-1而不是Boltz,是因為這不是終點。我們希望能獲得社區的盡可能多的貢獻。”
蛋白質在幾乎所有生物過程中都扮演著重要角色。蛋白質的形狀與其功能密切相關,因此理解蛋白質的結構對於設計新藥或工程新蛋白質以實現特定功能至關重要。然而,由於蛋白質的長鏈氨基酸折疊成三維結構的過程極其複雜,準確預測這一結構一直是數十年來的一大挑戰。
DeepMind的AlphaFold2因其能夠快速預測三維蛋白質結構而獲得了2024年諾貝爾化學獎,該模型的預測結果準確到與科學家實驗得出的結果無法區分。這一開源模型已被全球的學術和商業研究團隊使用,促進了藥物開發的許多進展。
AlphaFold3在其前身的基礎上進行了改進,採用了被稱為擴散模型的生成式AI模型,能更好地處理預測極其複雜的蛋白質結構所涉及的不確定性。然而,與AlphaFold2不同,AlphaFold3並非完全開源,也不供商業使用,這引發了科學界的批評,並引發了全球範圍內構建商業可用版本的競賽。
麻省理工學院的研究人員在開發Boltz-1時遵循了與AlphaFold3相同的初步方法,但在研究了基礎的擴散模型後,他們探索了潛在的改進。他們納入了那些能顯著提高模型準確性的算法,例如提高預測效率的新算法。
除了模型本身,他們還開源了整個訓練和微調的流程,以便其他科學家可以在Boltz-1的基礎上進行研究。
Barzilay表示:“我對Jeremy、Gabriele、Saro和Jameel中心的其他團隊成員能夠實現這一發布感到無比自豪。這個項目經歷了無數個日夜的努力,堅定不移地走到這一步。我們有許多令人興奮的想法來進一步改進,期待在未來幾個月內分享。”
麻省理工學院團隊花了四個月的時間和多次實驗來開發Boltz-1。他們面臨的最大挑戰之一是克服蛋白質數據庫中的模糊性和異質性,這是一個收錄了過去70年來數千名生物學家解決的所有生物分子結構的集合。
Wohlwend表示:“我花了很多個漫長的夜晚來處理這些數據。很多知識都是純粹的領域知
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。