AI 蛻變化學:揭開蛋白質結構的奧秘

Ai

**人工智能系統預測蛋白質結構獲得諾貝爾化學獎**

2024年度的諾貝爾化學獎頒給了在蛋白質分子計算設計和結構預測領域的工作。獎項一半授予華盛頓大學的David Baker,另一半則共同授予位於倫敦的人工智能公司Google DeepMind的Demis Hassabis和John M. Jumper。

隨著2024年物理學諾貝爾獎頒給了研究當今人工智能系統中神經網絡的學者,化學獎進一步強調了機器學習算法在多個領域的變革性影響。加州理工學院的Frances Arnold,因創造具有新功能的人造酶獲得過化學諾貝爾獎,她表示,這個化學獎“體現了人工智能如何推動科學的發展”。

Hassabis和Jumper是名為AlphaFold的算法的關鍵設計師,該算法能僅憑蛋白質分子的氨基酸序列預測其結構。Baker則因其設計和合成新型非天然蛋白質結構的工作而共享此獎。這項工作現在大大受益於AlphaFold,該算法可以反向運行以預測將折疊成給定目標結構的序列。

所有蛋白質都是由氨基酸鏈組成,通常會折疊成具有特定形狀的緊湊球體。折疊過程由不同氨基酸之間的相互作用所決定,因為有些帶有電荷,因此序列決定了結構。而結構進而定義了蛋白質的功能,因此推斷蛋白質的結構對於理解分子生物學的許多過程,以及識別可能結合並改變蛋白質活性的藥物分子至關重要。

傳統上,蛋白質結構是通過實驗方法如X射線晶體學和電子顯微鏡來確定的。但研究人員一直希望能夠僅從序列預測結構,也就是理解和預測蛋白質折疊過程。

多年來,計算方法如分子動力學模擬在這個問題的複雜性面前顯得力不從心。但AlphaFold繞過了模擬折疊過程的需求。相反,該算法可以被訓練來識別已知蛋白質結構中的序列與結構之間的關聯,然後將這些關係推廣到預測未知結構。

自2018年首次推出後,DeepMind研究人員進行了改進,使其四年後能夠預測從細菌到人類的所有已知200萬蛋白質序列的結構。預測的質量各異,算法為每個預測分配了一個置信度分數,但許多預測非常接近於由晶體學確定的結構。

蛋白質折疊問題長期以來吸引了統計物理學家的興趣,因為它體現了一個普遍問題:複雜系統如何找到其最低能量、最穩定的狀態。蛋白質分子的氨基酸鏈可以以多種方式折疊,每種折疊配置沿著通往最終結構的路徑都可以被分配一個能量。這個“能量景觀”有許多局部極小值,難題在於自然界中的蛋白質折疊過程如何找到全局最小值而不會陷入“錯誤”結構中。這個在複雜能量景觀中定位全局最小值的問題也出現在其他物理系統中,如磁性材料中的自旋玻璃。

儘管AlphaFold迴避了通過能量景觀推導折疊鏈路徑的難題,一些研究人員希望知道該算法是否仍然從訓練數據中發展出對景觀的表徵——一種“直覺”。對於給定序列,該算法在訓練集中依賴於所謂的共同進化數據——這些數據是相似序列的結構,僅有少數氨基酸被替換。這些相似序列可以被解釋為提供了對相關能量景觀區域的“感覺”。

為了測試這一想法,研究人員最近使用結構預測軟體創建的人工共同進化數據訓練AlphaFold,該軟體基於所有氨基酸的相互作用能量最小化總能量。他們得出結論,該算法似乎確實感知到了底層的能量景觀。

然而,根據德克薩斯州萊斯大學的理論化學家Peter Wolynes所說,AlphaFold對共同進化數據的依賴是其當前的限制之一,因為這使得算法過於自信地堅持單一結構。因此,算法可能在面對那些在執行生物功能時改變結構並因此具有多個穩定形狀的蛋白質時遇到困難。甚至當AlphaFold成功識別折疊轉換蛋白質的形狀時,似乎更多地依賴於從訓練數據中記住結構,而不是從能量景觀的深刻表徵中推導出來,根據最近的一項研究。

由於這些限制,AlphaFold和所有AI研究工具一樣,需要來自人類專家的指導。“如果與人類判斷相結合,對機器學習的深思熟慮使用對科學有很多貢獻,”Wolynes說。

**評論**

這篇文章展示了AlphaFold在蛋白質結構預測中的突破性成就,這不僅為科學研究提供了新的工具,也為藥物開發和生物技術創新開啟了廣闊的前景。然而,這項技術的發展也提出了重要的倫理和實踐問題。首先,AlphaFold的成功依賴於大量的訓練數據,這意味著數據的準確性和多樣性至關重要。其次,雖然AI在預測中表現出色,它仍然需要人類的判斷來解釋和應用這些結果,這提醒我們在依賴技術的同時,不能忽視人類專業知識的重要性。

此外,AI在科學研究中的應用也提出了知識產權和技術透明度的問題。如何在推動技術進步的同時,確保其負責任的使用,是一個持續的挑戰。總的來說,AlphaFold的成就不僅是科技的勝利,也是科學與人文相結合的典範。未來,我們需要更多這樣的跨領域合作,以應對複雜的全球挑戰。

以上文章由特價GPT API KEY所翻譯

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *