一個AI模型模擬了5億年的進化
科學家們又一次在計算機模擬的世界中「扮演上帝」。這次,他們不再像《侏羅紀公園》中的約翰·哈蒙德和他的科學家們那樣重建恐龍,而是教會了一個AI模型如何通過模擬5億年的進化來創造全新的蛋白質。
這個項目的研究人員來自EvolutionaryScale和Arc Institute,他們已經開發出一個能夠生成代碼的AI模型,該代碼能夠完全合成新穎的蛋白質,這一成果在《科學》期刊上發表的論文中有詳細說明。
根據他們的研究結果,這個名為ESM3的模型可以模擬進化,最終合成出一種全新且未知的亮色螢光蛋白。能夠生成這樣的人工蛋白質,為研究開啟了全新的機會。
不僅能幫助我們更好地理解蛋白質的性質及其用途,還能幫助我們開發這些蛋白質的新應用。為了生成新的蛋白質,研究人員依賴於從現有蛋白質中收集的數據。
像其他生成性語言模型(例如ChatGPT)一樣,ESM3需要大量數據來學習如何執行任務。研究人員用7710億個標記、3.15億個蛋白質序列、2.36億個蛋白質結構和5.39億個蛋白質註釋來訓練模型,以有效地模擬進化。
研究人員表示,這就像是給AI模型提供了超過5億年的進化數據和知識,使其從基本代碼開始隨著時間的推移不斷進化。最終,這個模型創造出的虛擬蛋白質是使用標準的蛋白質合成技術製作的,但擁有一個之前未見的基因序列。
研究人員為這種蛋白質命名為esmGFP。這一模型的成功表明,它和其他類似模型還可以用來模擬其他方面的進化,例如深入研究人類進化。此外,科學家們希望利用這些模型推進環境研究。
評論
這項研究不僅展示了AI在生物學領域的潛力,還揭示了人工智能如何進一步推動科學的邊界。隨著技術的進步,AI不再僅僅是數據處理的工具,而是成為了創新和探索的合作夥伴。這樣的進展可能會引領我們在蛋白質工程、合成生物學等領域的重大突破,甚至有可能影響醫療、環境科學等多個領域的發展。
不過,這也引發了關於倫理和安全的討論。在我們享受這些科技進步所帶來的便利時,我們也必須謹慎地思考其潛在的風險。人類對於生物技術的操控能力是否足夠?未來的科學家應該如何負責任地使用這些工具?這些問題都值得我們深思。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。