「TamGen:革新藥物發現的AI框架」

Ai

TamGen:一個針對基於靶標的藥物發現和抗生素開發的生成式AI框架

生成式藥物設計提供了一種變革性的方法,能夠開發針對致病蛋白的化合物,使我們能夠在廣泛的化學空間中探索,促進新療法的發現。與傳統方法(如高通量或虛擬篩選)依賴於預定義的分子庫,且這些庫的多樣性有限不同,生成模型能夠創建具有特定藥理特性的全新分子。這一能力對於應對藥物抗藥性和設計缺乏有效候選者的蛋白質化合物特別有價值。然而,許多生成的分子在實際應用中缺乏可行性,因為它們過於專注於特定的藥物相關性質,限制了它們對整體藥物發現流程的貢獻。

最近,深度學習的進步引入了創新的生成建模技術,包括自回歸模型、生成對抗網絡(GANs)、變分自編碼器(VAEs)和擴散模型,使得能夠根據靶標蛋白生成類藥物化合物。這些方法顯著提升了基於靶標的藥物設計的潛力,提供了對先前未被充分探索的化學類別的訪問。儘管這些方法前景可期,但它們通常缺乏通過生物物理或生化測試的驗證,許多生成的化合物展現出較差的藥物相似性質,如合成可及性有限。因此,儘管生成模型顯示出創建新化合物的能力,但它們在藥物發現中的實際影響仍然受到將這些化合物轉化為有效藥物候選者的挑戰所限制。

來自微軟研究院AI科學部門及其他機構的研究人員開發了TamGen,這是一種具有靶向意識的分子生成方法,使用類似GPT的化學語言模型。TamGen通過以序列SMILES格式表示分子來生成類藥物化合物,並整合了靶蛋白編碼和化合物精煉的模組。在抗結核藥物發現中,TamGen識別出14種針對ClpP蛋白酶的化合物,其中最有效的化合物顯示出1.9 μM的IC50值。這一方法改善了分子的質量,在藥理活性和合成可及性之間取得平衡,顯示了TamGen在抗生素開發和療法創新中的潛力。

TamGen是一個藥物設計框架,結合了類似GPT的化學語言模型、基於變壓器的蛋白質編碼器和基於VAE的上下文編碼器。該模型在來自PubChem的1000萬個SMILES上進行了預訓練,其化合物解碼器自回歸生成分子,能夠實現靶向特定和獨立的設計。蛋白質編碼器整合了序列和幾何數據,而上下文編碼器則促進了精煉和多輪優化。TamGen在結合親和力、合成可及性和多樣性等指標上超越了其他方法,且生成化合物的速度是85至394倍。應用於結核ClpP蛋白酶,TamGen產生了具有低IC50值的獨特抑制劑,展示了其在高效藥物發現中的潛力。

總結

設計與致病蛋白具有強結合親和力的化合物可以通過生成式AI探索更廣泛的化學空間,加速藥物發現。TamGen這一AI驅動的框架實現了最先進的結果,識別出有效的結核分枝桿菌ClpP蛋白酶抑制劑。其成功基於三個方面:一是預訓練的化合物解碼器生成高品質分子,二是使用序列和幾何信息有效表示蛋白質結合口袋,三是基於VAE的上下文解碼器促進了化合物的迭代精煉。儘管提供了創新,但仍然存在挑戰,包括有限的體內數據和合成延遲。未來的改進旨在整合3D生成方法和強化學習,以獲得更好的對接分數、穩定性和藥物相似性,進一步提升TamGen的實用性。

這項研究的潛力不僅在於其技術創新,還在於它對抗生素開發的影響。隨著抗藥性問題的日益嚴重,這樣的生成式AI框架能夠為醫藥界提供新的解決方案。未來的研究應該專注於如何將這些模型的生成能力與實際的藥物合成過程相結合,以減少從計算到實際應用的障礙。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *