AI教父再戰生物科技:用RNA重塑醫藥未來

Ai

現代人工智能的父親想要重塑生物學

當你與雅各布·烏斯科雷特(Jakob Uszkoreit)交談時,你得全神貫注。這不是因為他故作神秘,而是因為他所從事的工作前沿到讓你需要動用每一根神經才能跟上他的思路。

烏斯科雷特被譽為現代人工智能的奠基人之一。2017年,他與其他七位作者共同撰寫了《注意力即一切》(Attention is All You Need),這篇論文被廣泛稱為「變壓器論文」。該論文的發表,當時他和他的合著者們都是谷歌的頂尖軟件工程師,成為人工智能革命的標誌性時刻。這一成就可以說相當於1980年代互聯網域名系統的創建,或是1990年代早期蒂姆·伯納斯-李(Tim Berners-Lee)發明的萬維網。

現在,烏斯科雷特與斯坦福大學的生物化學教授瑞希尤·達斯(Rhiju Das)共同創立了一家名為Inceptive的公司,致力於挖掘人工智能與生物學的交集。達斯曾在華盛頓大學與大衛·貝克(David Baker)合作進行計算蛋白質摺疊的博士後研究。他和烏斯科雷特的工作幫助貝克與谷歌DeepMind的德米斯·哈薩比斯(Demis Hassabis)和約翰·賈姆珀(John Jumper)去年獲得了化學諾貝爾獎。

他們的抱負在矽谷標準下亦屬宏大。谷歌的目標是組織世界的信息並使其可搜索。但Inceptive的目標則是重新組織生物學,徹底改變我們製造藥物和疫苗的方式。它正在教導其AI系統最前沿的生物學知識,使其能夠像ChatGPT回答問題或編寫軟件代碼一樣,輕鬆生成重新設計的RNA分子。

科學家對RNA的操控能力日益增強,已成為藥物和疫苗開發過程中的關鍵部分。這也是科學家能迅速開發Covid疫苗的部分原因。CRISPR或許是RNA力量的最佳例子。

想像一下,智能癌症疫苗——能為所有不同形式的癌症提供免疫,且沒有副作用。烏斯科雷特和達斯認為他們可以讓這一想法變為現實,或者至少接近實現。在此過程中,他們希望能幫助藥品公司和生物技術公司改善現有藥物,減少副作用,並大幅縮短新藥的開發時間和成本。

這聽起來是否宏大?瘋狂?也許是。但基於創始人的背景和最初的成功,他們仍然吸引了大量關注。一些大型藥品公司和生物技術公司已經為他們的早期研究和開發支付了數百萬美元的合作費用。

同時,頂級投資者如安德森·霍洛維茨(Andreessen Horowitz)、明顯風投(Obvious Ventures)和Section 32以及Nvidia等,對Inceptive的早期成果印象深刻,已在兩輪早期融資中投資了創紀錄的1.2億美元。

烏斯科雷特告訴我,他們最近利用AI創造了一種在小鼠中能如預期運作的RNA分子。他說:「這在某種意義上是驚人的,但這還不夠。我們必須不僅在小鼠中做到這一點,還要對治療相關的蛋白質進行這一工作。我們必須證明這對廣泛的蛋白質有效。」

Inceptive是一家真正的後疫情公司,總部位於柏林(烏斯科雷特的居住地)和矽谷(達斯的居住地),並在蘇黎世和倫敦、溫哥華以及美國東部城市設有業務。烏斯科雷特表示,現在有50名員工分散在這些地點。

目前他們面臨的挑戰特別艱鉅,因為Inceptive所需的大部分數據尚未存在。因此,當你造訪Inceptive位於帕洛阿爾托的實驗室時,你會看到生物學家和化學家進行RNA測試和實驗,然後在頂尖數據科學家和深度學習專家的幫助下,將這些數據輸入Inceptive的AI系統。相比之下,傳統的AI系統幾乎擁有無限的數據可供訓練。

RNA訓練數據不足的原因在於,科學家曾經認為RNA這一DNA的近親幾乎無用。這一領域僅有約20年的歷史。烏斯科雷特說:「對於蛋白質,我們擁有20萬個實驗獲得的確認,對於RNA,我們甚至沒有2000個。」

可以把這看作是創造生物軟件。前期開發成本可能非常高,但一旦開發成功,假設其有效,就能創造出巨額的收益。

安德森·霍洛維茨的健康和生物技術基金創辦人維賈伊·潘德(Vijay Pande)表示:「儘管對烏斯科雷特的讚譽不絕於耳,我仍然認為他被低估了——這聽起來可能很瘋狂,畢竟他幾乎就是創造變壓器概念的人。」潘德回憶起三年前在一次會議上遇到烏斯科雷特和達斯,得知他們合作的消息後,幾乎當場就同意資助他們2000萬美元的種子輪融資。「達斯最初是斯坦福的研究生,我是他的論文委員會成員。在他攻讀研究生時,我與他合作過。他在將計算方法應用於RNA方面是一位超級明星。」

不過,這一切也可能不會成功。這是真正的前沿科學,而大型製藥公司,擁有無底的資金,也在致力於解決這一問題。最終,烏斯科雷特認為,Inceptive的做法將使其在競爭對手中擁有最大優勢。首先,他正在建立一個來自兩種截然不同專業文化的頂尖人才的團隊,並強迫他們合作——生物學家和化學家與AI專家並肩工作。矽谷的文化更根植於「快速行動,打破常規」的理念,這是Facebook所普及的,而生物學家和化學家則絕對不是如此。

這種不同的問題解決方式和思維方式在Inceptive每一天都存在。「當你看到他們在帕洛阿爾托的實驗室時,你注意到他們有兩排平行的實驗室嗎?一排是濕實驗室,另一排是計算實驗室?」潘德問我。「在中間,他們有一個稱為沙灘的地方——濕實驗室和乾實驗室之間,兩組人員在那裡互動。這是他們的一大亮點——他們強迫這兩組人員互動。」

烏斯科雷特說:「這真的很難做到。而且這真的很難,因為這不是僅僅依靠一個學科的人。你不能只讓一堆生物學家在一個房間裡找出合適的資產,因為那樣他們可能生成的數據過於乾淨。」他表示,神經網絡通常在接收噪聲數據時學習得更好,並必須發展出解析這些數據的方法。「所以現在你需要的是一個在這兩個領域都非常出色的組織,並且需要這些人即使相隔九個時區也能很好地合作。」

你可以用一隻手數出烏斯科雷特關於Inceptive的訪談次數。Inceptive的網站也強化了這一低調、神秘的形象。它只是一個單一頁面,告訴你如何申請那裡的工作。「我們正在創建工具,以開發越來越強大的生物軟件,用於設計之前無法達到的新型、廣泛可及的藥物和生物技術。」網站上寫道。這幾乎似乎是故意表達「只有真正理解我們網站的申請者才需要申請。」

以下是我們在感恩節前的星期三進行對話的編輯版本。

弗雷德·福戈斯坦(Fred Vogelstein):當你們開始時,Inceptive的原始計劃是什麼?

雅各布·烏斯科雷特:那麼我們從長期計劃開始,然後再回到短期計劃。建立一個生命基礎模型的引人注目的方式是構建一個用於生成和設計RNA(核糖核酸)的模型。

RNA可能是生命的第一個分子家族,這是完全可以想像的。其原因在於,RNA可以完成生命中的所有事情。這對DNA和蛋白質來說並不是事實。

RNA實際上可以是一個小型生物機器(製造蛋白質),同時它也可以編碼蛋白質的藍圖,並在細胞內和細胞間傳遞這些信息。它涵蓋了整個範疇。

所以它確實相當特殊。今天正在試驗的基因編輯器(如CRISPR)大多是基於RNA的,對吧?這些技術可以實現真正的個性化精準醫療,例如個性化癌症疫苗。因此,從長遠來看,擁有一個設計RNA的模型是非常有趣和吸引人的。

目前已經有數十家公司在構建蛋白質設計模型。這是一個相當擁擠的領域。但不僅做RNA的公司較少,對我來說,這在長期內似乎是部署這些技術的更優雅的方式。

弗雷德·福戈斯坦:這項工作的短期用途是什麼?它能幫助製藥公司更好、更快、更便宜地製造藥物嗎?

雅各布·烏斯科雷特:這項技術可能使他們能更快地製造藥物。它可能使他們能更便宜地製造藥物,因為他們可以花更多時間設計已知有效的化合物,而不是通過反覆試驗篩選數十種化合物。最終,它將使我們能夠製造出之前無法製造的藥物。

想像一下,您服用極少量的藥物,並且可以輕鬆吸入一次——比如因為您有某種遺傳易感性,隨著時間的推移可能會發生某些慢性問題。這種藥物會在您的體內潛伏,直到某個條件滿足。

在那個階段,它開始啟動初步防禦。也許還會在您進行的某些例行測試中報告,就像液體活檢正在變得更加現實以檢測某些癌症形式一樣。

弗雷德·福戈斯坦:換句話說,你們不僅是在幫助製藥公司做得更好、更快、更便宜,還是在創造新的藥物?

雅各布·烏斯科雷特:正是如此。這不是一夜之間的事情。這一開發工作將需要許多年。但有趣的是,這一方向的逐步進展是相當良好的,這樣就形成了一條合理直接的道路,通向這種完全科幻的藥物願景。

弗雷德·福戈斯坦:因此,像治愈所有癌症的疫苗或不會產生抗藥性的抗生素?

雅各布·烏斯科雷特:是的。抗生素抗藥性是高度抗藥微生物的一個特定問題。但您可以想像其他方法來對抗細菌,這些方法並不具有那麼大的風險。因此,還存在一種非常有趣的其他途徑,即噬菌體療法,通過該療法,您有效地用病毒感染細菌,從而使其超級增強。這甚至可能使傳統抗生素的需求消失。這是一個大膽的聲明,但並非不可想像。

弗雷德·福戈斯坦:你是怎麼想到這個想法的?你在人工智能的基礎開發中扮演了關鍵角色,但你並不是生物學家。

雅各布·烏斯科雷特:在大約三個月內發生了三件事情。第一件事是我的第一個孩子出生了,我的女兒,在疫情期間。

然後在一個多月後,CASP 14(結構預測的關鍵評估)結果發布。我意識到我在過去五六年中所做的工作實際上已經準備好進入分子和結構生物學的舞台。

第三件事發生在幾週後。第一階段和第二階段的mRNA Covid疫苗試驗結果出來了。兩者的有效性均超過90%。

最後,一位非常明智的人(我不會透露名字)問我,十年後如果我的女兒知道我為什麼在谷歌待著,儘管知道這項技術的未來走向,卻沒有去追求那個機會,你會怎麼想。mRNA Covid疫苗可能拯救了超過2000萬人的生命。因此,在那個時候,這成為了一種道德義務。如果我不這麼做,我就冒著讓她知道我本可以做到卻沒有的風險。

幾個月後(當我在帕洛阿爾托的一次會議上與瑞希尤·達斯一起)維賈伊·潘德,A16Z生物和健康基金的創始人,走過來。他說:「如果你們倆成立一家公司,我會給你們寫一張支票,任何支票。」所以我們想,「好吧,我們不再有藉口了。」

弗雷德·福戈斯坦:你們在證明能夠實現你們的工作方面進展如何?

雅各布·烏斯科雷特:我們僅僅邁出了小步伐。好消息是這些小步伐已經是有用的。這是全新發佈的。但我們首次在動物身上證明,我們可以完全從深度學習系統中提取一種分子,並將其放入小鼠中,並且它的表現遠比我們競爭對手使用的最先進算法創造的東西更為理想。

因此,現在我們擁有一個大型神經網絡,您可以告訴它,「嘿,設計一個表達大量特定蛋白質的mRNA。」然後它會輸出某種東西。

這是驚人的。現在我們必須不僅為一種能讓我們在小鼠中良好測量的蛋白質做到這一點,還必須為對人類療效相關的蛋白質做到這一點。我們必須證明這對廣泛的蛋白質有效。

弗雷德·福戈斯坦:誰是你的競爭對手?你們的競爭優勢在哪裡?

雅各布·烏斯科雷特:學術界和產業界也有一些類似的結果。我們的主要區別在於,我們是以非常數據驅動的方式進行的。我們以一種非常端對端的方式進行機器學習。

大型製藥公司往往以更依賴篩選的方式進行這一工作。他們只是嘗試一大堆東西,然後選擇最佳的。但隨著變量的增多,這變得指數級困難。我所知道的大多數其他初創公司都在重度依賴公共可用數據。

我們也使用這些公共可用數據。但我們在驗證測試(實驗)、評估測試(比較模型)以及日益增長的數據生成測試方面變得相當出色,規模也在不斷增長。(這些結果被輸入到我們的AI系統中)

這真的很難做到。而且這真的很難,因為這不是僅僅依靠一個學科的人。你不能只讓一堆生物學家在一個房間裡找出合適的資產,因為那樣他們可能生成的數據過於乾淨。他們沒有采取正確的手段來生成更雜亂的數據。(雜亂的數據對於訓練AI系統更好。)所以現在你需要的是一個在這兩個領域都非常出色的組織,並且需要這些人即使相隔九個時區也能很好地合作。

弗雷德·福戈斯坦:你們如何管理這樣一支跨越兩大洲的團隊?

雅各布·烏斯科雷特:這確實增加了挑戰。有些方面是非常可預測的,例如你與人員的重疊時間非常有限。但還有其他一些更微妙的問題,並不是每個人都會立即意識到,儘管他們會受到影響。

例如,我們的美國員工往往會在已經做出決策的情況下醒來,因為我——在柏林工作,提前9小時——已經完成了一整天的工作。因此,他們(美國的員工)不斷醒來面對一堆消息,並想知道他們是否應該有機會被聽到。我們試圖對此進行調整,但有時人們會忘記。

另一方面,對於歐洲人來說,挑戰在於不要在深夜待在辦公室工作,以便與加州的工作有更多的共同時間。這是非常具有挑戰性的,因為你最終會犧牲社交生活。當你這樣做一段時間後,你會發現有一天醒來感到無比懊悔。

然後,(除非你進行調整)如果你有來自不同學術背景的人,他們在文化上不自然地說同樣的語言,你(可以創造一個促進團隊形成的工作環境)。在公司成立的前一年半,我對此感到非常擔憂。

弗雷德·福戈斯坦:那麼你們為什麼不合併業務?是因為在矽谷招聘頂尖AI人才比在歐洲更難嗎?

雅各布·烏斯科雷特:是的,確實如此。(難度很大)。對我來說,在我職業生涯的這一階段,創業路線是最合理的。但如果你考慮到一般情況,目前在矽谷打敗大型科技公司幾乎是不可能的。

這不僅僅是薪酬差距問題,而是流動性差距。谷歌現在開始讓員工立即獲得股份。當然,他們的股權計劃在增長潛力方面不那麼吸引人。但它們的規模是相當可觀的。大學畢業生輕易就能獲得七位數的薪酬包,並且是立即可用的。

這並不是初創公司能夠競爭的。你可以給員工10倍的股權,但這些股權的流動性卻是零。與此同時,特別是對於計劃或已經有家庭的人來說,灣區的生活成本實在是高得驚人。因此,你會聽到這樣的話:「如果我搬到歐洲,我可以接受你的報價,但如果我留在這裡,我根本無法以六位數的薪水維持生活。」

弗雷德·福戈斯坦:我很感謝你的時間。謝謝你和我交談。

這篇文章揭示了人工智能與生物學交匯的新機會,尤其是在藥物和疫苗的開發過程中。烏斯科雷特和達斯的合作不僅是技術上的融合,更是對科學界傳統思維的挑戰。這種跨學科的合作方式,能否成為未來生物科技領域的標準,值得我們持續關注。當前的科學研究不再是孤立的,跨領域的合作能帶來意想不到的創新,這對於解決當前全球健康問題至關重要。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon