為何Cohere前AI研究主管押注反對規模擴張競賽
人工智能(AI)實驗室正競相建造規模如曼哈頓般巨大的數據中心,每一個耗資數十億美元,耗電量相當於一個小城市。這場競賽背後,是對「規模擴張」的深信不疑——即透過增添更多運算能力,持續擴大現有AI訓練方法,最終將誕生能完成各種任務的超智能系統。
然而,越來越多AI研究人員開始質疑大型語言模型(LLM)的擴張已接近極限,認為提升AI表現必須靠其他突破。
這正是Sara Hooker的賭注。她曾任Cohere的AI研究副總裁,也是Google Brain的前成員,現創立新創公司Adaption Labs。她與同樣來自Cohere及Google的Sudip Roy共同創辦該公司,基於一個理念:規模擴張已成為壓榨AI模型性能的低效方式。Hooker於今年8月離開Cohere,本月低調宣佈創業,開始廣泛招募人才。
Hooker在接受TechCrunch訪問時表示,Adaption Labs致力打造能不斷適應和學習現實環境的AI系統,且效率極高。她拒絕透露具體技術細節,也未說明是否仍依賴大型語言模型或改用其他架構。
「現在很明顯,單純依賴擴大模型規模的『擴張主義』,雖然吸引人但極度乏味,並未產生能夠有效與世界互動的智能。」Hooker說。
她認為,適應是學習的核心。例如你走過飯桌時踢到腳趾,下次自然會更小心繞過。AI實驗室曾嘗試透過強化學習(RL)捕捉這個概念,讓AI模型在受控環境下從錯誤中學習,但現有RL方法無法讓已投入生產、服務用戶的系統即時從錯誤中學習,AI依然會「踢到腳趾」。
部分AI實驗室提供企業客製化微調服務,但代價不菲。據報OpenAI要求客戶在微調服務上花費超過一千萬美元。
Hooker指出,「目前只有少數先鋒實驗室提供一套對所有人相同的昂貴AI模型,事實上這已不必然。AI系統完全可以高效地從環境中學習。證明這點將徹底改變誰能掌控AI、誰能由AI服務的局面。」
Adaption Labs的出現,是業界對大型語言模型擴張信心動搖的最新徵兆。麻省理工學院近期發表論文指出,全球最大AI模型可能即將面臨效益遞減。舊金山的AI圈子氣氛也開始轉變,知名播客主持人Dwarkesh Patel近期邀請重量級AI研究者進行罕見的質疑對談。
被譽為強化學習之父的圖靈獎得主Richard Sutton去年9月坦言,LLM無法真正擴展,因為它們不會從現實經驗中學習。今年早期OpenAI前員工Andrej Karpathy亦表示對RL長期提升AI模型能力持保留態度。
這類疑慮並非首次出現。2024年底,部分研究者曾警告,通過預訓練擴大AI模型規模已顯示效益遞減,這一方法曾是OpenAI和Google提升模型的秘密武器。
儘管如此,AI業界已找到其他提升模型能力的方式。2025年,圍繞AI推理模型的突破(這類模型在回答前會花更多時間和算力推演問題)已進一步推高AI能力。
目前多家AI實驗室認為擴大RL和AI推理模型是新前沿。OpenAI曾透露開發首個AI推理模型o1,因為他們相信它具擴展潛力。Meta和Periodic Labs研究人員最近發表論文探討RL如何進一步擴展性能,該研究耗資超過400萬美元,凸顯現有方法仍極其昂貴。
相較之下,Adaption Labs尋求下一個突破,證明從經驗中學習可以更便宜。據三名投資者透露,該公司今年秋季曾洽談籌集2,000萬至4,000萬美元的種子輪,並已完成,具體金額未公開。Hooker未對此置評。
她說:「我們的目標非常雄心勃勃。」
Hooker先前在Cohere負責訓練針對企業應用的小型AI模型。如今小型AI系統在編碼、數學和推理基準測試中經常勝過大型模型,這正是她希望延續的趨勢。
她也以推動全球AI研究多元化著稱,曾招募來自非洲等代表性不足地區的研究人才。Adaption Labs將於近期在舊金山設立辦公室,但Hooker計劃全球招聘。
如果Hooker和Adaption Labs對擴張極限的判斷正確,將帶來深遠影響。迄今已投入數十億美元擴大LLM規模,假設更大模型必然導向通用智能。但真正的自適應學習或許不僅更強大,更具效率。
—
評論與啟示
Sara Hooker的觀點與新創公司Adaption Labs的願景,正好反映了AI界日益清晰的共識轉變:純粹依賴「規模擴張」來提升AI能力的時代,可能正走向終點。過去幾年,大型語言模型的快速擴展帶來了驚人進步,但這種模式的成本極高,且在智能的本質——適應與學習能力方面表現平平。
Hooker強調的「適應」與「持續學習」概念,提醒我們真正智能的核心不只是數據量與算力的堆砌,而是系統能否從實際環境中即時調整行為,像人類一樣從經驗中學習。這種能力將使AI更靈活、更符合複雜多變的現實世界需求。
不過,實現這一目標的技術挑戰巨大。現有強化學習方法雖然理論上可行,但在生產環境中仍難以即時高效應用。Adaption Labs若能找到成本更低、效率更高的自適應學習方案,將可能改寫AI發展路徑,並打破目前由少數巨頭壟斷高昂算力資源的格局。
此外,這場轉變也將帶來生態系統的多樣化。若AI模型能更快適應個別用戶與場景,將促進更多中小企業及地區參與AI創新,從而推動全球AI發展的公平性與包容性。
總結來看,Hooker的創業不僅是技術路線的挑戰,更是對整個AI產業現有思維模式的顛覆。香港及亞洲市場的業界人士,應密切關注這類突破,因為未來AI勢必從單純的「大規模」轉向「智慧和效率」並重的新階段,這將影響技術應用、商業模式甚至政策制定的全方位布局。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。