拒絕馬斯克：千禧AI超越OpenAI

zero comment

兩位Z世代拒絕Elon Musk數百萬美金，打造以人腦為藍本的AI——表現超越OpenAI與Anthropic

兩年前，兩位來自美國密歇根州、年僅22歲的高中同學，坐在北京清華大學的腦科學實驗室，面前擺著Elon Musk開出的數百萬美金邀約。

小型語言模型的逆襲

這兩位年輕人，陳威廉（William Chen）和王冠（Guan Wang），當時做了一件極為罕見的事——他們訓練了一個小型的大型語言模型（LLM），不是依賴網絡上龐大的數據，而是用一小撮精心挑選的高質素對話數據。更重要的是，他們令這個模型可以自我優化，採用所謂「強化學習」（RL）——這是一種模仿人類和動物學習方式的技術，模型靠做決策、獲得回饋，然後透過獎懲機制來調整行為。

當時，幾乎沒有人會用強化學習來訓練語言模型。唯一一個在這方面有突破的是DeepSeek——這間中國公司後來更震驚矽谷。

陳威廉和王冠把這個模型命名為OpenChat，並一時興起將之開源。

結果出乎意料，OpenChat在學術界爆紅。

「它變得非常有名。」陳威廉接受《Fortune》訪問時說。加州大學柏克萊分校及史丹福大學的研究人員紛紛下載代碼，基於此再開發，學界開始大量引用。OpenChat成為其中一個最早證明「好數據比多數據更重要」的小型模型案例。

這個消息最終傳到一個意想不到的人——Elon Musk。

Musk當時透過他新創的公司xAI，向兩位學生發出高薪邀請，提出數百萬美金的待遇。這是年輕創業者夢寐以求的機會。

他們卻選擇拒絕。

「我們認為大型語言模型有其結構性限制，」陳威廉說。「我們想要一種全新架構，能夠突破這個瓶頸。」

兩人決定放下OpenChat，追尋一個更大膽的目標——設計一套「仿腦推理系統」，自信能夠超越現有AI模型。

結果，兩年後，他們成立了Sapient Intelligence，並開發出一個在抽象推理測試中勝過世界頂尖AI系統的模型。他們相信這個模型會成為首個達到「AGI」（人工通用智能）的系統——即機器在任何認知任務上都能媲美甚至超越人類，被視為AI研究的聖杯。

站在AI軍備賽的兩個世界之間

其實，陳威廉拒絕Musk的旅程，並不是始於北京，而是美國密歇根州的Bloomfield Hills——以及他從小就讓父母頭疼的癖好。

「我小時候最愛把東西拆爛，但從來不會裝回去，」他笑說。「這就是我的起點。」

陳威廉出生於中國，童年部分時間在聖地牙哥和深圳成長，後來被送到密歇根著名寄宿學校Cranbrook讀書，也是在那裡認識了王冠。王冠雖然在另一間學校，但同樣有著不尋常的興趣。

兩人第一次見面，便展開一場長談，討論他們所謂的「元目標」——即人生的終極目標。

對王冠來說，元目標就是AGI，早在這個詞流行前，他就以「能解決任何問題的算法」來形容。陳威廉的元目標則是「優化一切」，無論是工程難題還是現實世界系統。

「我們一拍即合，」陳威廉說。

時至今日，他們仍會問每一位新員工：「你的元目標是什麼？」

陳威廉創辦了學校的無人機社團，積極爭取讓學生在校園內飛行四軸機，也長時間泡在機械人實驗室。兩人總是留到最晚，勇於拆解硬件、持續實驗。

「那段時間很棒，」他回憶。

升學時，陳威廉獲卡內基梅隆及佐治亞理工學院錄取——這是機械人天才的黃金選擇。王冠則成功考入中國頂尖工程學府清華大學，被譽為「中國MIT」。

陳威廉參觀了清華校園和實驗室，做出了一個少有美國高中生會選擇的決定——他追隨王冠去清華。

適應過程並不容易，課業壓力極大，兩人一度掛科。

「中國學生真的很厲害——我知道這樣說有點刻板印象——但他們讀書真的很強，」陳威廉笑說。

但他意外發現，當教授們知道他和王冠在做什麼後，變得非常支持。

「他們說：『我明白你想做什麼——這是件很有意義的事。我也相信AGI這個概念。』」

到那時，清華腦認知與腦啟發智能實驗室的幾乎所有人都知道這兩位本科生正挑戰這個領域的主流假設。

凌晨三點的突破

就在清華的腦科學實驗室，他們開發出階層式推理模型（HRM），這種架構被他們視為能完全超越現有Transformer模型的突破。

如果說OpenChat是他們的概念驗證，那麼HRM就是他們的登月計劃。最關鍵的一刻，正好發生在深夜。

今年六月的一個凌晨三點，陳威廉和王冠凝視著他們小型實驗模型的基準測試結果。僅僅2700萬參數的HRM原型——相比GPT-4或Claude簡直是九牛一毛——卻在設計用來評估推理能力的任務上，超越了OpenAI、Anthropic及DeepSeek等系統。

它成功解決了極難的數獨、30×30迷宮最佳路徑，並在ARC-AGI基準上取得驚人成績——全程無需鏈式思維提示或硬砌規模。

「簡直不可思議，」陳威廉說。「僅僅是架構改變，模型就獲得了我們所謂的推理深度。」

與其說Transformer是根據統計預測下一個字，HRM則採用雙重循環結構，模仿人腦如何結合慢速深思熟慮與快速反射反應。這個系統能夠規劃、拆解問題，用內在邏輯推理，而非單純模仿。「它不是在猜測，」陳威廉說。「它在思考。」

他表示，HRM模型產生幻覺（即無中生有）情況遠少於傳統LLM，並且在天氣預測、量化交易、醫療監測等時間序列預測任務上，已經媲美最先進水平。

他們計劃將HRM擴展成通用推理引擎，核心理念簡單但激進：AGI不是靠把Transformer做大，而是靠更小巧、高效的架構。現時最前沿的模型動輒數百億參數，但連開發者都承認它們在推理、規劃及多步驟問題分解方面力有不逮。

陳威廉認為，這不是暫時性，而是結構性限制。

「你可以疊更多層，」他說。「但終究還是碰到機率模型的天花板。」

Sapient現正籌備下月在美國設立辦公室，計劃進一步融資，並考慮更改公司名稱，準備推出新一代模型。創辦人相信，模型能否「持續學習」——即安全地吸收新經驗，而無需從零重新訓練——將是下一個大關鍵。

「AGI是AI的聖杯，」陳威廉說。他預計未來十年將會出現。

「終有一天，我們會有比人類更聰明的AI，」他說。「我和王冠常說，這就像潘多拉盒子——如果我們不做，總會有人做。所以我們希望成為第一個實現這件事的人。」

編輯評論：新一代AI創業者的野心與現實——從拒絕Musk到挑戰主流AI架構

這篇報道讓人深刻感受到新一代AI創業者的野心與毅力，特別是在全球「AI軍備競賽」如火如荼的時代。Sapient Intelligence的故事，並不是單純的「拒絕Elon Musk」這種戲劇化的傳奇，而是對現有AI技術路線（即Transformer架構）的一種根本性質疑。這種質疑來自對「人類智能本質」的反思——人腦如何推理、如何持續學習，並試圖將這些能力融入機器。

Sapient的HRM模型表現出色，最令人振奮的不是它「以小搏大」的成績，而是它提出一個值得整個AI業界反思的命題：巨型語言模型的規模競賽，是否已經走到盡頭？未來AI的突破，是不是來自「更像人腦」的架構創新？

這種「從人腦啟發」的路線，與現時主流的數據驅動、統計預測方法大相徑庭。假如Sapient能證明HRM的可擴展性，讓小型模型在推理、規劃和多步學習方面大幅超越巨型LLM，那麼整個AI產業可能會迎來一場技術和資本路線的大洗牌。

此外，這個故事也反映了全球人才流動和中美科技競爭的新格局——兩位在美國成長的華裔青年，選擇在中國最頂尖的工程學府實現創新，這種跨文化、跨地域的創業路徑，為香港甚至整個大中華地區的青年帶來啟發。

最後，Sapient團隊堅持「元目標」這種人生哲學，無論對個人還是企業來說，都是一種極具前瞻性的價值觀。當AI發展進入人機共生、甚至競爭的階段，如何設計AI的「目標」和「倫理」，將會比技術本身更加重要。

未來十年，人類與AI的關係將迎來激烈變革，香港的創業者與科技人才，或許可以從Sapient這個故事中，找到屬於自己的啟發和定位。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Download TXT

拒絕馬斯克：千禧AI超越OpenAI

✨🎱 Instagram留言 →

AI即回覆下期六合彩預測

chatgpt

🎬 YouTube Premium 家庭 Plan成員一位只需 HK$148/年！

拒絕馬斯克：千禧AI超越OpenAI

✨🎱 Instagram留言 →

AI即回覆下期六合彩預測

chatgpt

Related Articles

聖誕廣告熱潮：懷舊如何顛覆創意世界？

美灣AI新勢力：計算力成全球新油源

AI醫療筆記助醫生減少三成文書時間

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年！

🎬 YouTube Premium 家庭 Plan成員一位只需 HK$148/年！