DeepSeek並非一個斯普特尼克時刻,而是一個Model T時刻
作為一名每天都在思考人工智能(AI)的人,看到哪些事件能突破AI泡沫,進而引起更廣泛公眾的關注,總是令人著迷。2022年11月的ChatGPT無疑是其中之一。谷歌的NotebookLM雖然也有潛力,但未能達到「從祖母那裡發送短信」的病毒式傳播水平。然而,隨著DeepSeek推出其R1模型,本週又出現了一個與ChatGPT同樣具有影響力的事件,再次引發了人們對配偶和同事的文本質疑。
這個話題已經引發了無數的討論,如果你已經厭倦了這個主題,我在此先行道歉。然而,我希望這篇文章能給你帶來布拉德·德隆所稱的「替代價值」,因為它展示了各種觀點在當前更廣泛敘事中的位置。我還將聚焦於「Model T」的方面,我覺得這一點有些被忽視了。
地緣政治觀點
首先,從地緣政治的角度看,我們可以更正式地稱之為美中之間的差距。這就是為什麼馬克·安德森等人將DeepSeek稱為「斯普特尼克時刻」。長期以來,普遍認為中國在人工智能模型的開發上落後美國1-2年。然而,這一假設在本週被打破,事實上,中國僅落後幾個月。這也與美國長期以來對中國的看法有關,即中國只是快速跟隨者,僅僅能夠模仿美國。DeepSeek的工程師們通過開創一些非常智能的機器學習技術,如更有效地利用專家混合(MOE)和多頭潛在注意力(MLA),終結了這一觀點。因此,這對許多美國人來說無疑是一個震驚。然而,斯普特尼克的類比本身並不完全成立。鑑於美國已經對AI投入了大量關注和資金,這一「斯普特尼克時刻」將如何改變局面仍然不明朗。特朗普、奧特曼等人剛剛宣布為Stargate提供5000億美元的資金,那麼他們會怎麼應對DeepSeek,宣布再提供5000億美元嗎?這似乎有些困難,因為Stargate的資金大部分早在幾年前就已承諾,而剩下的資金可能是不存在的虛擬資金。
貿易政策觀點
其次,從貿易政策的角度看,或更正式地質疑出口控制的有效性。許多人將DeepSeek的優勢視為芯片出口控制失敗的標誌。這是拜登和特朗普政府之間少數幾個重疊的領域之一,特朗普原本預計會維持拜登的限制。這一假設也被許多人打破,聲稱「看看,這是反效果,我們忘記了需求是創新的母親——這只會讓中國更有可能創新」。這是一種自然但不正確的看法。首先,它顯示出對時間線的錯誤理解,因為DeepSeek使用的大部分芯片是在限制實施之前獲得的。它還錯誤地假設DeepSeek如果有更多更好的芯片,將無法達到更好的性能,並不會渴望更多更好的芯片。顯然,芯片仍然至關重要。如果有什麼可以肯定的話,那就是DeepSeek顯示了數據、計算和算法三者的結合仍然非常重要,我們不會在短期內面臨任何一種資源的短缺(DeepSeek還使用了大量的合成數據)。
經濟觀點
第三,從經濟的角度看,或更準確地說,是閉源模型和開源模型之間的差距。過去幾年,無論是上市公司如Nvidia,還是私營公司如OpenAI,所有在AI價值鏈中的公司的估值都飆升。它們的高估值部分來自於對最終將擁有壟斷和護城河的假設。根據這一觀點,對於Nvidia而言,R1的訓練成本顯然更低,這意味著未來需要的芯片數量會減少;而對於OpenAI而言,模型能力的快速複製則意味著他們不會對其產品收取高額利潤。這一觀點也可能是錯誤的。對於上市公司而言,在長期股價上漲之後,許多資產經理可能會選擇在此時獲利了結。還有傳言稱,真正動搖市場的是特朗普即將對台灣發出關稅威脅的消息。如果最近的傳言是正確的,OpenAI的估值似乎並未受到太大影響,因為它正在進行一輪400億美元的新融資。即使它在模型上的領先地位正在減弱,其轉型為產品公司的努力似乎也取得了成功。即使AI模型變得商品化,在AI企業市場中佔據主導地位仍然能保證OpenAI的良好利潤。
產品觀點
第四,從產品的角度看。有些人認為,在DeepSeek的故事中,產品設計選擇才是關鍵。更具體地說,因為這是AI領域一段時間以來的第一次「祖母文本」時刻,大部分近期的AI發展都在雷達下進行。因此,這是普通AI用戶第一次體驗模型在實時顯示其思考過程。這被視作解釋DeepSeek應用程式在更廣泛公眾中出人意料受歡迎的一個因素。這也可能與美國市場上極受歡迎的中國應用程式的有趣趨勢有關。看到美國中部地區的用戶湧向一款以毛澤東命名,且充滿難以理解的語言和文化參考的應用程式,實在是相當奇怪。
簡單的快樂觀點
最後,還有一種簡單的快樂觀點。所有那些對硅谷科技兄弟及其在美國政府中新獲得的影響力大聲抱怨的人,看到山姆·奧特曼和他的團隊受到挫折都感到高興。同樣地,特朗普政府的失利也讓人們感到快慰。特朗普政府在新權力的驕傲中發出了一系列行政命令(實際上大多數都是偏向極右),人們似乎樂於見到任何威脅其信心的事物。這一觀點可能有一定的解釋力,因為其中涉及的情感強烈。
然而,我想強調的是一個我認為有些被低估的方面——即即將來臨的AI普及性。R1的發布可能更像是一個「Model T時刻」而非斯普特尼克時刻。福特的Model T發布標誌著汽車成為大眾市場產品的開始。這可能成為一個類似的轉折點,導致擁有超人推理能力的AI變得無處不在。R1是一個新的「推理模型」範式,具備在數學和編碼等任務上超越人類的能力,這在開源之前尚未見過。此外,訓練成本極其低廉,運行成本也非常低。人們對具體數字進行了爭論,當然,訓練模型的總成本並不僅僅是600萬美元。然而,這忽略了更大的觀點,不論成本如何,這一數字都遠低於其他可比模型的數量級。無論這一成本優勢是通過更具法律爭議的方法(如蒸餾)還是純粹通過工程天才的方式實現的,這並不重要,因為DeepSeek證明未來無論哪種方式都將大量存在。
推理模型是推理時期計算的新範式的開始,模型在生成答案時使用計算能力,除了在訓練期間外。這一範式才剛剛開始。事實上,一家小型新創公司使用舊一代芯片能在短短幾個月內複製最先進的性能,這表明未來幾年將會有許多非常強大的模型出現。此外,使用R1進行推理的成本也遠低於在OpenAI的o1上進行推理,這表明我們將很快在每個設備上擁有「便宜到無法計量」的智能。這種普遍存在的智能對全球南方國家可能是個好消息,印度似乎已經注意到了這一點。這對於小型AI公司,以及科學進步整體來說都是利好消息。但尚不清楚這是否對於基於其一項巨大優勢——廣泛分佈的無與倫比的智能,登上食物鏈頂端的物種來說是好消息。
這篇文章引發了對AI未來的深思,尤其是DeepSeek的R1模型所象徵的潛在變革。隨著技術的進步,AI的普及將可能改變我們的生活方式、工作模式和社會結構,這是值得我們持續關注和思考的問題。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。