🎬 YouTube Premium 家庭 Plan成員一位 只需
HK$148/年!
不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放
DeepSeek與即將來臨的AI寒武紀大爆發
對於DeepSeek的興奮感是可以理解的,但我看到的很多反應似乎有些偏離了主題。DeepSeek在大型語言模型(LLM)領域的顯著效率提升,將對LLM應用的性質和經濟產生重大影響。然而,它並不代表在人工通用智能(AGI)方面的根本突破,也不是AI創新重心的根本轉變。這是一個沿著預期軌跡的突然躍升,而不是顛覆性範式的轉變。
DeepSeek的卓越成就反映了技術進步的廣泛歷史模式。在1990年代早期,高端計算機圖形渲染需要超級計算機,而現在則可以在智能手機上完成。面部識別技術,曾經是一個昂貴的小眾應用,現在已成為一個商品特徵。這一原則同樣適用於大型語言模型(LLMs)。驚訝的不是進步的性質,而是速度。
對於那些關注指數技術增長的人來說,這並不令人震驚。技術奇點的概念預測加速變化,尤其是在自動發現和發明的領域,比如AI。隨著我們接近奇點,突破將顯得越來越迅速。DeepSeek只是這一不斷展開的宏觀趨勢中的眾多時刻之一。
DeepSeek的架構創新:令人印象深刻,但並不新穎
DeepSeek的主要成就在於優化效率,而不是重新定義AI架構。它的專家組合(MoE)模型是對一種已建立的集成學習技術的創新調整,這種技術在AI研究中已經使用多年。DeepSeek特別擅長於優化MoE及其他效率技巧,以最小化計算成本:
– 參數效率:DeepSeek的MoE設計一次僅激活6710億個參數中的370億,這意味著它所需的計算能力僅為傳統LLMs的1/18。
– 強化學習推理:DeepSeek的R1模型通過強化學習改善思考鏈推理,而不是依賴手動工程。
– 多標記訓練:DeepSeek-V3可以同時預測多個文本,提高訓練效率。
這些優化使DeepSeek模型的訓練和推理成本比OpenAI或Anthropic等競爭對手便宜一個數量級。這並不是一項微不足道的成就——它是使高質量LLMs更易於獲得的重要一步。但再次強調,這是一項卓越的工程改進,而不是通向AGI的概念飛躍。
開源的力量
DeepSeek的一個重要舉措是將其模型開源。這與OpenAI、Anthropic和Google的封閉策略形成鮮明對比,並向Meta的Yann LeCun致敬。開源AI促進了快速創新、更廣泛的採用和集體改進。雖然專有模型使企業能夠獲得更多直接收入,但DeepSeek的做法則與一個更去中心化的AI未來相符——那裡的工具可供更多研究人員、公司和獨立開發者使用。
支持DeepSeek的對沖基金HighFlyer知道,開源AI不僅僅是關於哲學和為世界做好事;這也是一門好生意。OpenAI和Anthropic在平衡研究和貨幣化方面遇到了困難。DeepSeek開源R1的決定顯示出對不同經濟模型的信心——一種基於服務、企業集成和可擴展托管的模型。這也為全球AI社區提供了一套競爭工具,減少了美國科技巨頭的壟斷。
中國在AI競賽中的角色
一些西方人士對DeepSeek的突破來自中國感到震驚,但我並不感到意外。在中國生活了十年,我親眼見證了對AI研究的投資規模、博士學位的增長,以及對使AI既強大又具成本效益的強烈關注。這並不是中國第一次將西方創新迅速優化以提高效率和規模。
然而,我不僅僅將此視為地緣政治競賽,而是看到它是邁向更全球化AI格局的一步。有效的AGI更有可能通過開放合作而非民族主義的孤立來實現。去中心化的全球分佈式AGI開發努力——而不是單一國家或公司壟斷——讓我們更有希望確保AI能服務於整個人類。
DeepSeek的廣泛影響:超越LLMs的未來
圍繞DeepSeek的熱潮主要集中在其成本效率及其對LLM市場的影響。然而,現在比以往任何時候都更需要我們退一步,考慮更大的圖景。
– LLMs並不是AGI的未來:雖然基於變壓器的模型可以自動化經濟任務並融入各行各業,但它們缺乏核心AGI能力,如基於現實的組合抽象和自我導向推理。
如果AGI在未來十年內出現,則不太可能完全基於變壓器。替代架構——如OpenCog Hyperon和神經形態計算——可能對實現真正的通用智能更為根本。
– LLM的商品化將改變AI投資:DeepSeek的效率提升加速了LLMs成為商品的趨勢。隨著成本的下降,投資者可能會開始關注AI創新的下一個前沿。
這可能推動資金流入超越變壓器的AGI架構、替代AI硬件(例如,聯想處理單元、神經形態芯片)和去中心化的AI網絡。
– 去中心化將塑造AI的未來:AI格局正朝著優先考慮隱私、互操作性和用戶控制的去中心化架構轉變。DeepSeek的效率提升使在去中心化網絡中部署AI模型變得更加容易,減少了對集中式科技巨頭的依賴。
DeepSeek在AI寒武紀大爆發中的角色
DeepSeek代表了AI效率的一個重大里程碑,但它並未重新定義AGI發展的基本軌跡。這是一個沿著可預測曲線的突然加速,而不是範式轉變。儘管如此,它對AI生態系統的影響是顯著的:
– 促使OpenAI和Anthropic等現有企業重新思考其商業模式。
– 使高質量AI變得更加易於獲得和負擔得起。
– 標誌著中國在尖端AI開發中的日益存在。
– 強調了AI進步的指數增長是不可避免的。
最重要的是,DeepSeek的成功應該提醒我們,AGI的發展不僅僅是擴大變壓器。如果我們真正希望建立人類水平的AGI,我們需要超越優化當前模型,投資於根本的新方法。
奇點正在迅速來臨——但如果我們希望它能帶來好處,就必須確保它保持去中心化、全球化和開放。DeepSeek不是AGI,但在邁向變革性AI未來的過程中,這是一個令人振奮的步驟。
在這篇文章中,DeepSeek的出現不僅是技術上的進步,更是對AI未來發展方向的深刻思考。它呼籲我們重新評估當前的技術架構,並探索可能的替代方案,以確保未來的AI能夠以更具人性化的方式服務於社會。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。