中國人工智能初創DeepSeek推出兩款強勁AI模型 挑戰OpenAI GPT-5及Google Gemini-3.0-Pro
中國杭州的人工智能初創公司DeepSeek於周日發布兩款全新AI模型,聲稱其性能可與OpenAI的GPT-5及Google的Gemini-3.0-Pro媲美甚至超越,這或將改寫美國科技巨頭與中國挑戰者之間的競爭格局。
DeepSeek同時推出針對日常推理的DeepSeek-V3.2,以及高性能版本DeepSeek-V3.2-Speciale。後者在四項國際頂尖賽事中取得金牌成績,包括2025年國際數學奧林匹克、國際信息學奧林匹克、ICPC世界決賽及中國數學奧林匹克。
這次發布對美國科技領導地位帶來深遠影響。儘管受到美國出口管制限制中國獲取先進Nvidia晶片,DeepSeek依然成功研發出前沿AI系統,並以MIT開源許可證免費開放模型,令全球開發者均可使用。
DeepSeek項目貢獻者陳方在X(前Twitter)表示:「大家以為DeepSeek只是一時突破,但我們這次回歸得更強大。」網上亦有用戶感嘆:「ChatGPT安息吧。」
DeepSeek稀疏注意力技術大幅降低運算成本
新模型核心是DeepSeek Sparse Attention(DSA),一種創新架構,大幅減輕處理長文本及複雜任務時的計算負擔。傳統AI注意力機制隨輸入長度增加,計算量呈平方級增長,處理雙倍長度文本需要四倍計算。DeepSeek利用「閃電索引器」只篩選最相關內容,忽略無關部分,打破這限制。
根據DeepSeek技術報告,DSA在長序列推理時,推理成本減半,且「大幅降低計算複雜度,同時保持模型性能」。處理約等同300頁書籍的128,000個標記,解碼成本約為每百萬標記0.7美元,較前代模型的2.4美元降低70%。
這批擁有6850億參數的模型支持超長128,000標記上下文視窗,適合分析長篇文檔、代碼庫及研究論文。獨立評測顯示V3.2在長文本基準上表現不輸前代,儘管採用了稀疏注意力機制。
DeepSeek在數學與編程競賽成績媲美GPT-5
DeepSeek聲稱其AI系統在數學、編程及推理任務的多項測試中表現出色。於美國著名數學賽AIME 2025中,DeepSeek-V3.2-Speciale通過率達96.0%,略高於GPT-5-High的94.6%及Gemini-3.0-Pro的95.0%。在哈佛MIT數學大賽中,該模型得分99.2%,超越Gemini的97.5%。
標準版V3.2針對日常應用,AIME得分93.1%,HMMT得分92.5%,稍遜於頂尖模型,但耗費計算資源遠低於對手。
更驚人的是競賽成績。V3.2-Speciale於2025國際數學奧林匹克獲得35分(滿分42分),榮獲金牌;國際信息學奧林匹克得分492/600,名列第10;ICPC世界決賽解決10道題目,排名第二。
值得注意的是,測試過程中模型無法上網或使用外部工具,且嚴格遵守比賽規定的時間及嘗試限制。
在編程測試中,DeepSeek-V3.2能解決73.1%真實軟件錯誤,與GPT-5-High的74.9%不相上下。複雜編程流程測試中得分46.4%,遠勝GPT-5-High的35.2%。
不過DeepSeek坦言仍有不足,技術報告指出「標記效率仍是挑戰」,生成文本長度通常比Gemini-3.0-Pro更長。
讓AI邊思考邊用工具 改變遊戲規則
除了純推理能力,DeepSeek-V3.2引入「工具使用中的思考」能力,能在執行代碼、網絡搜索及文件操作時同步推理。
過去模型每次調用外部工具都會中斷思路,需重新推理。DeepSeek新架構可跨多次工具調用保存推理軌跡,實現流暢多步解題。
為此,公司建構了龐大合成數據管線,生成1800多種任務環境及8.5萬條複雜指令,包括多日旅遊計劃、跨八種程式語言的錯誤修復及多次網絡搜索的研究任務。
技術報告舉例:計劃從杭州出發的三日遊,限制酒店價格、餐廳評分及景點費用,且費用依住宿選擇變化。此類任務「難解易驗」,適合培訓AI代理。
訓練中使用真實工具如網絡搜索API、編程環境及Jupyter筆記本,並生成多樣化合成提示,使模型具備適應未見工具和環境的能力,對實際應用至關重要。
DeepSeek開源策略或顛覆AI行業商業模式
與OpenAI及Anthropic將最強模型視為商業秘密不同,DeepSeek將V3.2及V3.2-Speciale均以MIT開源許可證公開,允許任何開發者、研究者及企業自由下載、修改及部署這些擁有6850億參數的模型。
完整模型權重、訓練代碼及文檔均托管於Hugging Face平台,方便全球分享與合作。
此舉對市場有重大戰略影響。免費提供前沿模型削弱了競爭對手高價API的優勢。Hugging Face模型說明亦附帶Python腳本及測試案例,方便用戶輕鬆轉移自OpenAI等服務。
對企業用戶而言,DeepSeek提供了表現卓越且成本大幅降低的解決方案,且部署靈活。但出於數據主權及監管不確定性,特別是考慮到DeepSeek中國背景,敏感行業採用或受限。
歐美監管壁壘正升起
DeepSeek全球擴張遭遇阻力。今年六月,德國柏林數據保護專員Meike Kamp稱DeepSeek將德國用戶數據傳輸至中國違反歐盟規定,要求蘋果及谷歌考慮封鎖應用。
德國監管機構擔憂中國公司受中國政府嚴格監控,可能導致個人數據被大規模訪問。意大利也於二月封鎖DeepSeek應用。美國國會則推動禁止政府設備使用DeepSeek,強調國家安全風險。
此外,美國出口管制限制中國取得先進AI晶片仍在實施。今年八月,DeepSeek暗示中國將很快有「下一代」自主晶片支持其模型,並透露系統可兼容華為及寒武紀的中國芯片,無需額外配置。
據報DeepSeek最初V3模型曾使用約2000片較舊的Nvidia H800晶片訓練,該晶片現已限制出口中國。公司未披露V3.2訓練硬件,但持續進展顯示出口管制難以完全阻擋中國AI發展。
DeepSeek釋放的訊號:AI競賽進入新階段
此時發布恰逢AI業界面臨泡沫疑慮。DeepSeek以低成本匹敵美國頂尖模型,挑戰了「AI領先需巨額資本」的傳統觀念。
技術報告指出,訓練後投資已超過訓練前10%,這部分資金促進了推理能力提升。但DeepSeek也坦承知識覆蓋仍落後領先專有模型,未來將透過擴大預訓練計算力來彌補。
DeepSeek-V3.2-Speciale將於12月15日停止API服務,其功能將合併進標準版本。Speciale專注於深度推理,不支持工具調用,標準版則補足此缺陷。
目前中美AI競賽已進入新階段。DeepSeek證明開源模型可達前沿性能,效率創新可顯著降低成本,而最強AI系統或將免費向全球開放。
正如X上一位評論者所言:「DeepSeek輕鬆打破Gemini的歷史紀錄,真是瘋狂。」
問題已不再是中國AI能否與矽谷競爭,而是美國企業能否在中國對手免費提供同等技術的情況下保持領先。
—
記者評論與分析
DeepSeek的最新發布不僅是技術突破,更是全球AI產業生態的深刻變革信號。它打破了長期以來由美國主導的AI技術壟斷局面,尤其在硬件受限與出口管制的嚴峻條件下,依然能以開源策略高效推進,令人刮目相看。
稀疏注意力機制的成功應用,意味著AI模型在處理超長文本與複雜任務上的成本與效率瓶頸將被大幅改善,有望推動更多實際應用場景落地,尤其是在法律、醫療、科研等需處理大量資料的領域。
此外,DeepSeek「思考中使用工具」的設計理念,極大提升了AI解決問題的靈活度與實用性,這是未來AI助理與自動化系統不可或缺的能力。它展示了AI不僅是被動回答問題,更可主動調用外部資源、多步推理,向真正智能代理邁進。
開源策略則可能顛覆現有商業模式,促使市場從高價壟斷逐步過渡到開放共享。這對創新者和中小企業無疑是巨大機遇,但同時也為監管帶來挑戰:數據安全、技術濫用及國際政治風險將成為未來監管重點。
對香港及全球用戶而言,DeepSeek的出現提醒我們,AI競賽已非單純技術較量,而是涉及資源分配、政策監管與國際關係的複雜博弈。如何在享受技術紅利的同時,建立合理的監管框架,保障數據隱私與國家安全,將是未來數年最重要的課題。
總結來說,DeepSeek的崛起不僅反映中國AI技術的快速進步,也昭示全球AI生態將更加多元與開放。面對這波浪潮,香港媒體及業界應持續關注技術發展與政策動向,助力本地產業把握機遇,迎接智能時代的新挑戰。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。
🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年!
不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放
