DeepSeek破格AI技術挑戰美國霸主地位

Ai

✨🎱 Instagram留言 →

AI即回覆下期六合彩預測

🧠 AI 根據統計數據即時生成分析

💬 只要留言,AI就會即刻覆你心水組合

🎁 完!全!免!費!快啲嚟玩!

IG 貼文示意圖
AI 即時回覆示意圖

下期頭獎號碼

📲 去 Instagram 即刻留言


中國人工智能初創DeepSeek推出兩款強勁AI模型 挑戰OpenAI GPT-5及Google Gemini-3.0-Pro

中國杭州的人工智能初創公司DeepSeek於周日發布兩款全新AI模型,聲稱其性能可與OpenAI的GPT-5及Google的Gemini-3.0-Pro媲美甚至超越,這或將改寫美國科技巨頭與中國挑戰者之間的競爭格局。

DeepSeek同時推出針對日常推理的DeepSeek-V3.2,以及高性能版本DeepSeek-V3.2-Speciale。後者在四項國際頂尖賽事中取得金牌成績,包括2025年國際數學奧林匹克、國際信息學奧林匹克、ICPC世界決賽及中國數學奧林匹克。

這次發布對美國科技領導地位帶來深遠影響。儘管受到美國出口管制限制中國獲取先進Nvidia晶片,DeepSeek依然成功研發出前沿AI系統,並以MIT開源許可證免費開放模型,令全球開發者均可使用。

DeepSeek項目貢獻者陳方在X(前Twitter)表示:「大家以為DeepSeek只是一時突破,但我們這次回歸得更強大。」網上亦有用戶感嘆:「ChatGPT安息吧。」

DeepSeek稀疏注意力技術大幅降低運算成本

新模型核心是DeepSeek Sparse Attention(DSA),一種創新架構,大幅減輕處理長文本及複雜任務時的計算負擔。傳統AI注意力機制隨輸入長度增加,計算量呈平方級增長,處理雙倍長度文本需要四倍計算。DeepSeek利用「閃電索引器」只篩選最相關內容,忽略無關部分,打破這限制。

根據DeepSeek技術報告,DSA在長序列推理時,推理成本減半,且「大幅降低計算複雜度,同時保持模型性能」。處理約等同300頁書籍的128,000個標記,解碼成本約為每百萬標記0.7美元,較前代模型的2.4美元降低70%。

這批擁有6850億參數的模型支持超長128,000標記上下文視窗,適合分析長篇文檔、代碼庫及研究論文。獨立評測顯示V3.2在長文本基準上表現不輸前代,儘管採用了稀疏注意力機制。

DeepSeek在數學與編程競賽成績媲美GPT-5

DeepSeek聲稱其AI系統在數學、編程及推理任務的多項測試中表現出色。於美國著名數學賽AIME 2025中,DeepSeek-V3.2-Speciale通過率達96.0%,略高於GPT-5-High的94.6%及Gemini-3.0-Pro的95.0%。在哈佛MIT數學大賽中,該模型得分99.2%,超越Gemini的97.5%。

標準版V3.2針對日常應用,AIME得分93.1%,HMMT得分92.5%,稍遜於頂尖模型,但耗費計算資源遠低於對手。

更驚人的是競賽成績。V3.2-Speciale於2025國際數學奧林匹克獲得35分(滿分42分),榮獲金牌;國際信息學奧林匹克得分492/600,名列第10;ICPC世界決賽解決10道題目,排名第二。

值得注意的是,測試過程中模型無法上網或使用外部工具,且嚴格遵守比賽規定的時間及嘗試限制。

在編程測試中,DeepSeek-V3.2能解決73.1%真實軟件錯誤,與GPT-5-High的74.9%不相上下。複雜編程流程測試中得分46.4%,遠勝GPT-5-High的35.2%。

不過DeepSeek坦言仍有不足,技術報告指出「標記效率仍是挑戰」,生成文本長度通常比Gemini-3.0-Pro更長。

讓AI邊思考邊用工具 改變遊戲規則

除了純推理能力,DeepSeek-V3.2引入「工具使用中的思考」能力,能在執行代碼、網絡搜索及文件操作時同步推理。

過去模型每次調用外部工具都會中斷思路,需重新推理。DeepSeek新架構可跨多次工具調用保存推理軌跡,實現流暢多步解題。

為此,公司建構了龐大合成數據管線,生成1800多種任務環境及8.5萬條複雜指令,包括多日旅遊計劃、跨八種程式語言的錯誤修復及多次網絡搜索的研究任務。

技術報告舉例:計劃從杭州出發的三日遊,限制酒店價格、餐廳評分及景點費用,且費用依住宿選擇變化。此類任務「難解易驗」,適合培訓AI代理。

訓練中使用真實工具如網絡搜索API、編程環境及Jupyter筆記本,並生成多樣化合成提示,使模型具備適應未見工具和環境的能力,對實際應用至關重要。

DeepSeek開源策略或顛覆AI行業商業模式

與OpenAI及Anthropic將最強模型視為商業秘密不同,DeepSeek將V3.2及V3.2-Speciale均以MIT開源許可證公開,允許任何開發者、研究者及企業自由下載、修改及部署這些擁有6850億參數的模型。

完整模型權重、訓練代碼及文檔均托管於Hugging Face平台,方便全球分享與合作。

此舉對市場有重大戰略影響。免費提供前沿模型削弱了競爭對手高價API的優勢。Hugging Face模型說明亦附帶Python腳本及測試案例,方便用戶輕鬆轉移自OpenAI等服務。

對企業用戶而言,DeepSeek提供了表現卓越且成本大幅降低的解決方案,且部署靈活。但出於數據主權及監管不確定性,特別是考慮到DeepSeek中國背景,敏感行業採用或受限。

歐美監管壁壘正升起

DeepSeek全球擴張遭遇阻力。今年六月,德國柏林數據保護專員Meike Kamp稱DeepSeek將德國用戶數據傳輸至中國違反歐盟規定,要求蘋果及谷歌考慮封鎖應用。

德國監管機構擔憂中國公司受中國政府嚴格監控,可能導致個人數據被大規模訪問。意大利也於二月封鎖DeepSeek應用。美國國會則推動禁止政府設備使用DeepSeek,強調國家安全風險。

此外,美國出口管制限制中國取得先進AI晶片仍在實施。今年八月,DeepSeek暗示中國將很快有「下一代」自主晶片支持其模型,並透露系統可兼容華為及寒武紀的中國芯片,無需額外配置。

據報DeepSeek最初V3模型曾使用約2000片較舊的Nvidia H800晶片訓練,該晶片現已限制出口中國。公司未披露V3.2訓練硬件,但持續進展顯示出口管制難以完全阻擋中國AI發展。

DeepSeek釋放的訊號:AI競賽進入新階段

此時發布恰逢AI業界面臨泡沫疑慮。DeepSeek以低成本匹敵美國頂尖模型,挑戰了「AI領先需巨額資本」的傳統觀念。

技術報告指出,訓練後投資已超過訓練前10%,這部分資金促進了推理能力提升。但DeepSeek也坦承知識覆蓋仍落後領先專有模型,未來將透過擴大預訓練計算力來彌補。

DeepSeek-V3.2-Speciale將於12月15日停止API服務,其功能將合併進標準版本。Speciale專注於深度推理,不支持工具調用,標準版則補足此缺陷。

目前中美AI競賽已進入新階段。DeepSeek證明開源模型可達前沿性能,效率創新可顯著降低成本,而最強AI系統或將免費向全球開放。

正如X上一位評論者所言:「DeepSeek輕鬆打破Gemini的歷史紀錄,真是瘋狂。」

問題已不再是中國AI能否與矽谷競爭,而是美國企業能否在中國對手免費提供同等技術的情況下保持領先。

記者評論與分析

DeepSeek的最新發布不僅是技術突破,更是全球AI產業生態的深刻變革信號。它打破了長期以來由美國主導的AI技術壟斷局面,尤其在硬件受限與出口管制的嚴峻條件下,依然能以開源策略高效推進,令人刮目相看。

稀疏注意力機制的成功應用,意味著AI模型在處理超長文本與複雜任務上的成本與效率瓶頸將被大幅改善,有望推動更多實際應用場景落地,尤其是在法律、醫療、科研等需處理大量資料的領域。

此外,DeepSeek「思考中使用工具」的設計理念,極大提升了AI解決問題的靈活度與實用性,這是未來AI助理與自動化系統不可或缺的能力。它展示了AI不僅是被動回答問題,更可主動調用外部資源、多步推理,向真正智能代理邁進。

開源策略則可能顛覆現有商業模式,促使市場從高價壟斷逐步過渡到開放共享。這對創新者和中小企業無疑是巨大機遇,但同時也為監管帶來挑戰:數據安全、技術濫用及國際政治風險將成為未來監管重點。

對香港及全球用戶而言,DeepSeek的出現提醒我們,AI競賽已非單純技術較量,而是涉及資源分配、政策監管與國際關係的複雜博弈。如何在享受技術紅利的同時,建立合理的監管框架,保障數據隱私與國家安全,將是未來數年最重要的課題。

總結來說,DeepSeek的崛起不僅反映中國AI技術的快速進步,也昭示全球AI生態將更加多元與開放。面對這波浪潮,香港媒體及業界應持續關注技術發展與政策動向,助力本地產業把握機遇,迎接智能時代的新挑戰。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放

立即升級 🔗