
中國人工智能初創DeepSeek推出R1推理模型更新 加劇與美國對手競爭
上海消息 — 中國人工智能初創公司DeepSeek於週四凌晨在開發者平台Hugging Face推出了其R1推理模型的更新版本R1-0528,進一步加劇與美國人工智能巨頭如OpenAI的競爭。儘管尚未正式公開宣布此更新,DeepSeek亦未發布詳細的模型介紹或性能比較,但該模型已在由加州大學伯克利分校、麻省理工學院及康奈爾大學研究人員開發的LiveCodeBench排行榜上登場。
在這個專注於代碼生成的基準排行榜中,DeepSeek更新後的R1模型表現僅略遜於OpenAI的o4 mini及o3推理模型,並且優於xAI的Grok 3 mini和阿里巴巴的Qwen 3模型。
彭博社於週三報導,DeepSeek一名代表曾在微信群組中透露,這次更新屬於「小規模試驗升級」,用戶已可開始測試新版本。
今年早些時候,DeepSeek打破了外界普遍認為美國出口管制限制了中國人工智能發展的觀念,推出了性能媲美甚至超越美國頂尖模型的AI產品,且成本僅為後者的一小部分。R1模型於今年一月問世,當時引發海外科技股大幅下跌,也挑戰了業界認為發展先進AI必須投入龐大計算資源和資金的傳統看法。自R1發布以來,中國科技巨頭如阿里巴巴和騰訊也相繼推出宣稱性能超越DeepSeek的模型。
另一方面,谷歌的Gemini模型則推出了優惠的使用層級,而OpenAI則調降價格並推出了計算資源需求較低的o3 Mini模型,顯示美國巨頭亦在積極調整策略應對市場變化。
業界普遍預期DeepSeek將於不久後發布R1的後繼版本R2。路透社引述消息人士於三月報導,R2原計劃於五月發布。DeepSeek同時在三月推出了其V3大型語言模型的升級版本。
—
評論與啟示
DeepSeek的最新更新不僅展示了中國初創AI企業在技術研發上的強大實力,亦凸顯了全球AI競爭格局的深刻變化。傳統觀念認為頂尖AI模型的研發離不開龐大資金及計算力支持,但DeepSeek以相對低廉的成本挑戰這一認知,反映出中國在算法優化和資源利用效率方面取得的突破。
此外,這場競爭不再只是技術層面的較量,更牽涉到市場策略和生態系統建設。OpenAI和谷歌透過價格調整和推出輕量級模型,試圖維持其市場領先地位;而中國企業則藉由快速迭代和多元化產品線,爭取更大市場份額。這種多方角力將促使人工智能技術更快成熟,同時推動全球AI應用落地。
對香港及全球投資者而言,深刻理解這些技術背後的競爭動態,有助把握未來科技發展趨勢及投資機會。尤其在AI技術日益成為經濟和社會核心的當下,誰能在創新與成本效益間找到最佳平衡,誰就可能成為下一個市場的贏家。
總結來說,DeepSeek的持續進步證明,中國不僅在AI硬件上具備一定優勢,更在核心算法和模型設計上具備與國際巨頭比肩的實力,未來全球AI版圖或將更加多元且充滿變數。香港作為國際金融中心,也應密切關注這些技術發展,積極培育相關產業鏈,為本地科技生態注入新的活力。
以上文章由特價GPT API KEY所翻譯及撰寫。