
中國AI崛起:小米推出全新MiMo-7B模型系列,DeepSeek升級其Prover數學AI
小米公司今日發布了MiMo-7B系列推理模型,宣稱在某些任務上能超越OpenAI的o1-mini模型。這套算法系列以開源授權形式提供,與此同時,DeepSeek也推出了其Prover模型的升級版本,兩者均屬於開源推理模型。不過,DeepSeek的Prover專注於輔助數學家證明定理,範疇較為狹窄。
MiMo-7B系列模型擁有約70億個參數,包含一個基礎模型及多個強化版本,後者提供更高質素的輸出。小米透過兩種機器學習技術——監督式微調和強化學習,來開發這些強化版本。監督式微調利用包含解釋說明的數據集,以指導AI的訓練流程;而強化學習則不依賴這類解釋說明。
小米共開發了三個強化版本:一個使用監督式微調、一個使用強化學習,還有一個結合兩者。據公司表示,結合兩種方法的版本在生成程式碼和解決數學問題方面,表現優於OpenAI的o1-mini。基礎版MiMo-7B的能力雖不及強化版,但仍能超越許多參數規模更大的模型。小米研究團隊在GitHub上指出:「我們對MiMo-7B基礎版進行的強化學習實驗顯示,該模型擁有非凡的推理潛力,甚至能超越規模達320億參數的模型。」
除了MiMo-7B系列,DeepSeek今日也悄然發布了Prover的升級版——Prover-V2。此模型專為數學定理證明優化,承諾在神經定理證明領域達到最新的頂尖表現。DeepSeek透過多步驟訓練流程打造Prover-V2。首先,收集已有證明的定理,接著利用兩個語言模型生成數學家如何一步步達成證明的解釋,最後將這些AI生成的解釋輸入Prover-V2,教導模型自行生成證明。DeepSeek研究人員解釋:「這一過程讓我們能將非正式與正式的數學推理整合到一個統一模型中。」
MiMo-7B和Prover-V2的發布,正值阿里巴巴集團日前推出其新旗艦推理優化模型系列Qwen3之後。Qwen3的模型參數規模從6億至2350億不等,阿里宣稱該系列在多項任務中均超越了OpenAI的o1及DeepSeek的旗艦R1推理模型。
—
編者評論:
小米與DeepSeek這兩家中國企業在推理型AI領域的最新動作,彰顯了中國科技公司在人工智能競賽中的積極布局與技術實力提升。值得注意的是,小米採取開源策略,這不僅促進了AI社群的合作與創新,也有助於提升其模型的透明度和可檢驗性,這是與OpenAI等西方科技巨頭形成差異的一大優勢。此外,MiMo-7B在僅有70億參數的規模下,便能超越部分數十億參數的模型,顯示出中國在模型優化和訓練技術上的突破。
DeepSeek將數學定理證明作為目標,則體現了AI應用細分市場的潛力。數學證明的自動化不僅對學術研究有重大意義,更能推動科學技術的發展與創新。其將非正式與正式推理結合的訓練方法,為AI在嚴謹邏輯推理領域的發展樹立了新標杆。
同時,阿里巴巴推出涵蓋從小到超大規模參數的Qwen3模型系列,展示了中國企業在AI硬件資源與算法規模上的雄厚實力。這種多層次的模型策略,既能滿足不同應用需求,也有助於在全球AI競賽中佔據一席之地。
總括而言,這些發展不只是技術上的進步,更是中國在全球AI產業鏈中逐步邁向領導地位的明證。未來,隨著更多開源推理模型的出現,全球AI生態將更加多元且競爭激烈,而中國的這波崛起值得持續關注。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。