阿里巴巴支持的Moonshot AI推出新開源模型,與DeepSeek競爭
中國人工智能初創公司Moonshot AI近日推出了一款名為Kimi K2的新開源AI模型。該模型的推出是中國公司開源其AI模型的趨勢的一部分,這與許多美國科技巨頭如OpenAI和Google的做法形成鮮明對比。後者通常將其最先進的模型保留為專有技術。
Kimi K2模型旨在更有效地分解複雜任務。Moonshot AI聲稱,該模型在某些領域優於主流開源模型,包括DeepSeek的V3,以及Anthropic等美國領先模型的某些功能,如編碼。 這使得Moonshot AI在競爭中重新奪回市場份額。
### Kimi K2挑戰DeepSeek的V3
Kimi K2模型具有1萬億個參數,其中32億個參數通過專家混合架構同時啟用。該模型發布了兩個版本:一個面向研究人員和開發者的基礎模型,另一個是針對聊天和自主代理用例的指令調優版本。該模型的關鍵優勢在於其針對“代理”能力的優化,使其能夠自主使用工具、生成和運行代碼,以及在無需人類輸入的情況下執行複雜的多步驟任務。
在基準測試中,Kimi K2在SWE-bench Verified上獲得了65.8%的成績,這是一個要求苛刻的軟件工程基準測試,超過了大多數開源模型,並與一些專有模型的性能相匹配。在LiveCodeBench上,被廣泛認為是最真實的編碼基準測試中,它實現了53.7%的準確度,顯著優於DeepSeek的V3(46.9%)和OpenAI的GPT-4.1(44.7%)。最值得注意的是,它在MATH-500上達到了97.4%,超過了GPT-4.1的92.4%,表明Moonshot可能已經在數學推理方面取得了突破,這是其更大的競爭對手所未能實現的。
### 以遠低於競爭對手的成本交付結果
Moonshot AI以遠低於競爭對手的成本交付結果。雖然OpenAI在計算上投入了數億美元,但Moonshot找到了一條更高效的路線來實現相同的目標。該公司已開源Kimi K2,並同時提供具有競爭力的API定價。 每百萬輸入令牌(緩存命中)為0.15美元,每百萬輸出令牌為2.50美元,Moonshot的定價遠低於OpenAI和Anthropic,同時匹配甚至超越了它們的性能。
作為編輯,我認為Moonshot AI的Kimi K2模型是中國人工智能領域的一個重要突破。該模型的開源和具有競爭力的定價策略可能會對全球人工智能市場產生深遠影響。同時,Kimi K2在編碼和數學推理方面的卓越性能也表明了Moonshot AI在人工智能研究方面的實力。然而,開源模型也帶來了諸如模型濫用和安全風險等挑戰,Moonshot AI需要繼續加強對模型的監管和安全管理。
此外,Moonshot AI的成功也反映了中國在人工智能領域的快速發展和創新能力。中國政府對人工智能的重視和支持為中國人工智能企業的發展創造了有利的環境。同時,中國市場的廣闊需求也為中國人工智能企業提供了廣闊的發展空間。
總之,Moonshot AI的Kimi K2模型是中國人工智能領域的一個重要突破,具有廣闊的發展前景和深遠的影響。
