🎬 YouTube Premium 家庭 Plan成員一位 只需
HK$148/年!
不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放
阿里巴巴推出最強開放式編碼模型Qwen3-Coder-480B-A35B-Instruct
阿里巴巴最新發布了其迄今為止最先進的開放式智能編碼模型——Qwen3-Coder-480B-A35B-Instruct,擁有高達4800億個參數,其中活躍參數達350億。該模型原生支持256K的上下文長度,並能透過外推方法將上下文擴展至100萬個標記(token)。
根據阿里巴巴的說法,Qwen3-Coder在多個開源智能編碼基準測試中表現出色,包含SWE-bench-Verified,達到了頂尖水平。
除了模型本身,阿里巴巴還開源了Qwen Code,一款基於命令行的智能編碼工具。該工具源自Gemini Code,並加入了專門設計的提示語和函數調用協議,以充分發揮Qwen3-Coder的強大功能。
阿里巴巴在訓練該模型時使用了高達7.5萬億個標記,70%為程式碼內容,這不僅強化了模型的編碼能力,同時保持了其在通用和數學任務上的表現。模型還經過真實編碼任務的強化學習後訓練,顯著提升了代碼執行的成功率。
開發者可透過多種接口接入Qwen3-Coder,包括Qwen Code、Claude Code和Cline。該模型也可在阿里雲模型工作室通過API使用。
此外,阿里巴巴表示正在開發更多規模的模型版本,目標是在保持強勁性能的同時降低部署成本。公司也在探索該編碼智能代理是否具備自我提升的能力。
—
編者評論:
阿里巴巴這次推出的Qwen3-Coder-480B無疑是目前市面上最具競爭力的開源編碼模型之一。4800億參數的規模配合高比例的程式碼訓練數據,令它在編碼任務上具備強大實力,並且還能處理極長上下文,這對於複雜的軟件開發和多步推理尤為關鍵。相比其他大型語言模型,阿里巴巴在強化學習階段專注於真實世界的代碼執行,這一策略能有效提升模型的實用價值,避免純理論性「空中樓閣」的問題。
同時,阿里開源的Qwen Code工具降低了開發者使用門檻,這有助於推動AI編碼工具的普及和生態建設。未來如果阿里能成功研發出更小型但高效的版本,結合自我優化能力,將極大提升企業和個人開發者的生產力,甚至改變軟件開發的工作流程。
不過,面對市場上眾多大型AI模型競爭者,阿里巴巴如何在技術創新、用戶體驗和生態系統建設上持續領先,仍是其成功關鍵。從全球視角看,中國科技巨頭在AI領域的快速追趕與創新,將為全球技術發展帶來更多活力與挑戰。對香港及華語地區的開發者而言,這意味著更多選擇和合作機會,也促使本地技術社群必須更加積極擁抱AI變革。
以上文章由特價GPT API KEY所翻譯及撰寫。