阿里巴巴推出Qwen3:開源AI新標準,混合推理模式挑戰全球同業
杭州市,2025年4月29日 — 阿里巴巴正式發佈最新一代開源大型語言模型(LLM)家族——Qwen3,為全球AI創新樹立新標竿。
Qwen3系列包括六款「密集模型」及兩款「專家混合模型(MoE)」,為開發者帶來前所未有的靈活性,無論是手機、智能眼鏡、自動駕駛車、機械人等次世代應用,都能輕鬆部署。所有Qwen3模型,包括密集模型(0.6B、1.7B、4B、8B、14B及32B參數)和MoE模型(30B有3B激活、235B有22B激活),現已全面開源,全球開發者可即時下載使用。
混合推理:思考與反應雙模式,應對多元場景
Qwen3是阿里巴巴首次推出混合推理模型,結合傳統LLM的理解力與動態推理能力。Qwen3模型可根據任務難度自動切換「思考模式」和「非思考模式」:遇到數學、編程、邏輯推理等複雜多步驟任務時會進入深度思考,處理一般查詢則以高速反應為主。
開發者透過API調用Qwen3時,可細緻控制「思考時間」(最高支援38,000個Token),靈活平衡智能表現與運算效能。值得一提,Qwen3-235B-A22B MoE模型大幅降低部署成本,對比同級AI模型更易普及,落實阿里巴巴「高效能AI人人可用」的承諾。
語言多元、智能代理、推理能力、人機互動全面突破
Qwen3以36萬億Token巨量數據訓練,比前代Qwen2.5多一倍,於推理、指令理解、工具調用、多語言處理等多方面實現重大飛躍:
- 多語言精通:支援119種語言及方言,翻譯及多語指令理解能力領先同業。
- 智能代理整合:原生支援Model Context Protocol(MCP)及高效能函數調用,於複雜代理任務領先其他開源模型。
- 推理能力突出:數學、編程、邏輯推理等多項評測均超越前代(QwQ思考模式及Qwen2.5非思考模式)。
- 人機互動自然:創意寫作、角色扮演、多輪對話等體驗更自然流暢,對話更貼近真人。
Qwen3在模型架構、訓練數據量及訓練方法多方面革新,於AIME25(數學推理)、LiveCodeBench(編程)、BFCL(工具及函數調用)、Arena-Hard(指令微調LLM)等業界權威評測均達頂尖水平。混合推理模型訓練分為四階段:長鏈思維冷啟動、基於推理的強化學習(RL)、思考模式融合及通用RL,令模型表現更上一層樓。
全面開源,激發全球創新
Qwen3模型現已於Hugging Face、GitHub及ModelScope等平台免費開放下載,並可於chat.qwen.ai線上體驗。API即將於阿里巴巴AI開發平台Model Studio上線。Qwen3亦已成為阿里巴巴旗艦AI超級助手應用Quark的核心引擎。
自Qwen模型家族面世以來,全球下載量已突破三億,開發者於Hugging Face平台創建逾十萬個Qwen衍生模型,Qwen已成全球最受歡迎的開源AI模型系列之一。
阿里巴巴集團簡介
阿里巴巴集團以「讓天下沒有難做的生意」為使命,致力打造未來商業基礎設施,期望用戶能在阿里巴巴「相遇、工作、生活」,成為一家能夠持續102年的好公司。
編輯評論:Qwen3與中國AI開源戰略的深層意義
阿里巴巴今次推出Qwen3,無疑是中國AI產業在全球開源賽道上的一次高調宣示。Qwen3不僅以多語言、多場景、混合推理等技術突破,實質上更代表著中國科技企業在AI自主創新和全球話語權爭奪上的新嘗試。特別值得香港業界關注的是:
- 首先,Qwen3的開源策略大幅降低AI技術門檻,令中小企業、初創甚至學界都可直接利用頂尖AI模型,這對香港本地AI應用創新將產生深遠影響。
- 其次,Qwen3的混合推理設計,回應了現時AI應用對「深度思考」與「即時反應」兼備的實際需求。這種彈性,對金融、法律、醫療等高要求場景特別有價值。
- 第三,阿里巴巴強調多語言能力,尤其支援方言,這對於多語社會如香港、東南亞等地區,能大幅提升AI本地化體驗,突破語言壁壘。
- 最後,Qwen3的開源生態已具一定規模,全球開發者的參與將令其持續優化,有望形成抗衡美國OpenAI、Google等巨頭的中國AI開源陣營。
然而,從批判角度看,Qwen3能否真正「顛覆」全球AI格局,還要看其在開發社群、國際監管、數據安全等層面的長期表現。中國AI開源雖然聲勢浩大,但要贏得歐美主流市場認可,還需面對透明度、信任度等制度性挑戰。
總結而言,Qwen3是中國AI產業的一次重要里程碑,為香港及全球華語開發者帶來前所未有的機會,同時也將推動全球AI競爭格局進一步多元化。未來,如何善用這類開源AI資源,結合本地創新與國際合作,將是香港科技界值得深思的課題。