高盛首評阿里巴巴混合式Qwen3模型:中國AI賽道再升級
中國人工智能競賽愈演愈烈,阿里巴巴最新推出的Qwen3開源大型語言模型(LLM)家族,令中國AI領域再掀高潮。高盛分析師向客戶表示,這一系列新模型,標誌著中國AI發展持續繁榮。
Qwen3表現超越同儕 混合推理模式成亮點
Qwen團隊周二在官網發佈博文,展示旗艦型號Qwen3-235B-A22B在編程、數學、通用能力等多項基準測試中,與DeepSeek-R1、o1、o3-mini、Grok-3及Gemini-2.5-Pro等其他頂級LLM對比下,取得極具競爭力的成績。
Qwen表示,Qwen3-235B-A22B採用「混合推理」設計,可在「思考模式」與「非思考模式」之間切換,靈活處理不同問題,提升推理效率及成本控制。
社交平台亦有開發者大讚:「簡直難以置信這只是0.6B參數的LLM!阿里巴巴Qwen3系列混合推理模型,讓用戶可根據任務需求調節模型‘思考’的深度,甚至可以直接在瀏覽器WebGPU本地運行!」
高盛:Qwen3七大觀察重點
高盛分析師Ronald Keung、Timothy Zhao及團隊,在審視Qwen3-235B-A22B後,向客戶歸納出七大重點:
1. 旗艦型號在編程、數學等多項基準測試領先DeepSeek-R1、o1等同級對手。
2. 性能進一步提升同時,推理成本更低,小型MoE模型(Qwen3-30B-A3B)以更少激活參數實現更高效能。
3. 小型模型支援本地部署,適用於手機、智能眼鏡、自動駕駛、機械人等邊緣應用場景。
4. 融合「思考」與「非思考」模式,企業用戶可動態調整推理成本。
5. 預訓練資料集大幅擴展,Qwen3用上36萬億token(Qwen2.5僅18萬億)。
6. 支援MCP(模型上下文協議),增強AI代理能力。
7. 全球可用,支援119種語言及方言。阿里雲早前亦宣布,2025年1月AI模型API調用量較2024年12月激增近100倍,接入PAI平台的企業數目亦突破萬家。
高盛對阿里巴巴(BABA)維持「買入」評級,12個月目標價159美元,理由包括中國本地電商盈利穩定,以及阿里雲作為中國最大雲服務商,AI模型及應用場景領先,收入高速增長。
美國收緊晶片出口 中美AI競賽進入白熱化
隨著中國DeepSeek、阿里等公司加速AI模型研發,美國勢必進一步收緊高端AI晶片出口。近期美國已禁止出口Nvidia H20 AI晶片予中國,而被美國列入黑名單的華為亦宣布測試新一代Ascend 910D AI晶片,性能甚至超越Nvidia H100。
華盛頓分析師Ray Wang接受CNBC訪問時指出:「阿里巴巴Qwen3系列的發佈,再次證明中國實驗室即使面對美國出口管制壓力,依然具備開發高競爭力、創新及開源模型的能力。」
Wang更警告:「中美AI賽道的差距已經大幅縮窄,現時可能只剩幾個月,甚至幾星期的距離。隨著Qwen3發佈及DeepSeek R2即將登場,這個差距不但難以擴大,甚至有機會進一步收窄。」
值得注意的是,早前DeepSeek R1推出後,納斯達克100指數隨即出現調整,市場對AI競賽的資本流向及科技股估值產生明顯影響。至於DeepSeek R2推出時,美股走勢如何,市場拭目以待。
同時,數據中心資源亦見飽和跡象,有分析指亞馬遜已暫緩部分數據中心租約,Goldman更預計數據中心佔用高峰期提前到來,反映AI運算需求與基建供應間的博弈日益激烈。
編輯評論:中國AI「彎道超車」的現實與隱憂
阿里巴巴Qwen3的出現,標誌著中國AI產業從「追趕」逐步轉向「領跑」,不論在技術層面還是產業應用,都開始對美國主導格局構成實質壓力。Qwen3不單在技術上追貼甚至部分超越國際頂級模型,更強調本地部署、低成本推理等貼地需求,這對於中國廣闊的應用場景(如IoT、工業自動化、智慧城市等)極具吸引力。
然而,AI競賽最終不止於模型性能,還涉及生態系統、算力基建、開源社群、監管政策等多重因素。美國雖然在先進晶片上設限,但中國在軟硬件協同、開源社群動員力及本土市場規模上具備後發優勢。未來,兩國的AI競賽或會進一步擴展至AI芯片自給、AI與實體產業深度融合等新戰場。
對香港及亞洲科技圈而言,Qwen3的開放策略及多語言支援,為本地初創及開發者帶來新一輪創新機遇,亦令全球AI治理、數據主權及技術標準競爭變得更複雜。中國AI「彎道超車」是否能最終改寫全球科技格局,還需觀察政策、資本、人才及國際合作多重變數的疊加效應。
總結而言,阿里巴巴Qwen3的發佈不僅是技術突破,更是中國AI產業信心的體現。在全球AI賽道愈趨白熱化的今天,誰能真正掌握「混合智能」與「開源生態」的主導權,將決定未來數十年科技版圖的走向。