六合彩AI預測賽後檢討!邊個模型預測最叻? 每次攪珠當晚10:30更新免費睇!

阿里巴巴Qwen3:挑戰OpenAI,中國AI新突破?

阿里巴巴推出Qwen3:開放原始碼大型語言模型

阿里巴巴近日推出了一系列開放原始碼大型語言模型(LLMs)Qwen3,包含八個模型,參數規模從0.6億到235億不等,支援119種語言。Qwen3模型採用混合推理技術,允許用戶在快速回應和深入推理之間切換,以應對編碼和數學等任務。阿里巴巴聲稱,Qwen3的性能與OpenAI的o1、谷歌的Gemini-2.5-Pro和DeepSeek-R1等領先的AI模型相匹配或超越,同時部署成本相比某些競爭對手降低高達75%。這些模型已在Hugging Face和GitHub等平台上廣泛可用,但最大的模型目前受到限制。此次發布加劇了中國AI領域的競爭,並凸顯了美國晶片出口限制對創新和效率的影響。分析師認為,Qwen3在性能和可及性方面取得了突破,縮小了開放原始碼和專有AI之間的差距。

重點如下:

* 阿里巴巴未來三年將投資超過3800億元人民幣(約520億美元)用於雲和AI硬體基礎設施,超過過去十年來的總投資。
* Qwen3模型採用密集和MoE(混合專家)架構,開放權重供兩個MoE模型(Qwen3-235B-A22B和Qwen3-30B-A3B)和六個密集模型使用,所有模型均在Apache 2.0許可下發布。
* 阿里巴巴成功地在36萬億個token上訓練Qwen3,是其前一代Qwen2.5模型的兩倍,同時降低了計算資源需求,反映出顯著的效率提升。
* Qwen3模型提供兩種模式:「思考模式」適用於逐步、深入的推理,「非思考模式」適用於快速、直接的回應,允許用戶根據任務複雜度平衡速度和深度。

綜合評價:

* 負面評價
* 中立評價
* 正面評價

阿里巴巴的Qwen3如何與競爭對手區分開來?

Qwen3引入了一種混合推理方法,允許模型在優化快速、通用回應的模式和設計用於複雜任務(如編碼和進階推理)的「思考模式」之間切換。這種靈活性使Qwen3與許多競爭對手區分開來,競爭對手通常提供固定的推理能力,要麼是速度,要麼是深度,但不能在單一架構中同時提供這兩種模式。混合設置允許用戶通過根據任務複雜度在不同模式之間切換來管理計算資源和延遲,提供了效率和準確性的自定義平衡。這是對OpenAI、谷歌或DeepSeek等大多數模型的顯著改進,這些模型並不明確提供開放原始碼框架中的用戶控制推理模式。

作為編輯,我認為阿里巴巴的Qwen3發布是中國AI領域的一個重大突破,展示了中國在AI技術方面的快速進步和創新能力。Qwen3的混合推理技術和開放原始碼的策略有望進一步推動AI領域的發展和應用。同時,美國晶片出口限制對中國AI領域的影響也值得關注,中國企業如何應對這些限制並實現技術突破將是未來的重要課題。阿里巴巴推出Qwen3:開放原始碼大型語言模型

Chat Icon