中國阿里巴巴開源AI領先美國Meta大步追擊




AI:中國在開源大型語言模型(LLM)超越美國——阿里巴巴與DeepSeek領先全球

過去一段時間,「中美AI太空競賽」成為國際媒體及政界的焦點,理由多數圍繞「國家安全」及AI晶片爭霸。這場競賽其實是一場「無盡遊戲」,短期內難有終結。不過,現時不只一間,而是兩間中國公司——阿里巴巴和DeepSeek——在「開源」AI語言模型領域,已經超越美國Meta,成為全球領頭羊。今次,我哋就聚焦這場技術賽跑的「大局」。

AI競賽圖示

阿里巴巴如何領先全球開源AI

根據《The Information》報道:「阿里巴巴現時在全球開源AI領域領先,超越Meta的Llama模型,並於多個基準測試中勝出。雖然阿里巴巴最大型的模型與DeepSeek的R1型號勢均力敵,但商業用戶更偏愛阿里巴巴,因為佢提供更多元化的模型選擇,尤其有成本較低的小型模型。阿里巴巴內部各業務單位已全面轉用Qwen,外部企業也開始採用,阿里巴巴正穩步成為中國最大開源AI供應商。」

DeepSeek近幾個月亦在全球開源AI舞台上備受推崇,無論係核心LLM模型,抑或AI推理模型,都得到一致好評。佢哋與美國Meta、OpenAI、Anthropic等開源及封閉模型展開激烈競爭。

開源AI模型競賽

Qwen同DeepSeek的成功,代表中國科企已開始在開源AI領域超越美國。由於開源AI成本低,企業更願意採用。如果中國巨企如阿里巴巴持續推動開源AI,全球AI軟件生態有機會被中國重新塑造。

新加坡AI公司Aiquris的技術總監Martin Saerbeck指出:「專注開源AI模型,能令中國公司在全球產生深遠影響。開源模型可以集結全球開發者及研究員的集體智慧,社群不斷回饋,有助加快模型改進。」

中國開源模型不但推動國內AI應用普及,對國企及政府部門的吸引力亦大增。考慮到中國龐大市場,開源方案被廣泛接受,影響力可謂巨大。

連美國科技巨頭都讚賞中國開源AI

Nvidia CEO黃仁勳

連Nvidia CEO黃仁勳都喺業績會議上表示,DeepSeek同阿里巴巴Qwen「係全球最佳開源AI模型之一」。佢又提到,美國可以透過美國平台部署及優化這些中國模型而受益:「當DeepSeek同Qwen喺美國基礎設施上運行得最好時,美國就係贏家。」

Nvidia最近發表用於機械人、自動駕駛等新AI模型Cosmos-Reason1,其中一個模型就係以阿里巴巴開源模型為基礎開發。

阿里雲作為中國最大雲端服務商,提供多款不同規格的Qwen開源模型,有望吸引更多企業使用阿里雲平台。

阿里巴巴的成功之道——從內部分權到開源轉型

阿里巴巴的開源AI領先經驗,對美國科技巨頭如Amazon、Microsoft、Google亦有啟示。阿里巴巴一度打算分拆成六個高度獨立業務群組,雖然最終未有完全分拆,但這種分權模式,促使AI工程師更努力優化模型,務求先說服內部業務單位,才能說服外部客戶。

阿里巴巴管理層

阿里巴巴早於2021年,OpenAI推出ChatGPT之前一年,已經由達摩院推出基於Transformer架構的AI模型M6。2022年OpenAI推出ChatGPT後,阿里巴巴加快步伐,晉升周靖人為阿里雲CTO,開發新一代AI模型「通義千問」(Qwen),寓意「博學多聞,千問不倦」。2023年4月推出首版,半年後再有Qwen2面世。

當時,中國本土LLM競賽剛起步,阿里巴巴及其他公司努力追趕美國OpenAI、Anthropic、Google、Meta等一眾先行者。市場競爭激烈,媒體稱之為「百模大戰」。

動盪中的堅持與轉型

阿里巴巴在AI賽道衝刺之際,亦面對中國政府反壟斷風暴及內部重組。2023年初,阿里宣布重組成六大業務群組。9月,CEO張勇辭職,由創辦人之一吳泳銘接任,專注AI戰略。

2024年上半年,阿里雲積極推動各業務單位全面採用Qwen模型,但重組後各單位溝通減少,協作變得困難。

內部對是否開源亦有激烈爭議,一開始公司同時投資於專有及開源版本。隨著Qwen開源版本在中美兩地開發者社群獲得更多回饋,阿里巴巴重心漸漸轉向開源。Qwen2.5於2024年9月面世後,表現明顯超越Meta的Llama 3,進一步鞏固阿里巴巴在開源領域的領導地位。

中國內部競爭——DeepSeek的崛起

DeepSeek

不過,DeepSeek的成功很快搶去Qwen2.5的風頭。作為一間僅成立兩年的量化對沖基金分支,DeepSeek於2025年初憑R1推理模型震撼全球科技界,開發成本低,表現卻極佳。

阿里巴巴允許各業務單位自由選擇AI技術,阿里雲亦將DeepSeek R1納入AI模型庫。例如旅遊App「飛豬」採用R1開發AI旅遊助手AskMe,B2B平台Alibaba.com亦將R1整合入AI搜尋應用Accio。

創辦人馬雲再度關注,Qwen團隊迎來壓力測試

馬雲關注Qwen進展

DeepSeek的成功令Qwen團隊壓力倍增。即使馬雲早已退居幕後,仍頻繁向阿里雲CTO周靖人查問Qwen3進展。為了趕在DeepSeek新一代R1之前推出新模型,Qwen團隊成員夜以繼日,臨近發布前一星期甚至只睡五六小時。

Meta亦在追趕,中美AI競賽進入白熱化

Meta AI競賽

美國Meta團隊亦不甘後人,4月推出Llama 4新一代開源AI模型,但外界反應平平,認為進步有限。對阿里巴巴Qwen團隊而言,這反而增強了對Qwen3獲得國際開發者好評的信心。

Qwen3橫掃Meta Llama及DeepSeek

4月底,阿里巴巴終於發佈Qwen3系列八款開源模型,涵蓋不同規模與規格。Qwen3可根據用家需要切換「思考模式」與「非思考模式」,應對複雜數學、編程或簡單問答等不同任務。阿里CEO吳泳銘強調:「全面開源Qwen3將推動創新,並帶動開發者、初創及企業應用。」

根據AI模型排行榜LiveBench及Artificial Analysis,Qwen3多個版本表現超越Meta Llama 4,甚至一度超越DeepSeek R1(不過DeepSeek最近又有更新,再度領先)。

阿里自家AI產品由原本採用DeepSeek,現時已轉用Qwen3,例如飛豬AI旅遊助手、Accio搜尋App等。

企業市場方面,Qwen3開始吸引中國以外客戶,有望成為全球企業級AI代理的基礎。阿里各業務單位亦因Qwen3而加強合作,討論未來AI代理互通,務求讓用戶享受更多元化服務。

AI技術浪潮

編者點評:中美AI「無盡賽跑」的本質與啟示

今次阿里巴巴與DeepSeek在開源LLM領域的突破,已經超越「國家對國家」的層面,而係「公司對公司」、「產品對產品」的全球競賽。中國企業能夠在國家政策壓力、內部動盪、強敵環伺下,靠開源生態、靈活組織、社群參與和創新精神突圍,值得香港科技界深思。

這場AI賽跑,反映出中國科技企業正由「追趕者」變成「領跑者」,並有能力塑造新一輪全球技術規則。開源策略不單降低成本,更能集結全球開發者力量,形成正向循環,這點對香港初創與企業同樣重要——不要只看巨企壟斷,開源與社群可能就是顛覆者的最大武器。

此外,阿里巴巴容許內部自由選擇AI技術,而非強制統一,這種開放包容的管理模式,亦啟示本地企業應如何平衡創新與協作。中國AI企業現時不單在國內市場稱王,更開始影響全球技術生態,這對香港以至亞洲的科技發展,無疑是一個值得警惕又充滿機遇的時代訊號。

最後,這場「無盡遊戲」未有終點,每一次領先都可能被新一代技術超越。香港科技界如果想在AI浪潮中分一杯羹,必須放眼全球,擁抱開源,善用社群力量,並敢於在競爭中突圍。AI競賽真正的對手,從來不是國家,而是下一個更創新、更開放的產品與生態。

——這才是我們應該關注的「大局」。

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放

立即升級 🔗

📣 即刻用 Google Workspace|唔使vpn都能享用 Google AI Pro

即使你只係一個人,都可以透過 Google Workspace 使用 官方Gemini AI Pro(原價 HK$160), 而在 Google Workspace 只要 HK$131 / 月

🔓 14 天免費試用
🔖 用呢條連結申請再有 額外 9 折
🇭🇰 香港可直接付款(香港信用卡)
🛡️ 不用 VPN,立即開用
🤖 可用 最新最紅Gemini 3 Pro & Nano Banana Pro
👉 立即登記 14 天免費試用 + 額外 9 折