中國阿里巴巴開源AI領先美國Meta大步追擊

zero comment

Ai Finance Tech

AI：中國在開源大型語言模型（LLM）超越美國——阿里巴巴與DeepSeek領先全球

過去一段時間，「中美AI太空競賽」成為國際媒體及政界的焦點，理由多數圍繞「國家安全」及AI晶片爭霸。這場競賽其實是一場「無盡遊戲」，短期內難有終結。不過，現時不只一間，而是兩間中國公司——阿里巴巴和DeepSeek——在「開源」AI語言模型領域，已經超越美國Meta，成為全球領頭羊。今次，我哋就聚焦這場技術賽跑的「大局」。

AI競賽圖示

阿里巴巴如何領先全球開源AI

根據《The Information》報道：「阿里巴巴現時在全球開源AI領域領先，超越Meta的Llama模型，並於多個基準測試中勝出。雖然阿里巴巴最大型的模型與DeepSeek的R1型號勢均力敵，但商業用戶更偏愛阿里巴巴，因為佢提供更多元化的模型選擇，尤其有成本較低的小型模型。阿里巴巴內部各業務單位已全面轉用Qwen，外部企業也開始採用，阿里巴巴正穩步成為中國最大開源AI供應商。」

DeepSeek近幾個月亦在全球開源AI舞台上備受推崇，無論係核心LLM模型，抑或AI推理模型，都得到一致好評。佢哋與美國Meta、OpenAI、Anthropic等開源及封閉模型展開激烈競爭。

開源AI模型競賽

Qwen同DeepSeek的成功，代表中國科企已開始在開源AI領域超越美國。由於開源AI成本低，企業更願意採用。如果中國巨企如阿里巴巴持續推動開源AI，全球AI軟件生態有機會被中國重新塑造。

新加坡AI公司Aiquris的技術總監Martin Saerbeck指出：「專注開源AI模型，能令中國公司在全球產生深遠影響。開源模型可以集結全球開發者及研究員的集體智慧，社群不斷回饋，有助加快模型改進。」

中國開源模型不但推動國內AI應用普及，對國企及政府部門的吸引力亦大增。考慮到中國龐大市場，開源方案被廣泛接受，影響力可謂巨大。

連美國科技巨頭都讚賞中國開源AI

Nvidia CEO黃仁勳

連Nvidia CEO黃仁勳都喺業績會議上表示，DeepSeek同阿里巴巴Qwen「係全球最佳開源AI模型之一」。佢又提到，美國可以透過美國平台部署及優化這些中國模型而受益：「當DeepSeek同Qwen喺美國基礎設施上運行得最好時，美國就係贏家。」

Nvidia最近發表用於機械人、自動駕駛等新AI模型Cosmos-Reason1，其中一個模型就係以阿里巴巴開源模型為基礎開發。

阿里雲作為中國最大雲端服務商，提供多款不同規格的Qwen開源模型，有望吸引更多企業使用阿里雲平台。

阿里巴巴的成功之道——從內部分權到開源轉型

阿里巴巴的開源AI領先經驗，對美國科技巨頭如Amazon、Microsoft、Google亦有啟示。阿里巴巴一度打算分拆成六個高度獨立業務群組，雖然最終未有完全分拆，但這種分權模式，促使AI工程師更努力優化模型，務求先說服內部業務單位，才能說服外部客戶。

阿里巴巴管理層

阿里巴巴早於2021年，OpenAI推出ChatGPT之前一年，已經由達摩院推出基於Transformer架構的AI模型M6。2022年OpenAI推出ChatGPT後，阿里巴巴加快步伐，晉升周靖人為阿里雲CTO，開發新一代AI模型「通義千問」（Qwen），寓意「博學多聞，千問不倦」。2023年4月推出首版，半年後再有Qwen2面世。

當時，中國本土LLM競賽剛起步，阿里巴巴及其他公司努力追趕美國OpenAI、Anthropic、Google、Meta等一眾先行者。市場競爭激烈，媒體稱之為「百模大戰」。

動盪中的堅持與轉型

阿里巴巴在AI賽道衝刺之際，亦面對中國政府反壟斷風暴及內部重組。2023年初，阿里宣布重組成六大業務群組。9月，CEO張勇辭職，由創辦人之一吳泳銘接任，專注AI戰略。

2024年上半年，阿里雲積極推動各業務單位全面採用Qwen模型，但重組後各單位溝通減少，協作變得困難。

內部對是否開源亦有激烈爭議，一開始公司同時投資於專有及開源版本。隨著Qwen開源版本在中美兩地開發者社群獲得更多回饋，阿里巴巴重心漸漸轉向開源。Qwen2.5於2024年9月面世後，表現明顯超越Meta的Llama 3，進一步鞏固阿里巴巴在開源領域的領導地位。

中國內部競爭——DeepSeek的崛起

DeepSeek

不過，DeepSeek的成功很快搶去Qwen2.5的風頭。作為一間僅成立兩年的量化對沖基金分支，DeepSeek於2025年初憑R1推理模型震撼全球科技界，開發成本低，表現卻極佳。

阿里巴巴允許各業務單位自由選擇AI技術，阿里雲亦將DeepSeek R1納入AI模型庫。例如旅遊App「飛豬」採用R1開發AI旅遊助手AskMe，B2B平台Alibaba.com亦將R1整合入AI搜尋應用Accio。

創辦人馬雲再度關注，Qwen團隊迎來壓力測試

馬雲關注Qwen進展

DeepSeek的成功令Qwen團隊壓力倍增。即使馬雲早已退居幕後，仍頻繁向阿里雲CTO周靖人查問Qwen3進展。為了趕在DeepSeek新一代R1之前推出新模型，Qwen團隊成員夜以繼日，臨近發布前一星期甚至只睡五六小時。

Meta亦在追趕，中美AI競賽進入白熱化

Meta AI競賽

美國Meta團隊亦不甘後人，4月推出Llama 4新一代開源AI模型，但外界反應平平，認為進步有限。對阿里巴巴Qwen團隊而言，這反而增強了對Qwen3獲得國際開發者好評的信心。

Qwen3橫掃Meta Llama及DeepSeek

4月底，阿里巴巴終於發佈Qwen3系列八款開源模型，涵蓋不同規模與規格。Qwen3可根據用家需要切換「思考模式」與「非思考模式」，應對複雜數學、編程或簡單問答等不同任務。阿里CEO吳泳銘強調：「全面開源Qwen3將推動創新，並帶動開發者、初創及企業應用。」

根據AI模型排行榜LiveBench及Artificial Analysis，Qwen3多個版本表現超越Meta Llama 4，甚至一度超越DeepSeek R1（不過DeepSeek最近又有更新，再度領先）。

阿里自家AI產品由原本採用DeepSeek，現時已轉用Qwen3，例如飛豬AI旅遊助手、Accio搜尋App等。

企業市場方面，Qwen3開始吸引中國以外客戶，有望成為全球企業級AI代理的基礎。阿里各業務單位亦因Qwen3而加強合作，討論未來AI代理互通，務求讓用戶享受更多元化服務。

AI技術浪潮

編者點評：中美AI「無盡賽跑」的本質與啟示

今次阿里巴巴與DeepSeek在開源LLM領域的突破，已經超越「國家對國家」的層面，而係「公司對公司」、「產品對產品」的全球競賽。中國企業能夠在國家政策壓力、內部動盪、強敵環伺下，靠開源生態、靈活組織、社群參與和創新精神突圍，值得香港科技界深思。

這場AI賽跑，反映出中國科技企業正由「追趕者」變成「領跑者」，並有能力塑造新一輪全球技術規則。開源策略不單降低成本，更能集結全球開發者力量，形成正向循環，這點對香港初創與企業同樣重要——不要只看巨企壟斷，開源與社群可能就是顛覆者的最大武器。

此外，阿里巴巴容許內部自由選擇AI技術，而非強制統一，這種開放包容的管理模式，亦啟示本地企業應如何平衡創新與協作。中國AI企業現時不單在國內市場稱王，更開始影響全球技術生態，這對香港以至亞洲的科技發展，無疑是一個值得警惕又充滿機遇的時代訊號。

最後，這場「無盡遊戲」未有終點，每一次領先都可能被新一代技術超越。香港科技界如果想在AI浪潮中分一杯羹，必須放眼全球，擁抱開源，善用社群力量，並敢於在競爭中突圍。AI競賽真正的對手，從來不是國家，而是下一個更創新、更開放的產品與生態。

——這才是我們應該關注的「大局」。

Download TXT

#opensourceai ai alibaba alicloud china

中國阿里巴巴開源AI領先美國Meta大步追擊

chatgpt

🔥 CHATGPT PLUS 帳戶出租

中國阿里巴巴開源AI領先美國Meta大步追擊

chatgpt

Related Articles

澳洲Syrah再延長特斯拉石墨供應期限

美歐關稅戰升溫，華爾街期貨急挫美元回落

AI神器一站式比較＋終身訂閱優惠

🔥 CHATGPT PLUS 帳戶出租