六合彩AI預測賽後檢討!邊個模型預測最叻? 每次攪珠當晚10:30更新免費睇!

Cookie管理:保障您的隱私與體驗

OpenAI最新大型語言模型為中國AI初創企業帶來新機遇

OpenAI's latest LLM opens doors for China's AI start-ups

阿里雲杭州雲棲大會:中國AI初創企業全力衝刺大型語言模型研發

在杭州舉行的雲棲大會上,由阿里雲主辦,多間中國AI初創企業紛紛強調,現時正積極投入開發大型語言模型(LLM),希望在全球AI競賽中搶佔一席位。

這一波熱潮,源自OpenAI早前發佈了新一代大型語言模型o1,這款由微軟支持的生成式預訓練變壓器模型,目標是攻克科學、編程、數學等多個高難度領域,為AI技術帶來新突破。

Moonshot AI創辦人Kunal Zhilin在大會上指出,o1模型的誕生意義重大,有潛力重塑多個產業,並為AI初創企業創造嶄新機遇。他強調,增強學習和模型規模的可擴展性將會是AI發展的關鍵。他提到所謂「擴展定律」:模型愈大、訓練數據愈多,表現就愈出色。

Zhilin直言:「這種方法不斷推高AI能力的上限。」他相信,OpenAI o1不單會顛覆多個行業,亦將為初創企業開闢全新藍海。

OpenAI同時強調,該模型能以類似人類思維方式解決複雜問題,透過不斷優化策略和從錯誤中學習,令解難能力愈來愈強。

Zhilin補充,只要企業有足夠算力,不僅能創新演算法,還可研發更基礎的AI模型。他認為這一點至關重要,因為AI工程師隨著現有數據被「榨乾」,越來越依賴增強學習自動生成新數據。

StepFun行政總裁江大新亦認同Zhilin觀點,但同時指出,算力資源依然是中國初創企業面對的一大難題,尤其受美國出口管制影響,難以獲得先進半導體,進一步拉高技術門檻。

江大新表示:「計算資源的需求依然非常龐大。」

據百川智能內部人士透露,現時中國真正能夠大規模投資增強學習的AI初創企業其實只有少數,包括Moonshot AI、百川智能、智譜AI和MiniMax。這幾間被稱為「AI四小虎」的公司,正全力投入LLM研發,推動下一代AI技術進步。

雲棲大會還有甚麼亮點?

大會期間,阿里雲亦發佈多項新產品,包括Qwen 2.5模型家族。這一系列模型在編程和數學領域有明顯進步,參數規模由5億至720億不等,支援約29種語言,包括中文、英文、法文、西班牙文等。

其中,專為編程和數學設計的Qwen2.5-Coder及Qwen2.5-Math,已經在Hugging Face和ModelScope平台累計下載超過4,000萬次,反映市場對高效專業模型的強烈需求。

阿里雲亦為旗下生成式圖像工具「通義萬相」新增文字生成影片功能,能輸出真實或動畫風格短片,廣告、影視製作等行業都將受益。

此外,阿里雲還推出了最新版本的多模態視覺語言模型Qwen 2-VL,能處理超過20分鐘長度的影片內容,支援影片問答,並針對手機及機械人等移動設備進行優化。

編輯評論:AI大國競賽下的中國機遇與挑戰

中國AI初創企業在大型語言模型領域的競逐,正處於一個極具挑戰同時充滿機遇的時代。OpenAI新模型的橫空出世,無疑為中國的AI創業者提供了一個「對標」和追趕的目標,但真正能夠超越或並駕齊驅的,依然是極少數具備資金、算力和技術積累的「AI四小虎」。

值得關注的是,美國對中國高端半導體的出口限制,已經成為中國AI產業發展的最大障礙。這種「算力卡脖子」現象,不單影響新模型的訓練速度和規模,更令初創企業競爭門檻大幅提升。AI創新從來不只是算法和數據的遊戲,更是國家產業政策、資本投入和全球供應鏈博弈的縮影。

另一方面,阿里雲等中國科技巨頭,正嘗試以開源和多語言支持,搶佔全球開發者和企業市場。這種策略未必能即時突破核心技術封鎖,但卻有助於構建生態圈,吸納更多人才和應用場景。

未來中國AI初創企業能否突圍,關鍵或許不在於單一技術突破,而在於如何在全球資本、政策和技術三重壓力下,找到屬於自己的創新路徑。大型語言模型的競賽,實際上是中國科技產業「自立自強」的縮影,更是全球AI格局未來幾年最值得關注的戰場之一。

Chat Icon