AI新階段:後訓練提升智能革命




AI競賽進入新階段:由數據擴展轉向訓練後模型強化

近期關於xAI推出的Grok 4模型披露,顯示人工智能發展正經歷結構性轉變。過去,提升AI智能主要依賴不斷擴大模型規模和訓練數據量,但現時的突破更多來自於訓練完成後,對模型進行大量計算資源投入的策略性強化。

直到2024年底,AI的進步大多遵循「Chinchilla」擴展法則,即透過訓練更大模型和更龐大數據集來提升性能。然而,根據巴克萊銀行的分析,OpenAI的o1模型率先改變了這一模式,而xAI的Grok 4則進一步加速了這種變革。

Grok 4在預訓練階段所使用的計算資源與前代相若,但因在初步訓練後,追加了十倍於以往的強化學習(reinforcement learning),令模型智能水平大幅提升。與依賴無監督學習大量文本數據的預訓練不同,強化學習通過讓模型在精心設計的任務中反覆嘗試和調整,提升其推理和問題解決能力。

更重要的是,Grok 4在不增加模型參數數量的情況下,顯著提升了表現,從而降低了推理階段的成本,同時提高了輸出質量。這意味著未來不必再過度依賴大規模的原始數據訓練,便能取得更高智力表現。

這種轉變帶來深遠影響。巴克萊分析師指出,未來AI發展將更多聚焦於具備計劃、推理和工具互動能力的自主智能體模型(agentic models)。例如,Grok 4在一項模擬經營自動販賣機的測試中,不僅超越了其他頂尖模型,甚至勝過人類,展現其經濟推理和適應能力。

對計算需求和資本支出的影響

這種新趨勢對計算需求和資本投入也帶來明顯變化。早期模型通常在生成回答時只需單步推理,而自主智能體模型則需進行多步推理,平均每個查詢涉及的計算量增加了15倍。由此看來,訓練後的強化學習不僅是打造更智能模型的關鍵,也為超大規模雲端服務商(hyperscalers)巨額基礎設施投資提供了合理性。

長期以來,AI領域一直聚焦於預訓練規模的擴大,但如今真正的智能進展,或許正是來自訓練後的深度強化。

評論與啟示

這篇報道揭示了AI技術發展的重大轉折,從單純追求「更大模型、更大數據」的規模擴張,轉向更加精細和策略性的「訓練後強化」。這不僅有助於降低推理成本,提高效率,也讓AI能在更複雜的環境中自主學習和適應,邁向真正的「智能體」時代。

對香港及全球的AI產業來說,這意味著未來的競爭不再只是資源堆砌的比拼,而是技術創新和演算法優化的較量。投資者和企業應密切關注這種模式的發展,尤其是那些能在訓練後強化領域取得突破的公司,因為它們可能引領下一波AI應用的爆發。

此外,這也提醒我們,基礎設施建設與AI技術創新必須同步推進。雲端計算和大規模硬件投資將繼續成為支撐AI發展的重要基石,同時也帶來能源消耗與可持續性的挑戰,值得業界和政策制定者深思。

總括而言,Grok 4的成功展示了AI發展的新路徑,未來的智能不只是「更大、更快」,更是「更聰明、更精準」,這對整個科技生態系統都是一個激動人心的訊號。

以上文章由特價GPT API KEY所翻譯及撰寫。

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放

立即升級 🔗