AI新階段：後訓練提升智能革命

zero comment

Finance

AI競賽進入新階段：由數據擴展轉向訓練後模型強化

近期關於xAI推出的Grok 4模型披露，顯示人工智能發展正經歷結構性轉變。過去，提升AI智能主要依賴不斷擴大模型規模和訓練數據量，但現時的突破更多來自於訓練完成後，對模型進行大量計算資源投入的策略性強化。

直到2024年底，AI的進步大多遵循「Chinchilla」擴展法則，即透過訓練更大模型和更龐大數據集來提升性能。然而，根據巴克萊銀行的分析，OpenAI的o1模型率先改變了這一模式，而xAI的Grok 4則進一步加速了這種變革。

Grok 4在預訓練階段所使用的計算資源與前代相若，但因在初步訓練後，追加了十倍於以往的強化學習（reinforcement learning），令模型智能水平大幅提升。與依賴無監督學習大量文本數據的預訓練不同，強化學習通過讓模型在精心設計的任務中反覆嘗試和調整，提升其推理和問題解決能力。

更重要的是，Grok 4在不增加模型參數數量的情況下，顯著提升了表現，從而降低了推理階段的成本，同時提高了輸出質量。這意味著未來不必再過度依賴大規模的原始數據訓練，便能取得更高智力表現。

這種轉變帶來深遠影響。巴克萊分析師指出，未來AI發展將更多聚焦於具備計劃、推理和工具互動能力的自主智能體模型（agentic models）。例如，Grok 4在一項模擬經營自動販賣機的測試中，不僅超越了其他頂尖模型，甚至勝過人類，展現其經濟推理和適應能力。

對計算需求和資本支出的影響

這種新趨勢對計算需求和資本投入也帶來明顯變化。早期模型通常在生成回答時只需單步推理，而自主智能體模型則需進行多步推理，平均每個查詢涉及的計算量增加了15倍。由此看來，訓練後的強化學習不僅是打造更智能模型的關鍵，也為超大規模雲端服務商（hyperscalers）巨額基礎設施投資提供了合理性。

長期以來，AI領域一直聚焦於預訓練規模的擴大，但如今真正的智能進展，或許正是來自訓練後的深度強化。

評論與啟示

這篇報道揭示了AI技術發展的重大轉折，從單純追求「更大模型、更大數據」的規模擴張，轉向更加精細和策略性的「訓練後強化」。這不僅有助於降低推理成本，提高效率，也讓AI能在更複雜的環境中自主學習和適應，邁向真正的「智能體」時代。

對香港及全球的AI產業來說，這意味著未來的競爭不再只是資源堆砌的比拼，而是技術創新和演算法優化的較量。投資者和企業應密切關注這種模式的發展，尤其是那些能在訓練後強化領域取得突破的公司，因為它們可能引領下一波AI應用的爆發。

此外，這也提醒我們，基礎設施建設與AI技術創新必須同步推進。雲端計算和大規模硬件投資將繼續成為支撐AI發展的重要基石，同時也帶來能源消耗與可持續性的挑戰，值得業界和政策制定者深思。

總括而言，Grok 4的成功展示了AI發展的新路徑，未來的智能不只是「更大、更快」，更是「更聰明、更精準」，這對整個科技生態系統都是一個激動人心的訊號。

以上文章由特價GPT API KEY所翻譯及撰寫。

Download TXT

🔥 CHATGPT PLUS 帳戶出租