人工智能市場由GPU主導,現正迅速轉變
多年來,Nvidia的崛起幾乎等同於一個信念:GPU(圖形處理器)是人工智能的動力引擎。GPU推動了大規模語言模型的訓練熱潮,令這些模型由學術研究變成價值數萬億美元的商業雄心。然而,Nvidia斥資200億美元與Groq達成合作協議,正是承認未來AI戰場不會只靠GPU一枝獨秀。
Groq生產一種截然不同的AI晶片,稱為語言處理單元(LPU)。要明白Nvidia為何花大錢買入Groq技術,且不自行研發,關鍵在於AI工作負載的轉變。行業正由訓練模型轉向實時推理(Inference)應用,而推理是AI模型訓練完成後,用於回答問題、生成圖像或與用戶對話的過程。根據RBC Capital分析師的最新估算,推理市場未來規模可能遠超訓練市場。
推理和訓練的需求截然不同。訓練像是建造一個大腦,需要龐大的計算能力和彈性;推理則像是即時使用這個大腦,速度、穩定性、能效及每次回答成本變得更重要。Groq的LPU晶片專為推理設計,像精密生產線一樣,每一步操作預先規劃、固定順序執行,確保每次都完美重複。這種嚴謹性對訓練來說是弱點,但對推理則是優勢,因為它帶來更低延遲和更少能源浪費。
相比之下,Nvidia的GPU設計注重靈活性,通過調度器和大量外部記憶體應付多種工作負載。這種靈活性令GPU稱霸訓練市場,但在推理方面卻帶來運算開銷,降低效率。隨著AI產品成熟穩定,這種折衷越來越難以接受。
前iPod創造者、Groq投資者Tony Fadell在LinkedIn表示:「半導體產業的地殼板塊再度移動。GPU贏得了AI數據中心的第一波浪潮——訓練。但推理才是實際體量的遊戲,而GPU本質上並非為此優化。」他稱這類新型AI晶片為「推理處理單元」(IPU)。
多元AI晶片爆炸式增長
TD Cowen分析師指出,Nvidia不僅引入專為推理設計的晶片,還採用全新架構,顯示推理市場已經成熟龐大。過去AI基礎設施多以訓練為優先,流行說法是「今天的訓練晶片是明天的推理引擎」,這對GPU有利,但如今不再適用。
曾參與Google TPU晶片軟件開發的業界先驅Chris Lattner表示,未來AI數據中心將存在多種不同晶片並存。這一趨勢由兩大因素推動,亦被Nvidia與Groq合作印證:第一,AI不是單一工作負載,推理和訓練有多種不同需求;第二,硬件專用化帶來巨大效率提升。
謙遜之舉
早在2024年,Business Insider就警告Nvidia在推理領域面臨競爭風險。Cerebras推出超大規模AI晶片,速度和記憶體頻寬遠超當時Nvidia旗艦GPU;Google的TPU則專為高速定制AI工作負載設計;Amazon開發自家推理晶片Inferentia;初創公司Positron AI聲稱能以更低成本匹敵Nvidia推理效能。
因此,Nvidia與Groq的合作可視為先發制人的策略。Nvidia並未被推理專家蠶食市場,而是積極擁抱截然不同的架構。
Fadell稱這是Nvidia執行長黃仁勳的「謙遜之舉」:「很多公司因為『非我所創』的自尊錯失轉捩點,黃仁勳沒有,他看到了威脅並將之化為優勢。」
推理的經濟學
推理是AI產品真正賺錢的階段,是數千億美元數據中心投資能否回本的關鍵。AWS執行長Matt Garman在2024年指出,如果推理不成為主流,「這些大模型的投資根本無法兌現。」
值得注意的是,Nvidia並未押寶單一晶片。GPU仍負責訓練和多樣工作負載,專用晶片如Groq的LPU則負責快速即時推理。Nvidia的優勢在於掌控連接軟件、網絡和開發者生態系,讓不同硬件協同工作。
RBC分析師指出,「AI數據中心正成為混合環境,GPU與定制ASIC(如Groq的LPU)並行運作,各司其職,優化不同工作負載。」
部分競爭者認為此交易證明GPU不適合高速推理;另一些則視為晶片多元化未來的肯定。黃仁勳似乎屬於後者。通過授權Groq技術並納入團隊,Nvidia確保能同時提供「鏟子」與「生產線」,滿足AI多樣需求。
事實上,Nvidia已開發NVLink Fusion技術,讓其他定制晶片能直接連接GPU,強化此混合硬件未來,RBC分析師補充。
Cerebras執行長Andrew Feldman最近表示:「GPU是卓越的加速器,推動AI發展至今,但它們並非高速推理的最佳機器。還有其他架構更適合,Nvidia花200億美元證明了這點。」
—
編輯評論:AI硬件生態系的多元化與未來挑戰
Nvidia與Groq的20億美元合作,標誌著AI硬件生態的一個重要轉折點。長期以來,GPU憑藉其靈活性和強大算力,成為AI訓練的代名詞,但隨著AI應用從模型訓練轉向推理實時執行,硬件需求出現質的變化。推理更看重延遲、能效和成本,這對傳統GPU是挑戰也帶來機遇。
Groq的LPU以定制化、嚴謹執行流程為賣點,成為推理市場的有力競爭者。此舉不僅是Nvidia的戰略調整,也是整個AI產業硬件分工和專業化趨勢的縮影。未來,AI數據中心將不再是GPU一統天下,而是多種專用晶片並存,各司其職,形成混合硬件生態。
這種趨勢對香港及全球AI產業鏈均有啟示:硬件多樣化不僅推動技術創新,也促進成本下降和效率提升,有助於AI應用更廣泛普及。對開發者來說,掌握跨架構軟件開發和協同運作能力將是新挑戰。對投資者和企業而言,洞察硬件趨勢、靈活調整策略將成為贏家關鍵。
總而言之,AI硬件正從「一把刀」走向「百寶箱」,這不僅反映技術成熟,也代表市場需求多元化和競爭格局重塑。Nvidia的這一步棋,值得業界深思,也將引領下一波AI創新浪潮。
以上文章由GPT 所翻譯及撰寫。而圖片則由GEMINI根據內容自動生成。