AI芯片戰爭：GPU時代將告終？

zero comment

人工智能市場由GPU主導，現正迅速轉變

多年來，Nvidia的崛起幾乎等同於一個信念：GPU（圖形處理器）是人工智能的動力引擎。GPU推動了大規模語言模型的訓練熱潮，令這些模型由學術研究變成價值數萬億美元的商業雄心。然而，Nvidia斥資200億美元與Groq達成合作協議，正是承認未來AI戰場不會只靠GPU一枝獨秀。

Groq生產一種截然不同的AI晶片，稱為語言處理單元（LPU）。要明白Nvidia為何花大錢買入Groq技術，且不自行研發，關鍵在於AI工作負載的轉變。行業正由訓練模型轉向實時推理（Inference）應用，而推理是AI模型訓練完成後，用於回答問題、生成圖像或與用戶對話的過程。根據RBC Capital分析師的最新估算，推理市場未來規模可能遠超訓練市場。

推理和訓練的需求截然不同。訓練像是建造一個大腦，需要龐大的計算能力和彈性；推理則像是即時使用這個大腦，速度、穩定性、能效及每次回答成本變得更重要。Groq的LPU晶片專為推理設計，像精密生產線一樣，每一步操作預先規劃、固定順序執行，確保每次都完美重複。這種嚴謹性對訓練來說是弱點，但對推理則是優勢，因為它帶來更低延遲和更少能源浪費。

相比之下，Nvidia的GPU設計注重靈活性，通過調度器和大量外部記憶體應付多種工作負載。這種靈活性令GPU稱霸訓練市場，但在推理方面卻帶來運算開銷，降低效率。隨著AI產品成熟穩定，這種折衷越來越難以接受。

前iPod創造者、Groq投資者Tony Fadell在LinkedIn表示：「半導體產業的地殼板塊再度移動。GPU贏得了AI數據中心的第一波浪潮——訓練。但推理才是實際體量的遊戲，而GPU本質上並非為此優化。」他稱這類新型AI晶片為「推理處理單元」（IPU）。

多元AI晶片爆炸式增長

TD Cowen分析師指出，Nvidia不僅引入專為推理設計的晶片，還採用全新架構，顯示推理市場已經成熟龐大。過去AI基礎設施多以訓練為優先，流行說法是「今天的訓練晶片是明天的推理引擎」，這對GPU有利，但如今不再適用。

曾參與Google TPU晶片軟件開發的業界先驅Chris Lattner表示，未來AI數據中心將存在多種不同晶片並存。這一趨勢由兩大因素推動，亦被Nvidia與Groq合作印證：第一，AI不是單一工作負載，推理和訓練有多種不同需求；第二，硬件專用化帶來巨大效率提升。

謙遜之舉

早在2024年，Business Insider就警告Nvidia在推理領域面臨競爭風險。Cerebras推出超大規模AI晶片，速度和記憶體頻寬遠超當時Nvidia旗艦GPU；Google的TPU則專為高速定制AI工作負載設計；Amazon開發自家推理晶片Inferentia；初創公司Positron AI聲稱能以更低成本匹敵Nvidia推理效能。

因此，Nvidia與Groq的合作可視為先發制人的策略。Nvidia並未被推理專家蠶食市場，而是積極擁抱截然不同的架構。

Fadell稱這是Nvidia執行長黃仁勳的「謙遜之舉」：「很多公司因為『非我所創』的自尊錯失轉捩點，黃仁勳沒有，他看到了威脅並將之化為優勢。」

推理的經濟學

推理是AI產品真正賺錢的階段，是數千億美元數據中心投資能否回本的關鍵。AWS執行長Matt Garman在2024年指出，如果推理不成為主流，「這些大模型的投資根本無法兌現。」

值得注意的是，Nvidia並未押寶單一晶片。GPU仍負責訓練和多樣工作負載，專用晶片如Groq的LPU則負責快速即時推理。Nvidia的優勢在於掌控連接軟件、網絡和開發者生態系，讓不同硬件協同工作。

RBC分析師指出，「AI數據中心正成為混合環境，GPU與定制ASIC（如Groq的LPU）並行運作，各司其職，優化不同工作負載。」

部分競爭者認為此交易證明GPU不適合高速推理；另一些則視為晶片多元化未來的肯定。黃仁勳似乎屬於後者。通過授權Groq技術並納入團隊，Nvidia確保能同時提供「鏟子」與「生產線」，滿足AI多樣需求。

事實上，Nvidia已開發NVLink Fusion技術，讓其他定制晶片能直接連接GPU，強化此混合硬件未來，RBC分析師補充。

Cerebras執行長Andrew Feldman最近表示：「GPU是卓越的加速器，推動AI發展至今，但它們並非高速推理的最佳機器。還有其他架構更適合，Nvidia花200億美元證明了這點。」

—

編輯評論：AI硬件生態系的多元化與未來挑戰

Nvidia與Groq的20億美元合作，標誌著AI硬件生態的一個重要轉折點。長期以來，GPU憑藉其靈活性和強大算力，成為AI訓練的代名詞，但隨著AI應用從模型訓練轉向推理實時執行，硬件需求出現質的變化。推理更看重延遲、能效和成本，這對傳統GPU是挑戰也帶來機遇。

Groq的LPU以定制化、嚴謹執行流程為賣點，成為推理市場的有力競爭者。此舉不僅是Nvidia的戰略調整，也是整個AI產業硬件分工和專業化趨勢的縮影。未來，AI數據中心將不再是GPU一統天下，而是多種專用晶片並存，各司其職，形成混合硬件生態。

這種趨勢對香港及全球AI產業鏈均有啟示：硬件多樣化不僅推動技術創新，也促進成本下降和效率提升，有助於AI應用更廣泛普及。對開發者來說，掌握跨架構軟件開發和協同運作能力將是新挑戰。對投資者和企業而言，洞察硬件趨勢、靈活調整策略將成為贏家關鍵。

總而言之，AI硬件正從「一把刀」走向「百寶箱」，這不僅反映技術成熟，也代表市場需求多元化和競爭格局重塑。Nvidia的這一步棋，值得業界深思，也將引領下一波AI創新浪潮。

以上文章由GPT 所翻譯及撰寫。而圖片則由GEMINI根據內容自動生成。

Download TXT

chatgpt

🖼️ AI 圖庫｜抄咒語學玩法

想睇吓人哋點玩 AI 畫圖？圖庫集合大量 Flux / Gemini 作品，可以一 click 複製咒語，直入生成器再改做自己版本。

✅ 真實作品示範

📋 一鍵複製咒語

✨ 不定期加入新圖

✏️ 「修改」按鈕直連生成器

👀 入去睇圖 + 抄咒語

AI芯片戰爭：GPU時代將告終？

chatgpt

Related Articles

AI助力智能電網 優化能源新時代

5分鐘學識識破AI假面孔！

CES新潮AI筆記神器Plaud NotePin S開箱體驗！

🖼️ AI 圖庫｜抄咒語學玩法

AI助力智能電網優化能源新時代