矽晶主權:深入了解Google如何策略性轉型,挑戰Nvidia霸主地位並重塑AI雲端
Google正積極挑戰Nvidia的主導地位,以及Intel和AMD的雙頭壟斷,推出全新Axion CPU與先進的TPU(張量處理器)。本文深入剖析Google轉向自家定制晶片背後的經濟與技術策略,探討這家科技巨頭如何藉此改寫數據中心的經濟模式,打破AI時代的「Nvidia稅」。
在從美國愛荷華州Council Bluffs到芬蘭Hamina的廣闊、氣候受控的數據中心走廊中,一場悄然進行的革命正威脅顛覆人工智能經濟的既有秩序。多年來,現代互聯網的基礎架構依賴一種默契分工:Intel與AMD提供作為運算核心的大腦——中央處理器(CPU),而Nvidia則供應推動生成式AI爆發的圖形處理器(GPU)。然而,Alphabet旗下的Google正系統性地拆解這種現狀。隨著其自家伺服器晶片的積極推廣,尤其是全新基於Arm架構的Axion CPU與最新一代TPU,Google正展現出深刻的策略轉變。這家搜尋巨頭不再滿足於成為全球最大晶片買家,而是立志成為最先進的晶片設計者。
近期業界披露的消息凸顯出Google與長期硬件夥伴間日益加劇的摩擦。如《The Information》報導,Google加速推進自有晶片,意圖侵占Nvidia的領地,減少對這些外部供應商的依賴,因為他們目前掌控著AI資本支出的主要部分。雖然Google仍為雲端客戶提供Nvidia強大的H100及即將推出的Blackwell GPU,但內部策略已經改變。Axion晶片的推出不僅是產品發布,更是向Intel與AMD主導的x86架構宣告獨立,並作為抵抗現時AI開發成本結構中「Nvidia稅」的戰略對沖。
此舉正值半導體產業關鍵時刻。Nvidia因其硬件需求暴增,市值已飆升至2兆美元以上,形成供應瓶頸,令Google、亞馬遜AWS和微軟Azure等超大規模雲服務商急於尋找突破口。Google透過自設計晶片,嘗試掌控AI運算的全垂直產業鏈——從冷卻系統、伺服器機架,到指令集管理電子流動。業界人士指出,雖然AWS率先以Graviton處理器開啟定制晶片潮流,但Google的策略更獨特,著重打造一個封閉生態系統,專為像Gemini這類大型語言模型(LLM)的龐大並行運算工作負載優化。
經濟驅動力:定制晶片如何大幅降低超大規模AI運算的總擁有成本
Google推動自家晶片策略的核心,是生成式AI殘酷的經濟現實。訓練最先進模型需數萬顆晶片協同運作數月,耗電量達數千兆瓦。傳統模式下,從Nvidia和Intel購買現成元件的高昂費用嚴重侵蝕利潤。Google基於Arm Neoverse V2架構打造的Axion CPU,直接衝擊此成本結構。根據官方數據,Axion運算效能比現有最快的通用Arm雲端實例高出約30%;與同代x86架構相比,效能提升達50%,能源效率更優60%。對Google這種規模企業而言,這些效率提升意味數十億美元的營運節省。
此外,Axion與Google既有TPU基礎設施的整合,創造出外部供應商難以匹敵的協同效應。《The Information》指出,Google策略是將CPU與AI加速器緊密配對,簡化數據傳輸瓶頸。傳統架構中,數據須在不同硬件間流動,造成延遲。掌控CPU與AI加速器,Google可優化記憶體頻寬與延遲,這是混合供應商環境難以達成的。這對Nvidia新推的GH200 Grace Hopper超級晶片構成威脅,後者試圖透過結合自家CPU與GPU鎖定客戶。Google實際上宣示,既不需Nvidia CPU也能運行Nvidia GPU,甚至自家TPU。
財務影響不止於硬件成本。Google透過優化軟件堆疊,特別是硬件與JAX、TensorFlow框架的協同,讓每平方毫米晶片發揮更大效用。華爾街分析師密切關注此效率指標。隨著AI模型規模指數成長,限制因素已不只是計算能力,更是能源與冷卻成本。Google定制晶片設計兼顧液冷與特定數據中心結構,實現高密度部署,這是現成元件為維持廣泛兼容性常須妥協的。這種垂直整合讓Google能以競爭價格提供雲端服務,同時維持比純轉售Nvidia硬件的競爭對手更健康的利潤。
打破Nvidia束縛:TPU部署策略分化市場格局
Axion CPU瞄準Intel與AMD主導的通用運算市場,而Google的TPU v5p則直指Nvidia在AI領域的霸主地位。矽谷普遍認為Nvidia的CUDA軟件護城河難以逾越,但Google花逾十年精研TPU,現在能以效率媲美甚至在特定工作負載超越Nvidia最強產品。《The Information》強調,Google不只為內部服務(搜尋、YouTube、廣告)使用TPU,更積極向企業客戶推廣,培養市場跳脫「Nvidia預設」的思維。
TPU v5p的推出關鍵在於克服前代的靈活性與記憶體頻寬限制。新型TPU集群可擴展至數萬顆芯片,並透過光學交換網絡相互連接,相較許多Nvidia叢集使用的InfiniBand網絡具明顯優勢。這種光學電路交換允許Google動態重新配置超級計算機拓撲,繞過故障並針對特定模型架構優化。這種基礎設施的可編程性是關鍵差異。Nvidia賣的是晶片與網絡設備,而Google則提供一整套超級計算機即服務,將底層硬件複雜度抽象化,讓用戶無感。
此外,軟件鎖定形勢也在改變。Nvidia依賴CUDA,Google則是Kubernetes和OpenXLA編譯器等開源生態的大力支持者。目標是讓模型底層硬件層變得商品化,方便開發者無需重寫代碼即可在不同硬件間切換。如果Google成功推動PyTorch/JAX代碼於TPU與GPU間的可攜性,Nvidia對開發者社群的控制力將減弱。業內消息稱,渴求運算力且不拘泥品牌的AI新創,越來越願意嘗試TPU集群,以獲得更低延遲和更高可用性,避開Nvidia H100長達數月的等待。
生態系統之戰:Broadcom的角色與定制晶片合作的未來
Google追求晶片自主並非孤軍作戰,與Broadcom形成緊密共生夥伴關係。Google負責晶片邏輯與架構設計,Broadcom則提供高速I/O的核心IP模塊,並協助委託台積電製造。這種合作使Google能比傳統晶片廠更快迭代。財經分析與供應鏈監控報告顯示,Google大幅增加對Broadcom的訂單,意味自家定制晶片在數據中心的部署量正達到轉折點。這種「內部設計、外包IP與製造」模式成為超大規模雲服務商的標準,進一步擠壓商用晶片供應商的空間。
此策略的連鎖反應已波及整個供應鏈。《The Information》指出,Google的動作迫使競爭對手跟進。微軟推出Maia與Cobalt晶片,Meta大舉投資自家MTIA晶片。數據中心市場正走向碎片化,標準化的「Wintel」伺服器時代終結,取而代之的是各雲端供應商各自運行專屬架構。對Nvidia而言,這是長遠的生存風險。儘管目前營收飆升,但最大晶片買家正積極計劃降低依賴。若Google能將30% AI工作負載轉至Axion與TPU,將意味數十億美元營收流失至Nvidia帳簿之外。
不過,轉型風險不容忽視。高性能晶片開發艱難,延誤、錯誤或良率問題可使路線圖倒退數年,Intel過去的慘痛經驗即是明證。Google必須證明Axion能應對企業雲多變且複雜的工作負載,而非僅限於Google搜尋的可預測負載。更需說服第三方軟件供應商為其Arm架構優化。雖然趨勢向好,但x86與CUDA生態系的慣性龐大。Google賭注在於其平台的吸引力與成本優勢,足以將產業拉入其軌道。
地緣政治與戰略意涵:半導體供應鏈碎片化的影響
超越企業競爭,Google的晶片策略具更廣泛的戰略意義。多元化晶片供應使Google得以抵禦單一供應商帶來的供應鏈衝擊。在半導體供應日益受東亞地緣政治穩定性影響的當下,能將設計移植至不同晶圓廠或製程節點,提供額外韌性。Google亦可針對安全性定制硬件,在晶片深處嵌入專有安全模組,這對政府及金融業客戶越來越重要。
總結而言,Axion與TPU陣容的擴充標誌著雲端商業模式的成熟,從租用計算力轉向銷售專有平台。隨著AI成為未來十年主流工作負載,「通用」晶片正逐漸成為過時。Google入侵Nvidia領地,不僅是市場份額之爭,更是對計算未來本質的根本分歧。Nvidia願景是成為所有人的平台提供者;Google則視雲端供應商本身即為平台,從晶體管層面掌控一切。兩大巨頭的對決,將決定不僅是計算成本,更是AI時代創新的速度與方向。
—
這篇文章深刻揭示了Google如何透過自家定制晶片策略,挑戰Nvidia和傳統CPU巨頭的壟斷地位,並試圖打造一個更高效、更可控、且具韌性的AI雲端生態系。這不僅是技術層面的競爭,更是商業模式和供應鏈控制權的博弈。Google的策略顯示出大型雲端供應商正逐步擺脫對既有晶片廠商的依賴,轉向打造專屬的硬件與軟件整合平台,這將重塑整個數據中心產業的格局。
從香港讀者角度看,這場半導體與AI硬件的革命意味著全球科技供應鏈與市場格局的深刻變化,可能帶來更多元化的選擇與競爭,促進創新與成本下降。然而,這同時也引發了對技術標準碎片化的擔憂,可能使跨平台開發更為複雜,增加生態系統整合的挑戰。Google的成功與否,將成為未來AI雲端服務發展的重要風向標,也反映出科技巨頭如何在地緣政治、供應鏈安全與技術創新中尋找平衡的新典範。
🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年!
不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放