Nvidia Rubin芯片:AI算力大躍進50倍

Ai

Nvidia 推出 Rubin 晶片:擁有 3360 億個電晶體及 50 petaflops AI 運算能力

Nvidia 今日宣布推出全新旗艦級圖形處理器 Rubin,推論性能比上一代 Blackwell 提升五倍。

這款 GPU 於 CES 大會首次亮相,同時發表了另外五款數據中心晶片。客戶可將它們組合成一個名為 Vera Rubin NVL72 的機架系統。Nvidia 表示該系統擁有高達 220 兆個電晶體,帶寬超越整個互聯網,並具備即時硬件健康檢測功能。

高速推論能力

Rubin 擁有 3360 億個電晶體,處理 NVFP4 數據時能達到 50 petaflops 運算能力。相比之下,Nvidia 之前的 Blackwell 架構最高只有 10 petaflops。至於訓練速度更快 2.5 倍,達到 35 petaflops。

部分計算能力來自名為 Transformer Engine 的模組,這模組也曾搭載於 Blackwell。Nvidia 表示 Rubin 的 Transformer Engine 採用全新設計,並加入名為硬件加速自適應壓縮的性能提升功能。壓縮文件可減少資料位元數,從而減輕 AI 模型的數據處理負擔,加快運算速度。

Nvidia 執行長黃仁勳表示:「Rubin 正好在 AI 訓練及推論需求爆炸成長的關鍵時刻誕生。我們每年推出新一代 AI 超級電腦,這次跨越六款新晶片的極致協同設計,Rubin 是邁向 AI 下一個前沿的巨大飛躍。」

機架級 AI 系統

Nvidia 計劃將 Rubin 作為 Vera Rubin NVL72 裝置的核心,該系統結合了 72 顆 Rubin 晶片及 36 顆新發表的 Vera 中央處理器。Vera CPU 採用名為 Olympus 的 88 核心客製設計,支援廣泛使用的 Armv9.2 指令集架構。

Vera Rubin NVL72 透過無線纜模組托盤設計,組裝及維護時間比 Blackwell 系統快 18 倍。其 GPU 機架還升級了名為 RAS Engine 的子系統,可自動執行維護任務,具備容錯功能及即時硬件健康檢查。

該系統提供高達 260 Tbps 帶寬,超越整個互聯網流量。它利用三款晶片協同處理 AI 模型流量:NVLink 6 Switch、Spectrum-6 以太網交換器及 ConnectX-9 超級網絡介面卡(SuperNIC),這三款晶片均於 CES 同步公布。

NVLink 6 Switch 允許同一 Vera Rubin NVL72 機架內多顆 GPU 同步高速交換數據,協調分散式 AI 模型運算。Spectrum-6 則負責連接不同機架內的 GPU。ConnectX-9 作為 SuperNIC,可將部分網絡處理任務從伺服器 CPU 轉移出去,釋放更多資源給 AI 運算。

此外,Nvidia 亦推出 BlueField-4 數據處理器(DPU),這款晶片可卸載伺服器主處理器負擔,涵蓋網絡計算、網絡安全及存儲管理等範疇。BlueField-4 亦用於 Nvidia 新推出的推論上下文記憶存儲平台,有助優化大型語言模型的鍵值快取。

大型語言模型(LLM)中的注意力機制常重複相同計算,鍵值快取可儲存重複計算結果,避免重複運算,提升硬件效率。

除了 Vera Rubin NVL72,Nvidia 還將推出較小型的 DGX Rubin NVL8 裝置,內含 8 顆 Rubin GPU。兩者組成全新 DGX SuperPOD 參考架構,結合最新晶片與名為 Mission Control 的軟件平台,方便企業管理 AI 基礎設施。

Rubin 系統預計將於 2026 年下半年開始出貨。

評論與啟示

Nvidia 這次推出的 Rubin 晶片及其整合的 Vera Rubin NVL72 系統,顯示了 AI 運算硬件正迅速進入一個全新層次。3360 億個電晶體和 50 petaflops 的推論性能,遠超現有水平,意味著未來的 AI 模型可在更短時間內完成更複雜的任務,推動自動化和智能化的應用場景更上一層樓。

硬件加速的自適應壓縮技術,反映出 Nvidia 對減少數據處理瓶頸的深刻理解。這不僅僅是硬件堆疊,更是從軟硬結合層面優化 AI 計算效率的創新。隨著 AI 模型規模越來越大,如何有效管理和加速數據流成為硬件設計的關鍵。

此外,Nvidia 將多款晶片整合於一體機架系統,包括 GPU、CPU、網絡交換器及 DPU,展現出對構建全方位 AI 基礎設施的前瞻視野。這種高度整合的系統能大幅提升部署效率和維護便利性,也顯示未來數據中心將更多依賴專用硬件協同工作。

然而,這樣的尖端硬件也帶來能源消耗和成本的挑戰。如何在推動性能突破的同時兼顧環保和經濟性,將是 Nvidia 及整個產業需要面對的課題。

對香港及全球的科技生態來說,Rubin 及其系統的推出,意味著 AI 應用將更廣泛、更高效,從智慧城市到金融科技乃至醫療健康,都將受惠於更強大的計算能力。企業和政府應及早布局相關基礎設施,掌握這波 AI 硬件升級帶來的機遇。

總括而言,Nvidia Rubin 不僅是晶片性能的飛躍,更是 AI 硬體生態系統整合和智能化管理的里程碑,值得業界密切關注及深度研究。

以上文章由GPT 所翻譯及撰寫。而圖片則由GEMINI根據內容自動生成。

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
一隻在香港茶餐的喝奶茶的貓 一隻在香港茶餐廳喝奶茶的貓 A beautiful young woman in her early twenties from Hong Kong has flawless, fair skin with a subtle glow. She possesses large, clear eyes with soft eyeliner and long, delicate eyelashes. Her nose is straight, and her face is exquisitely heart-shaped. Her lips are naturally pink. She has long, layered, dark brown hair parted in the middle. She wears a loose-fitting light gray and beige striped knit sweater with a waffle pattern and slightly oversized ribbed cuffs. One shoulder of the sweater slips slightly. She pairs this with a burgundy high-waisted quilted mini skirt with a diamond pattern and ruffles at the hem, revealing her long, smooth legs. She strikes a playful pose, her eyes innocent yet subtly alluring. She stands in front of a pristine white studio backdrop, the soft, even lighting creating a natural atmosphere without harsh shadows. This is a high-key portrait; the minimalist background highlights her delicate skin texture, and her sharp, clear eyes, presenting a realistic sense of style. Magazine cover style, shot with an 85mm lens, f/2.0 aperture, soft bokeh, 8K resolution, ultra-realistic, commercial photography.