Nvidia 推出 Rubin 晶片:擁有 3360 億個電晶體及 50 petaflops AI 運算能力
Nvidia 今日宣布推出全新旗艦級圖形處理器 Rubin,推論性能比上一代 Blackwell 提升五倍。
這款 GPU 於 CES 大會首次亮相,同時發表了另外五款數據中心晶片。客戶可將它們組合成一個名為 Vera Rubin NVL72 的機架系統。Nvidia 表示該系統擁有高達 220 兆個電晶體,帶寬超越整個互聯網,並具備即時硬件健康檢測功能。
高速推論能力
Rubin 擁有 3360 億個電晶體,處理 NVFP4 數據時能達到 50 petaflops 運算能力。相比之下,Nvidia 之前的 Blackwell 架構最高只有 10 petaflops。至於訓練速度更快 2.5 倍,達到 35 petaflops。
部分計算能力來自名為 Transformer Engine 的模組,這模組也曾搭載於 Blackwell。Nvidia 表示 Rubin 的 Transformer Engine 採用全新設計,並加入名為硬件加速自適應壓縮的性能提升功能。壓縮文件可減少資料位元數,從而減輕 AI 模型的數據處理負擔,加快運算速度。
Nvidia 執行長黃仁勳表示:「Rubin 正好在 AI 訓練及推論需求爆炸成長的關鍵時刻誕生。我們每年推出新一代 AI 超級電腦,這次跨越六款新晶片的極致協同設計,Rubin 是邁向 AI 下一個前沿的巨大飛躍。」
機架級 AI 系統
Nvidia 計劃將 Rubin 作為 Vera Rubin NVL72 裝置的核心,該系統結合了 72 顆 Rubin 晶片及 36 顆新發表的 Vera 中央處理器。Vera CPU 採用名為 Olympus 的 88 核心客製設計,支援廣泛使用的 Armv9.2 指令集架構。
Vera Rubin NVL72 透過無線纜模組托盤設計,組裝及維護時間比 Blackwell 系統快 18 倍。其 GPU 機架還升級了名為 RAS Engine 的子系統,可自動執行維護任務,具備容錯功能及即時硬件健康檢查。
該系統提供高達 260 Tbps 帶寬,超越整個互聯網流量。它利用三款晶片協同處理 AI 模型流量:NVLink 6 Switch、Spectrum-6 以太網交換器及 ConnectX-9 超級網絡介面卡(SuperNIC),這三款晶片均於 CES 同步公布。
NVLink 6 Switch 允許同一 Vera Rubin NVL72 機架內多顆 GPU 同步高速交換數據,協調分散式 AI 模型運算。Spectrum-6 則負責連接不同機架內的 GPU。ConnectX-9 作為 SuperNIC,可將部分網絡處理任務從伺服器 CPU 轉移出去,釋放更多資源給 AI 運算。
此外,Nvidia 亦推出 BlueField-4 數據處理器(DPU),這款晶片可卸載伺服器主處理器負擔,涵蓋網絡計算、網絡安全及存儲管理等範疇。BlueField-4 亦用於 Nvidia 新推出的推論上下文記憶存儲平台,有助優化大型語言模型的鍵值快取。
大型語言模型(LLM)中的注意力機制常重複相同計算,鍵值快取可儲存重複計算結果,避免重複運算,提升硬件效率。
除了 Vera Rubin NVL72,Nvidia 還將推出較小型的 DGX Rubin NVL8 裝置,內含 8 顆 Rubin GPU。兩者組成全新 DGX SuperPOD 參考架構,結合最新晶片與名為 Mission Control 的軟件平台,方便企業管理 AI 基礎設施。
Rubin 系統預計將於 2026 年下半年開始出貨。
—
評論與啟示
Nvidia 這次推出的 Rubin 晶片及其整合的 Vera Rubin NVL72 系統,顯示了 AI 運算硬件正迅速進入一個全新層次。3360 億個電晶體和 50 petaflops 的推論性能,遠超現有水平,意味著未來的 AI 模型可在更短時間內完成更複雜的任務,推動自動化和智能化的應用場景更上一層樓。
硬件加速的自適應壓縮技術,反映出 Nvidia 對減少數據處理瓶頸的深刻理解。這不僅僅是硬件堆疊,更是從軟硬結合層面優化 AI 計算效率的創新。隨著 AI 模型規模越來越大,如何有效管理和加速數據流成為硬件設計的關鍵。
此外,Nvidia 將多款晶片整合於一體機架系統,包括 GPU、CPU、網絡交換器及 DPU,展現出對構建全方位 AI 基礎設施的前瞻視野。這種高度整合的系統能大幅提升部署效率和維護便利性,也顯示未來數據中心將更多依賴專用硬件協同工作。
然而,這樣的尖端硬件也帶來能源消耗和成本的挑戰。如何在推動性能突破的同時兼顧環保和經濟性,將是 Nvidia 及整個產業需要面對的課題。
對香港及全球的科技生態來說,Rubin 及其系統的推出,意味著 AI 應用將更廣泛、更高效,從智慧城市到金融科技乃至醫療健康,都將受惠於更強大的計算能力。企業和政府應及早布局相關基礎設施,掌握這波 AI 硬件升級帶來的機遇。
總括而言,Nvidia Rubin 不僅是晶片性能的飛躍,更是 AI 硬體生態系統整合和智能化管理的里程碑,值得業界密切關注及深度研究。
以上文章由GPT 所翻譯及撰寫。而圖片則由GEMINI根據內容自動生成。
![{
"image_generation_request": {
"prompt": "Ultra-realistic portrait of a man walking toward the camera on an airport runway at night He wears a white long-sleeve shirt with sleeves rolled up and dress pants, shoes. The camera is very close, capturing his face sharply - textures of skin, smoke from his lips, and subtle reflections of firelight in his eyes. Behind him, slightly out of focus, a commercial airplane is burning intensely, with huge flames, roaring firestorms, and thick black smoke rising high. The fiery glow casts dramatic orange highlights on his shirt and face, creating deep shadows and a gritty, cinematic mood. Wet runway reflects the blaze, enhancing the dramatic atmosphere.",
"dimensions": {
"width": 1200,
"height": 1200
},
"style_descriptors": [
"Cinematic",
"Photorealistic",
"Gritty",
"Dramatic Lighting",
"Macro Photography",
"8k resolution"
],
"subject_details": {
"action": "Walking toward camera, smoking",
"clothing": "White long-sleeve shirt (rolled sleeves), dress pants, shoes",
"facial_features": "Sharp focus, skin texture, firelight reflection in eyes"
},
"environment_details": {
"location": "Airport runway at night",
"background": "Commercial airplane burning, intense fire, thick black smoke, out of focus",
"ground": "Wet runway, reflecting fire"
}
}
}](https://ssfuture.shop/wp-content/uploads/ai_gen_1765251172-300x300.png)

