Nvidia推出的迷你超級電腦引發技術革命
最近,Nvidia推出了一款名為GB10的迷你超級電腦,這一產品的問世引發了廣泛的關注。許多人對Nvidia會推出這樣的產品感到驚訝,畢竟這家公司以售賣價值數十萬美元的零部件而聞名,突然轉向以更低的價格銷售整套系統,似乎是不尋常的舉動。
我認為,Nvidia的目標是希望能夠像IBM在45年前推出原始IBM PC時所做的那樣,徹底改變計算機技術。或許,我們可以引入一個新的概念——Jensen’s law,與摩爾定律相輔相成:在相同的AI性能下,降低每FLOP的價格需要約100個月的時間。
Project DIGITS的誕生
Project DIGITS是一款完全成型的超級電腦,大小僅如迷你PC。它實際上是DGX-1的縮小版,DGX-1於2016年首次推出,當時的售價高達129,000美元,配備16核Intel Xeon CPU和八張P100 GPGPU卡。而現在,Digits的價格僅為3,000美元。
Nvidia確認,Digits的AI性能達到1,000 Teraflops(FP4精度)。雖然無法直接比較,但可以推測這款迷你超級電腦的處理能力大約是完全配置的8卡Pascal基DGX-1的一半。
Digits的核心是GB10 SoC,其中包含20個Arm核心(10個Arm Cortex-X925和10個Cortex-A725)。除了確認存在Blackwell GPU(B100的輕量版),還可以推測其功耗(100W)和帶寬(根據The Register報導為825GB/s)。
用戶可以通過Nvidia的專有ConnectX技術將兩台這些設備連接起來,但不能超過兩台,以便處理更大的大型語言模型,例如Meta的Llama 3.1 405B。將這些迷你PC放入42U的機櫃目前似乎幾乎不可能,因為這將影響Nvidia更具利潤的DGX GB200系統。
Nvidia的市場戰略
那麼,為什麼Nvidia會啟動Project DIGITS呢?我認為這一切都是為了加強其市場護城河。讓你的產品變得如此吸引人,以至於用戶幾乎無法轉向競爭對手,這一策略在微軟的Windows、谷歌的Gmail和蘋果的iPhone等公司中都取得了成功。
Nvidia在CUDA上的成功使其在市場中占據了主導地位,這使得該公司能夠隨意調整規則,讓競爭對手措手不及。向FP4推進的推理技術使得Nvidia能夠提出令人印象深刻的基準數據,例如“Blackwell在FP8的訓練性能是其前身的2.5倍,而在FP4的推理性能則達到5倍”。當然,AMD在MI300X/325X系列中並不提供FP4計算,而我們還需要等到今年晚些時候,Instinct MI350X/355X系列才會推出FP4支持。
因此,Nvidia正在為未來的競爭做好準備,這些競爭可能來自現有的和未來的對手,包括其自身的客戶(例如微軟和谷歌)。Nvidia CEO黃仁勳的野心顯而易見;他希望將公司的主導地位擴展到超大規模數據中心之外。
“AI將在每個行業的每個應用中成為主流。通過Project DIGITS,Grace Blackwell超級芯片將進入數以百萬計的開發者手中,這將使每位數據科學家、AI研究人員和學生都能夠參與並塑造AI時代,”黃仁勳最近表示。
這幾乎可以看作是黃仁勳承認他希望將Nvidia的名字與AI劃上等號的宣言,正如Tarmac和Hoover在各自的細分市場中所做的那樣。
關於聯合Mediatek的困惑
我和許多人一樣,對Nvidia與Mediatek的合作感到困惑,這一聯盟的原因可以在Mediatek的新聞稿中找到。這家台灣公司提到“其在基於Arm的SoC性能和功耗效率方面的設計專業知識,為AI研究人員和開發者帶來了一款突破性的設備”。
我認為這一合作對Mediatek的好處大於對Nvidia,而在短期內,我可以預見Nvidia會逐漸單幹。路透社報導,黃仁勳對Nvidia與AMD和Intel的競爭表示懷疑,他稱:“現在他們(Mediatek)可以為我們提供這些,而他們也可以保留這些產品,服務市場。因此這是一個雙贏的結果。”
這並不意味著Nvidia不會推出更多主流產品,只是這些產品將針對企業和專業人士,而不是消費者,因為消費者市場競爭激烈,利潤微薄。
路透社的文章引用黃仁勳的話說:“我們會讓這成為一款主流產品,我們會用我們所有的支持,幫助專業和高質量的軟件,PC製造商將向最終用戶提供這些產品。”
未來的展望
在研究這一特性時,我遇到了一個理論,即越來越多的數據科學家開始接受蘋果的Mac平台,因為它提供了一種平衡的解決方案。其性能足夠優秀,得益於其統一的內存架構,且價格“合理”。目前,配備128GB統一內存和4TB SSD的Mac Studio的售價為5,799美元。
那麼,Nvidia接下來會怎麼做呢?一個明顯的步驟是將內存集成到SoC中,這類似於蘋果在其M系列SoC中所做的(AMD在其HBM驅動的Epyc中也有類似做法)。這不僅可以節省成本,還能提高性能,這是其更大兄弟GB200已經實現的。
接下來,將取決於Nvidia是否希望在同樣的價格下提供更多,還是以更低的價格提供相同的性能(或兩者兼而有之)。Nvidia可能會效仿Intel的做法,將GB10作為原型,鼓勵其他關鍵合作夥伴(如PNY、Gigabyte、Asus)推出類似的項目(Intel曾以Next Unit of Computing或NUC為例)。
我也特別想知道Jetson Orin系列會發生什麼變化;NX 16GB版本在幾週前剛剛升級,提供157 TOPS的INT8性能。這一平台旨在滿足更多DIY/邊緣使用案例,而非純粹的訓練/推理任務,但我不禁思考“如果”情境。
Nvidia顯然在自我顛覆,以防其他人試圖這樣做;問題是它會走多遠。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。