Exacluster推出基於Nvidia H200 Hopper GPU的AI和HPC集群
ExaAILabs的首席執行官Will Bryk在1月10日宣布,他們公司已經部署了Exacluster,這是業界首批基於Nvidia H200 GPU的集群之一,旨在構建一個能比Google更好地理解用戶的搜索引擎,並提供更優質的搜索結果。
實際上,Exacluster的性能並不涉及ExaFLOPS級別的計算能力。之所以稱為Exacluster,是因為它由18台8路NVIDIA H200伺服器組成(exa代表十的18次方)。這個集群提供144個H200 GPU和20TB的HBM3E內存(每個GPU有141GB的HBM3E),總計算性能為569,958 TOPS(約570 PetaTOPS)。該集群將用於訓練ExaAI的神經網絡。
該集群基於192個96核處理器(共3,456個核心),並配備36TB的DDR5內存和270TB的NVMe固態存儲。這台超級計算機的功耗為100kW。每個機架僅安裝兩台這樣的機器,以確保所有伺服器獲得足夠的冷卻。這些機器使用標準空氣冷卻,Bryk預計這對於長時間在負載下運行是足夠的。
Bryk表示,這個集群的成本約為500萬美元,這意味著每台機器的成本為277,777美元,這與單個8路H200主板的價格相當,而非整台伺服器的價格。ExaAI如何以如此低的價格及早獲得H200基礎機器仍不清楚。不過,Nvidia是該公司的主要投資者之一,還有Lightspeed和YCombinator。
通常,與Nvidia有關聯的公司往往能夠比其他公司更早獲得其硬件。或許,由於ExaAI的需求相對謙遜,他們即使沒有利用其重要的關係,也能夠獲得這些機器,因為其AI的應用獨特且引起了各方的興趣。ExaAI的最終目標是構建一個能夠理解和處理複雜查詢並返回合理結果的搜索引擎。如果該公司成功,將可能徹底改變我們對搜索的認知。
評論與觀察
Exacluster的推出無疑在AI和高性能計算(HPC)領域引起了廣泛關注。Bryk所提到的能夠超越Google的搜索引擎,若能實現,將對信息檢索技術產生革命性的影響。然而,這樣的挑戰也伴隨著巨大的風險,因為Google在搜索引擎的算法和用戶數據方面擁有無可比擬的優勢。
此外,ExaAI如何在技術、資金和市場環境中找到自己的立足點,也將是未來觀察的重點。隨著AI技術的迅速發展,越來越多的創新企業冒出來,競爭將變得更加激烈。因此,ExaAI需要不斷創新,保持技術領先,才能在這個競爭日益激烈的市場中生存和發展。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。