Nscale 獲得 1.55 億美元投資 擴展 AI 數據中心

Ai

AI數據中心建設商Nscale獲得1.55億美元投資

Nscale Ltd.是一家位於倫敦的初創公司,專注於為人工智能工作負載建設優化數據中心,近日成功籌集了1.55億美元的資金,以擴大其基礎設施規模。

此次A輪融資於今天早上正式宣布,由Sandton Capital Partners主導,Kestrel 0x1、Blue Sky Capital Managers和Florence Capital等參與投資。

這一融資里程碑的宣布距離Nscale建造的一個AI集群進入全球最強超級計算機Top500排名僅幾周。該Svartisen集群獲得了第156名,最大性能達到12.38 petaflops,擁有66,528個核心。

Nscale的系統由每台包含六個AMD(超微半導體)芯片的伺服器組成:兩個中央處理器和四個MI250X機器學習加速器。MI250X則包括兩個基於六納米工藝的顯示卡,以及128GB的板載RAM,用於存儲AI模型數據。

這些伺服器通過Nscale使用Broadcom的硅技術構建的以太網網絡相連。該網絡實施了一種名為RoCE的技術,可以在兩台機器之間轉移數據,而無需經過各自的CPU,從而加速數據流動。RoCE還能自動執行任務,如檢測過載的網絡鏈路和將數據包重定向到其他連接。

在軟件層面上,Nscale的硬件由一個自定義的基礎設施編排平台提供支持。該平台將Kubernetes與Slurm(管理數據中心基礎設施的流行開源框架)整合在一起。

Kubernetes和Slurm都能自動決定在集群中哪台伺服器應該運行什麼工作負載,但它們在幾個方面有所不同。Kubernetes擁有自我修復機制,能自動從某些故障中恢復,而Slurm則支持一種名為MPI的網絡技術,能高效地在AI工作負載的不同組件之間移動數據。

Nscale在位於北極圈內的挪威Glomfjord村建造了Svartisen集群。這個數據中心(如圖所示)由附近的水電大壩供電,並直接連接到一條光纖電纜,該電纜將其與互聯網服務提供商的基礎設施相連。該電纜具備雙重冗餘,意味著即使多個重要組件失效,數據中心仍能繼續運行。

該公司以多種方式向客戶提供其基礎設施。它提供AI訓練集群以及自動根據工作負載需求添加或移除硬件資源的推理服務。還有裸金屬基礎設施選項,使用戶能更全面地自定義其部署的軟件堆棧。

客戶可以從Nscale提供的算法庫中下載AI模型,也可以自帶模型。根據該公司的說法,還提供了一個預配置的編譯器工具包,用於將用戶工作負載轉換為可以高效運行在其伺服器上的格式。

目前,Nscale的建設計劃包括總功耗為300兆瓦的數據中心,這是該公司Glomfjord設施用電量的10倍。利用今天宣布的A輪融資,Nscale將把其管道擴展至1,000兆瓦。

Nscale首席執行官Joshua Payne表示:“市場擴展的最大風險在於需要大規模連續的電力供應來為這些大型GPU超級集群供電。Nscale擁有1.3GW的場地管道,這使我們能夠從頭設計數據中心、超級集群和雲環境,為客戶提供端到端的解決方案。”

該公司將在北美和歐洲建設新的數據中心。根據公司的說法,明年計劃建設120兆瓦的數據中心容量。這些新基礎設施將幫助Nscale推動其計劃中的公共雲服務,專注於訓練和推理工作負載,預定於2025年第一季度推出。

這篇文章展示了Nscale在AI數據中心領域的迅速崛起和未來的潛力,尤其是在全球對高效能計算需求不斷上升的背景下。透過這筆融資,Nscale不僅能夠擴大其基礎設施,還能在設計和運營上進一步優化,這將使其在競爭日益激烈的市場中占據有利地位。隨著AI技術的進一步發展,Nscale的成功將可能成為其他初創公司的借鑒,特別是在如何有效管理資源和滿足市場需求方面。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *