AWS暫不部署AMD AI加速器,Nvidia成首選

Ai

亞馬遜因需求不足未能推廣AMD的Instinct AI加速器

當AMD約一年前推出其Instinct MI300X加速器專為人工智能和高效能計算(HPC)設計時,亞馬遜網絡服務(AWS)表示有意在雲端部署這些設備。然而,根據《商業內幕》的報導,由於缺乏強勁的需求,亞馬遜至今尚未實施這一計畫。

亞馬遜公司Annapurna Labs的產品及客戶工程主任Gadi Hutt對《商業內幕》表示:「我們會根據客戶需求行事。如果客戶強烈表示需要這些加速器,那麼就沒有理由不推廣。」

Hutt指出,目前並沒有足夠的興趣來證明在AWS上部署AMD的Instinct MI300X加速器是合理的。儘管AMD的Instinct MI300X價格低於Nvidia的H100,但其軟件的穩定性不及Nvidia的CUDA,這讓許多開發者卻步。隨著AMD硬件的改善(例如Instinct MI325X),其軟件也應該會有所提升。

Hutt在某種程度上可能被視為利益相關者,因為Annapurna開發的Trainium在AWS的數據中心與AMD和Nvidia的產品競爭。儘管如此,假設他是在公開場合發言,這仍然表明AWS的立場。

談到Trainium,AWS擁有自主設計的Trainium和Trainium2,因此無需向AMD或Nvidia支付高額的費用,這使得其能以相對競爭的價格提供Trn1和Trn2實例,這也可能是市場對非Nvidia第三方解決方案興趣低迷的另一原因。

在Nvidia方面,AWS在其re:Invent大會上宣布將加強其AI產品,推出即將上市的Nvidia Blackwell GPU。大會期間,AWS介紹了搭載Blackwell GPU的P6伺服器,顯示這些設備預計將會受到高度需求。

儘管AWS未能在雲端提供AMD的Instinct MI300X,但仍與該公司保持密切合作,並提供多種基於AMD EPYC處理器的實例。考慮到這些處理器的核心數量和內存子系統,它們在計算和內存密集型實例中相對於Intel Xeon的競爭力上有顯著優勢。

這一情況反映了當前市場對於不同平台和技術的需求變化,顯示出在高效能計算領域,開發者對於軟件生態系統的重要性。儘管AMD在硬件上有優勢,但其軟件的穩定性和開發者的接受度仍需努力提升。這不僅是對AMD的挑戰,也是對整個行業在技術整合上的一個深刻啟示,未來的競爭將不僅僅依賴於硬件的性能,更要看軟件的生態系統如何支持這些硬件的發展。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *