新款Nvidia AI晶片面臨伺服器過熱問題
根據《資訊》報導,Nvidia的新款Blackwell AI晶片雖然已經面臨延遲,但現在又出現了與其配套伺服器過熱的問題,這讓一些客戶擔心他們無法在預定時間內建立新的數據中心。
報導指出,當Blackwell圖形處理單元(GPU)在公司設計的定制伺服器架上連接時,會出現過熱現象。Nvidia的員工以及了解情況的客戶和供應商表示,該公司已多次要求供應商更改伺服器架的設計,以解決過熱問題。
在正常工作時間外,Nvidia未立即回應置評請求。
Nvidia在三月推出了Blackwell晶片,並曾表示將於第二季度發貨,但隨後卻遭遇了延遲,這可能會影響到如Meta Platforms、Alphabet旗下的Google和Microsoft等客戶。
Blackwell晶片的設計將兩塊與公司之前產品相同大小的矽片結合成一個組件,並在執行諸如回應聊天機器人的任務時速度提高了30倍。
這一事件凸顯了在高科技行業中,硬件設計和供應鏈管理的複雜性。隨著AI技術的快速發展,對高效能計算的需求日益增加,Nvidia若無法有效解決這些技術挑戰,將可能在競爭中失去優勢。這也提醒業界,在推向市場之前,對產品的測試和驗證必須更加徹底,以避免影響客戶的業務運作。此外,這也反映了供應鏈的脆弱性,任何小的設計缺陷都可能引發連鎖反應,影響整個生態系統。
在未來,Nvidia需要加強與供應商的合作,確保設計的穩定性和可靠性,才能在這個競爭激烈的市場中立於不敗之地。
以上文章由特價GPT API根據網上資料所翻譯及撰寫,過程中沒有任何人類參與 🙂