華為Ascend 910C:中國晶片挑戰Nvidia H100,AI推論性能達六成!

Ai




華為Ascend 910C:減少對Nvidia依賴的潛力

華為的HiSilicon Ascend 910C是一款針對AI訓練的處理器,這個版本於2019年首次推出的Ascend 910基礎上進行了改進。儘管Ascend 910的性能在高效訓練大型AI模型方面已經顯得有些不足,但根據DeepSeek研究人員的說法,Ascend 910C在推理性能上能達到Nvidia H100的60%。雖然Ascend 910C在性能上並不突出,但它有望幫助中國減少對Nvidia GPU的依賴。

DeepSeek的測試結果顯示,910C處理器的推理性能超出了預期。此外,通過手動優化CUNN內核,其效率還可以進一步提升。DeepSeek對Ascend處理器的原生支持以及其PyTorch庫,使得CUDA到CUNN的轉換變得輕而易舉,這使華為的硬體更容易融入AI工作流程中。

這表明,儘管受到美國政府的制裁以及無法獲得台積電的先進製程技術,華為的AI處理器能力仍在迅速進步。

雖然華為和中芯國際在2019至2020年間已經趕上了台積電的技術,並生產出可以與Nvidia的A100和H100處理器相媲美的芯片,但Ascend 910C並不是AI訓練的最佳選擇。AI訓練依然是Nvidia佔據無可爭議的領先地位的領域。

DeepSeek的Yuchen Jin指出,中國處理器在長期訓練的穩定性方面存在重大弱點。這一挑戰源於Nvidia的硬體和軟體生態系統的深度整合,這一生態系統經過二十年的發展。雖然推理性能可以優化,但持續的訓練工作負載仍需華為在硬體和軟體堆棧方面進一步改進。

與原始的Ascend 910相似,新款的Ascend 910C芯片也採用了芯片組合包裝,其主要計算SoC擁有約530億個晶體管。原始Ascend 910的計算芯片組合是由台積電使用其N7+製程技術(7納米級,具備EUV技術)製造,而Ascend 910C的計算芯片組合則是由中芯國際在其第二代7納米級製程技術N+2上生產的。

展望未來,一些專家預測,隨著AI模型向Transformer架構的收斂,Nvidia的軟體生態系統的重要性可能會下降。DeepSeek在硬體和軟體優化方面的專長,亦有可能顯著減少對Nvidia的依賴,為AI公司提供更具成本效益的替代方案,特別是在推理方面。然而,要在全球範圍內競爭,中國必須克服訓練穩定性挑戰,並進一步完善其AI計算基礎設施。

在這場AI競賽中,華為的進步顯示出中國在技術自給自足方面的努力,但同時也暴露出與Nvidia在長期穩定性和技術生態系統整合上的差距。未來,若能在這些方面取得突破,將可能改變全球AI市場的格局。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放

立即升級 🔗