華為Ascend 910C：中國晶片挑戰Nvidia H100，AI推論性能達六成！

zero comment

華為Ascend 910C：減少對Nvidia依賴的潛力

華為的HiSilicon Ascend 910C是一款針對AI訓練的處理器，這個版本於2019年首次推出的Ascend 910基礎上進行了改進。儘管Ascend 910的性能在高效訓練大型AI模型方面已經顯得有些不足，但根據DeepSeek研究人員的說法，Ascend 910C在推理性能上能達到Nvidia H100的60%。雖然Ascend 910C在性能上並不突出，但它有望幫助中國減少對Nvidia GPU的依賴。

DeepSeek的測試結果顯示，910C處理器的推理性能超出了預期。此外，通過手動優化CUNN內核，其效率還可以進一步提升。DeepSeek對Ascend處理器的原生支持以及其PyTorch庫，使得CUDA到CUNN的轉換變得輕而易舉，這使華為的硬體更容易融入AI工作流程中。

這表明，儘管受到美國政府的制裁以及無法獲得台積電的先進製程技術，華為的AI處理器能力仍在迅速進步。

雖然華為和中芯國際在2019至2020年間已經趕上了台積電的技術，並生產出可以與Nvidia的A100和H100處理器相媲美的芯片，但Ascend 910C並不是AI訓練的最佳選擇。AI訓練依然是Nvidia佔據無可爭議的領先地位的領域。

DeepSeek的Yuchen Jin指出，中國處理器在長期訓練的穩定性方面存在重大弱點。這一挑戰源於Nvidia的硬體和軟體生態系統的深度整合，這一生態系統經過二十年的發展。雖然推理性能可以優化，但持續的訓練工作負載仍需華為在硬體和軟體堆棧方面進一步改進。

與原始的Ascend 910相似，新款的Ascend 910C芯片也採用了芯片組合包裝，其主要計算SoC擁有約530億個晶體管。原始Ascend 910的計算芯片組合是由台積電使用其N7+製程技術（7納米級，具備EUV技術）製造，而Ascend 910C的計算芯片組合則是由中芯國際在其第二代7納米級製程技術N+2上生產的。

展望未來，一些專家預測，隨著AI模型向Transformer架構的收斂，Nvidia的軟體生態系統的重要性可能會下降。DeepSeek在硬體和軟體優化方面的專長，亦有可能顯著減少對Nvidia的依賴，為AI公司提供更具成本效益的替代方案，特別是在推理方面。然而，要在全球範圍內競爭，中國必須克服訓練穩定性挑戰，並進一步完善其AI計算基礎設施。

在這場AI競賽中，華為的進步顯示出中國在技術自給自足方面的努力，但同時也暴露出與Nvidia在長期穩定性和技術生態系統整合上的差距。未來，若能在這些方面取得突破，將可能改變全球AI市場的格局。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Download TXT

華為Ascend 910C：中國晶片挑戰Nvidia H100，AI推論性能達六成！

chatgpt

🔥 CHATGPT PLUS 帳戶出租

華為Ascend 910C：中國晶片挑戰Nvidia H100，AI推論性能達六成！

chatgpt

Related Articles

$20用AI即刻清理iPhone儲存空間！

任天堂Switch人氣遊戲驚爆低價大優惠！

AI未必搶工！研究揭示職場新變局

🔥 CHATGPT PLUS 帳戶出租