中國AI DeepSeek崛起，挑戰Nvidia晶片霸主地位？

zero comment

Nvidia股票可能因DeepSeek的“驚人”AI模型而下跌

美國對中國限制Nvidia最先進AI晶片的政策，無意中幫助了一家中國AI開發商超越了完全可以接觸該公司最新晶片的美國競爭對手。這證明了一個基本原因，為什麼初創公司往往比大型企業更成功：稀缺性催生創新。

以中國AI模型DeepSeek R1為例，這是一個與OpenAI的o1競爭的複雜問題解決模型，據《華爾街日報》報導，它的性能“迅速躍升至全球前十”，而且是在更少、更不強大的AI晶片下，以更低的成本快速構建的。

R1的成功應該會使企業受益。因為企業在面對一個有效的AI模型時，沒有理由為更貴的選擇埋單，尤其當有一個更便宜且可能發展更快的選擇時。矽谷一家使用生成性AI預測財務回報的初創公司聯合創始人Anthony Poo在接受《華爾街日報》訪問時表示：“OpenAI的模型性能最佳，但我們也不想為不需要的能力付費。”

去年九月，Poo的公司在測試中發現DeepSeek的表現“在成本上大約只有四分之一”後，從Anthropic的Claude轉向了DeepSeek。

當我的書《Brain Rush》去年夏天出版時，我擔心美國的生成AI未來過於依賴大型科技公司。我將此與美國初創公司在網絡泡沫期間的創造力進行對比——那時出現了2888個首次公開募股（而美國生成AI初創公司則沒有IPO）。

DeepSeek的R1：卓越性能、較低成本、較短開發時間

DeepSeek給美國一位風險投資家留下了深刻印象。矽谷風險投資家Marc Andreessen在1月24日的X平台上寫道：“DeepSeek R1是我見過的最驚人和令人印象深刻的突破之一。”

公平地說，DeepSeek的技術落後於OpenAI和Google等美國競爭對手。然而，《華爾街日報》指出，這家公司的R1模型——於1月20日推出——“雖然使用了更少和不那麼先進的晶片，但仍然是強有力的競爭對手，並且在某些情況下跳過了美國開發者認為必不可少的步驟。”

由於部署生成AI的高成本，企業越來越懷疑是否能夠實現正的投資回報。正如我在去年四月所寫的那樣，可能會在這項技術上投資超過1萬億美元，但一個殺手級應用尚未出現。

因此，企業對降低所需投資的前景感到興奮。由於R1的開源模型表現良好，且比OpenAI和Google的模型便宜得多，企業對此非常感興趣。

R1為何如此受歡迎？根據VentureBeat的報導，R1是HuggingFace上下載量最高的模型，達到109,000次，並且其成本僅為“OpenAI的o1的3%-5%”。R1還提供了一個用戶評價優於OpenAI和Perplexity的搜索功能，僅次於Google的Gemini Deep Research。

DeepSeek以更快且更低的成本開發R1。DeepSeek表示，其最新模型的訓練成本為560萬美元，遠低於Anthropic首席執行官Dario Amodei在2024年提到的訓練模型的成本範圍在1億到10億美元之間。《華爾街日報》報導指出，DeepSeek為其V3模型使用了超過2000個Nvidia晶片的集群，而類似大小的模型訓練通常需要數萬個晶片。

來自加州大學伯克利分校研究者的獨立分析師評級顯示，V3和R1模型在1月25日的聊天機器人性能排行榜中位列前十。

DeepSeek的首席執行官是管理著80億美元對沖基金的梁文峰。他的對沖基金High-Flyer使用AI晶片構建算法，以識別“可能影響股價的模式”，《金融時報》報導指出。

梁的外部身份幫助他取得成功。2023年，他成立DeepSeek來開發人類水平的AI。“梁組建了一支出色的基礎設施團隊，真正理解晶片的運作方式，”一家競爭對手LLM公司的創始人告訴《金融時報》。“他將對沖基金中最優秀的人才帶到了DeepSeek。”

DeepSeek在華盛頓禁止Nvidia向中國出口H100——Nvidia最強大的晶片後受益。這迫使當地AI公司在有限的計算能力下，利用不那麼強大的本地晶片（如Nvidia H800s）進行工程設計。梁的團隊“已經知道如何解決這個問題”，《金融時報》指出。

微軟對DeepSeek的成就印象深刻。微軟首席執行官Satya Nadella在1月22日的世界經濟論壇上表示：“看到DeepSeek的新模型，無論是如何有效地實現開源模型，還是計算效率，都令人驚艷。我們應該非常認真地看待來自中國的這些進展。”

DeepSeek的突破會減緩Nvidia晶片的需求增長嗎？

DeepSeek的成功應該促使美國AI政策的變革，同時讓Nvidia的投資者更加謹慎。美國對Nvidia的出口限制促使像DeepSeek這樣的初創公司優先考慮效率、資源整合和合作。為了創建R1，DeepSeek重新設計了其訓練過程，以使用Nvidia H800的較低處理速度——這是H100的一半，前DeepSeek員工兼現任西北大學計算機科學博士生的Zihan Wang告訴《麻省理工科技評論》。

一位Nvidia研究人員對DeepSeek的成就表示熱情。DeepSeek報告成果的論文讓Nvidia高級研究科學家Jim Fan想起了早期一些開創性的AI程序，這些程序從零開始掌握了棋類遊戲，例如棋盤遊戲，而不是首先模仿人類大師。

DeepSeek的成功會減少Nvidia的增長率嗎？我不知道。然而，根據我的研究，企業明顯希望獲得能夠帶來回報的強大生成AI模型。

R1的較低成本和較短的表現時間應該會繼續吸引更多的商業關注。DeepSeek能夠提供企業所需的關鍵，正是它在優化不那麼強大的GPU方面的技術，這些GPU的成本低於最新技術。

如果更多的初創公司能夠複製DeepSeek的成就，那麼對Nvidia最昂貴晶片的需求可能會減少。

我不知道如果這種情況發生，Nvidia會如何應對。然而，短期內這可能意味著收入增長減少，因為遵循DeepSeek策略的初創公司正在使用更少、更便宜的晶片建立模型。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。