中國AI DeepSeek崛起,挑戰Nvidia晶片霸主地位?

Ai

Nvidia股票可能因DeepSeek的“驚人”AI模型而下跌

美國對中國限制Nvidia最先進AI晶片的政策,無意中幫助了一家中國AI開發商超越了完全可以接觸該公司最新晶片的美國競爭對手。這證明了一個基本原因,為什麼初創公司往往比大型企業更成功:稀缺性催生創新。

以中國AI模型DeepSeek R1為例,這是一個與OpenAI的o1競爭的複雜問題解決模型,據《華爾街日報》報導,它的性能“迅速躍升至全球前十”,而且是在更少、更不強大的AI晶片下,以更低的成本快速構建的。

R1的成功應該會使企業受益。因為企業在面對一個有效的AI模型時,沒有理由為更貴的選擇埋單,尤其當有一個更便宜且可能發展更快的選擇時。矽谷一家使用生成性AI預測財務回報的初創公司聯合創始人Anthony Poo在接受《華爾街日報》訪問時表示:“OpenAI的模型性能最佳,但我們也不想為不需要的能力付費。”

去年九月,Poo的公司在測試中發現DeepSeek的表現“在成本上大約只有四分之一”後,從Anthropic的Claude轉向了DeepSeek。

當我的書《Brain Rush》去年夏天出版時,我擔心美國的生成AI未來過於依賴大型科技公司。我將此與美國初創公司在網絡泡沫期間的創造力進行對比——那時出現了2888個首次公開募股(而美國生成AI初創公司則沒有IPO)。

DeepSeek的R1:卓越性能、較低成本、較短開發時間

DeepSeek給美國一位風險投資家留下了深刻印象。矽谷風險投資家Marc Andreessen在1月24日的X平台上寫道:“DeepSeek R1是我見過的最驚人和令人印象深刻的突破之一。”

公平地說,DeepSeek的技術落後於OpenAI和Google等美國競爭對手。然而,《華爾街日報》指出,這家公司的R1模型——於1月20日推出——“雖然使用了更少和不那麼先進的晶片,但仍然是強有力的競爭對手,並且在某些情況下跳過了美國開發者認為必不可少的步驟。”

由於部署生成AI的高成本,企業越來越懷疑是否能夠實現正的投資回報。正如我在去年四月所寫的那樣,可能會在這項技術上投資超過1萬億美元,但一個殺手級應用尚未出現。

因此,企業對降低所需投資的前景感到興奮。由於R1的開源模型表現良好,且比OpenAI和Google的模型便宜得多,企業對此非常感興趣。

R1為何如此受歡迎?根據VentureBeat的報導,R1是HuggingFace上下載量最高的模型,達到109,000次,並且其成本僅為“OpenAI的o1的3%-5%”。R1還提供了一個用戶評價優於OpenAI和Perplexity的搜索功能,僅次於Google的Gemini Deep Research。

DeepSeek以更快且更低的成本開發R1。DeepSeek表示,其最新模型的訓練成本為560萬美元,遠低於Anthropic首席執行官Dario Amodei在2024年提到的訓練模型的成本範圍在1億到10億美元之間。《華爾街日報》報導指出,DeepSeek為其V3模型使用了超過2000個Nvidia晶片的集群,而類似大小的模型訓練通常需要數萬個晶片。

來自加州大學伯克利分校研究者的獨立分析師評級顯示,V3和R1模型在1月25日的聊天機器人性能排行榜中位列前十。

DeepSeek的首席執行官是管理著80億美元對沖基金的梁文峰。他的對沖基金High-Flyer使用AI晶片構建算法,以識別“可能影響股價的模式”,《金融時報》報導指出。

梁的外部身份幫助他取得成功。2023年,他成立DeepSeek來開發人類水平的AI。“梁組建了一支出色的基礎設施團隊,真正理解晶片的運作方式,”一家競爭對手LLM公司的創始人告訴《金融時報》。“他將對沖基金中最優秀的人才帶到了DeepSeek。”

DeepSeek在華盛頓禁止Nvidia向中國出口H100——Nvidia最強大的晶片後受益。這迫使當地AI公司在有限的計算能力下,利用不那麼強大的本地晶片(如Nvidia H800s)進行工程設計。梁的團隊“已經知道如何解決這個問題”,《金融時報》指出。

微軟對DeepSeek的成就印象深刻。微軟首席執行官Satya Nadella在1月22日的世界經濟論壇上表示:“看到DeepSeek的新模型,無論是如何有效地實現開源模型,還是計算效率,都令人驚艷。我們應該非常認真地看待來自中國的這些進展。”

DeepSeek的突破會減緩Nvidia晶片的需求增長嗎?

DeepSeek的成功應該促使美國AI政策的變革,同時讓Nvidia的投資者更加謹慎。美國對Nvidia的出口限制促使像DeepSeek這樣的初創公司優先考慮效率、資源整合和合作。為了創建R1,DeepSeek重新設計了其訓練過程,以使用Nvidia H800的較低處理速度——這是H100的一半,前DeepSeek員工兼現任西北大學計算機科學博士生的Zihan Wang告訴《麻省理工科技評論》。

一位Nvidia研究人員對DeepSeek的成就表示熱情。DeepSeek報告成果的論文讓Nvidia高級研究科學家Jim Fan想起了早期一些開創性的AI程序,這些程序從零開始掌握了棋類遊戲,例如棋盤遊戲,而不是首先模仿人類大師。

DeepSeek的成功會減少Nvidia的增長率嗎?我不知道。然而,根據我的研究,企業明顯希望獲得能夠帶來回報的強大生成AI模型。

R1的較低成本和較短的表現時間應該會繼續吸引更多的商業關注。DeepSeek能夠提供企業所需的關鍵,正是它在優化不那麼強大的GPU方面的技術,這些GPU的成本低於最新技術。

如果更多的初創公司能夠複製DeepSeek的成就,那麼對Nvidia最昂貴晶片的需求可能會減少。

我不知道如果這種情況發生,Nvidia會如何應對。然而,短期內這可能意味著收入增長減少,因為遵循DeepSeek策略的初創公司正在使用更少、更便宜的晶片建立模型。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon