平價AI奇蹟:加州大學僅用$30複製DeepSeek核心技術!

Ai

研究人員以僅30美元重建DeepSeek的核心技術

一組來自加州大學伯克利分校的研究人員表示,他們以僅30美元的成本重建了中國革命性AI DeepSeek的核心技術。這個極其便宜的DeepSeek複製品再次顯示出,雖然大型公司的模型令人印象深刻,但仍然存在更具成本效益的建造方式。

由博士候選人潘佳怡領導的團隊,使用僅有30億參數的小型語言模型,重建了DeepSeek R1-Zero的強化學習能力。儘管其規模相對較小,但該AI展示了自我驗證和搜索能力,這是使其能夠不斷優化自身反應的關鍵特徵。

為了測試他們的DeepSeek複製品,伯克利團隊使用了Countdown遊戲,這是一個基於英國遊戲節目的數字謎題,玩家必須用算術運算來達到目標數字。最初,模型僅產生隨機猜測,但通過強化學習,它發展出了自我修正和迭代解題的技術。

最終,它學會了修訂其答案,直到找到正確的解決方案。他們還嘗試了乘法運算,AI通過分配律將方程拆解,這與人類在心算大乘法問題時的方式相似。這顯示了該模型根據問題調整策略的能力。

成本效益驚人

值得一提的是,整個重建的成本僅為30美元,潘在Nitter上表示。這與領先AI公司在大規模訓練上所花費的金額相比,真是微不足道。研究人員測試了多種模型大小,從500萬參數的模型開始,這種模型僅能進行隨機猜測,無論準確性如何。

當擴展到15億參數時,DeepSeek的重建開始融入修訂技術。根據潘和其他研究人員的報告,3至7億參數之間的模型顯示出顯著的改進,以更少的步驟和更好的準確性解決問題。

作為對比,OpenAI目前通過其API收取每百萬個標記15美元的費用,而DeepSeek的費用僅為每百萬個標記0.55美元。伯克利團隊的發現表明,具有高能力的AI模型可以以目前領先AI公司所投入成本的一小部分開發。儘管這麼便宜,但有很多原因讓你應該避免使用DeepSeek。

DeepSeek的潛在風險

一個原因是一些專家對DeepSeek的聲稱的經濟性表示懷疑。AI研究員奈森·蘭伯特對DeepSeek所報導的6710億參數模型的500萬美元訓練成本是否真實反映了整個情況提出了擔憂。該AI還會將大量數據傳回中國,這無疑引發了擔憂,並已在美國導致對DeepSeek的禁令。

事實上,蘭伯特估計DeepSeek AI的年運營費用可能在5億到超過10億美元之間,涉及基礎設施、能源消耗和研究人員成本等各個方面。OpenAI也聲稱有證據表明DeepSeek是使用ChatGPT進行訓練的,這可能解釋了其部分降低成本的原因。

儘管如此,伯克利團隊的研究證明,尖端的強化學習可以在不需要OpenAI、Google和Microsoft等行業巨頭所分配的龐大預算的情況下實現。隨著一些AI實驗室每年在模型訓練上花費高達100億美元,這項研究突顯了在這一領域可能出現的顛覆性變化。

評論

這項研究無疑展現了AI技術的一個新方向,尤其是對於資金有限的團隊來說,這提供了一個低成本的替代方案。然而,這也引發了對於技術安全性和數據隱私的擔憂,這在當今的科技環境中尤為重要。未來的研究應該不僅專注於降低成本,更應重視如何在確保數據安全和隱私的情況下推進AI技術的發展。尤其在全球對數據安全越來越重視的背景下,這將是AI技術能否獲得廣泛應用的關鍵因素。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon