平價AI奇蹟：加州大學僅用$30複製DeepSeek核心技術！

zero comment

研究人員以僅30美元重建DeepSeek的核心技術

一組來自加州大學伯克利分校的研究人員表示，他們以僅30美元的成本重建了中國革命性AI DeepSeek的核心技術。這個極其便宜的DeepSeek複製品再次顯示出，雖然大型公司的模型令人印象深刻，但仍然存在更具成本效益的建造方式。

由博士候選人潘佳怡領導的團隊，使用僅有30億參數的小型語言模型，重建了DeepSeek R1-Zero的強化學習能力。儘管其規模相對較小，但該AI展示了自我驗證和搜索能力，這是使其能夠不斷優化自身反應的關鍵特徵。

為了測試他們的DeepSeek複製品，伯克利團隊使用了Countdown遊戲，這是一個基於英國遊戲節目的數字謎題，玩家必須用算術運算來達到目標數字。最初，模型僅產生隨機猜測，但通過強化學習，它發展出了自我修正和迭代解題的技術。

最終，它學會了修訂其答案，直到找到正確的解決方案。他們還嘗試了乘法運算，AI通過分配律將方程拆解，這與人類在心算大乘法問題時的方式相似。這顯示了該模型根據問題調整策略的能力。

成本效益驚人

值得一提的是，整個重建的成本僅為30美元，潘在Nitter上表示。這與領先AI公司在大規模訓練上所花費的金額相比，真是微不足道。研究人員測試了多種模型大小，從500萬參數的模型開始，這種模型僅能進行隨機猜測，無論準確性如何。

當擴展到15億參數時，DeepSeek的重建開始融入修訂技術。根據潘和其他研究人員的報告，3至7億參數之間的模型顯示出顯著的改進，以更少的步驟和更好的準確性解決問題。

作為對比，OpenAI目前通過其API收取每百萬個標記15美元的費用，而DeepSeek的費用僅為每百萬個標記0.55美元。伯克利團隊的發現表明，具有高能力的AI模型可以以目前領先AI公司所投入成本的一小部分開發。儘管這麼便宜，但有很多原因讓你應該避免使用DeepSeek。

DeepSeek的潛在風險

一個原因是一些專家對DeepSeek的聲稱的經濟性表示懷疑。AI研究員奈森·蘭伯特對DeepSeek所報導的6710億參數模型的500萬美元訓練成本是否真實反映了整個情況提出了擔憂。該AI還會將大量數據傳回中國，這無疑引發了擔憂，並已在美國導致對DeepSeek的禁令。

事實上，蘭伯特估計DeepSeek AI的年運營費用可能在5億到超過10億美元之間，涉及基礎設施、能源消耗和研究人員成本等各個方面。OpenAI也聲稱有證據表明DeepSeek是使用ChatGPT進行訓練的，這可能解釋了其部分降低成本的原因。

儘管如此，伯克利團隊的研究證明，尖端的強化學習可以在不需要OpenAI、Google和Microsoft等行業巨頭所分配的龐大預算的情況下實現。隨著一些AI實驗室每年在模型訓練上花費高達100億美元，這項研究突顯了在這一領域可能出現的顛覆性變化。

評論

這項研究無疑展現了AI技術的一個新方向，尤其是對於資金有限的團隊來說，這提供了一個低成本的替代方案。然而，這也引發了對於技術安全性和數據隱私的擔憂，這在當今的科技環境中尤為重要。未來的研究應該不僅專注於降低成本，更應重視如何在確保數據安全和隱私的情況下推進AI技術的發展。尤其在全球對數據安全越來越重視的背景下，這將是AI技術能否獲得廣泛應用的關鍵因素。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Download TXT

平價AI奇蹟：加州大學僅用$30複製DeepSeek核心技術！

🔥 CHATGPT PLUS 帳戶出租

chatgpt

平價AI奇蹟：加州大學僅用$30複製DeepSeek核心技術！

🔥 CHATGPT PLUS 帳戶出租

chatgpt

Related Articles

Grok辣味模式涉未成年裸照惹公憤

Anthropic Claude升級醫療AI 助醫療合規提升效率

AI編程新潮流：軟件工程師點睇Vibe-Coding?