DeepSeek AI 新模型：專家知識勝算，唔靠算力都得？

zero comment

🎬 YouTube Premium 家庭 Plan成員一位只需
HK$148/年！

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放

DeepSeek的新模型顯示AI專業知識可能比計算能力更重要

AI社群對DeepSeek R1的新模型感到興奮，並急於消化其意義。這款由中國AI初創公司DeepSeek開發的旗艦模型在關鍵推理基準上表現與OpenAI的o1系列相當，而他們的7B模型則在某些方面超越了較大的開源模型。

然而，除了對民主化和性能的即時興奮外，DeepSeek更暗示了一條深刻的新路徑：讓領域專家能夠利用有限資源創建強大的專業模型。這一突破對我們的行業有三個主要影響。首先，應用開發者獲得了強大的新開源模型來構建應用；其次，主要實驗室可能會利用這些效率創新進一步推動更大模型的發展。

但最令人感興趣的是，DeepSeek的做法表明，深厚的領域專業知識在構建下一代AI模型和智能應用時，或許比原始計算能力更為重要。

超越原始計算：智能訓練的崛起

DeepSeek R1之所以特別有趣，是因為它如何實現強大的推理能力。該團隊並未依賴昂貴的人類標註數據集或龐大的計算能力，而是專注於兩項關鍵創新：

首先，他們生成了可以自動驗證的訓練數據，專注於數學等正確性明確的領域。其次，他們開發了高效的獎勵函數，可以識別哪些新的訓練示例實際上會改善模型，避免在冗餘數據上浪費計算資源。

結果顯而易見：在AIME 2024數學基準中，DeepSeek R1-Zero達到71.0%的準確率，與o1-0912的74.4%相較相差不遠。他們的7B精簡模型甚至達到55.5%的準確率，超過了QwQ-32B-Preview的50.0%。即使是他們的1.5B參數模型，在AIME上也達到28.9%的驚人成績，在MATH上達到83.9%，顯示出專注訓練如何在特定領域以有限的計算資源取得強大成果。

對應用開發者的贈禮

DeepSeek工作的直接影響是明顯的：他們開源發布的六個較小模型（參數範圍從1.5B到70B）為應用開發者提供了強大的新選擇，讓他們能在強大的推理模型上構建應用。特別是他們的14B精簡模型，在關鍵基準上超越了較大的開源替代品，為專注於應用開發的開發者提供了吸引人的基礎。

加速領導者的發展

對於主要的AI實驗室來說，DeepSeek在訓練效率上的創新不會減緩對更大模型的競爭，反而會加速這一過程。這些技術將可能與龐大的計算資源相結合，進一步推動通用模型的邊界。頂端的計算競賽將繼續，只不過是以更好的燃料為基礎。

領域專家的新路徑

但最有趣的影響可能是對於擁有深厚領域專業知識的團隊。行業敘事大多建議初創企業應專注於在現有模型上構建應用，而不是創建自己的模型。DeepSeek則展示了另一種方式：應用深厚的領域專業知識，以較低的成本創建高度優化的專業模型。

值得注意的是，DeepSeek出自High-Flyer這家對沖基金，這裡的獎勵函數十分明確——即財務回報。可以合理地想像，他們已經在金融建模中應用這些技術，通過對市場數據的預測自動驗證來推動高效訓練。

這一模式可以擴展到任何有明確成功指標的領域。考慮到擁有深厚專業知識的團隊，例如：

– 代碼生成，利用應用性能、提交歷史和驗證/測試作為反饋
– 金融建模，使用市場數據進行驗證
– 醫療診斷，將臨床結果作為真實數據
– 法律分析，利用案件結果進行驗證
– 工業運營，利用實際性能數據創建反饋循環

借助DeepSeek的技術，這些團隊可以：

– 生成可以根據領域規則自動驗證的合成訓練數據
– 創建獎勵函數，有效識別高價值的訓練示例
– 將計算資源集中於對其領域最重要的特定能力
– 將專業模型與領域特定的應用垂直整合

這種方法的威力在於DeepSeek的精簡結果。他們的32B參數模型在AIME 2024上達到72.6%的準確率，在MATH-500上達到94.3%，顯著超越了之前的開源模型。這表明，專注訓練可以克服原始參數數量的限制。

模型開發的未來

展望未來，我們可能會看到模型開發分化為三個方向：

1. 應用開發者在越來越強大的開源基礎上構建
2. 主要實驗室利用效率技術推進通用模型
3. 領域專家用有限的計算預算創建高度優化的專業模型

這第三個方向——領域專家自己構建模型——是最引人注目的。這暗示著未來最有趣的AI發展可能不再取決於誰擁有最多的計算資源，而是誰能最有效地將領域專業知識與巧妙的訓練技術結合起來。

我們正進入一個智能訓練可能比原始計算更為重要的時代——至少對於那些明智地專注於正確問題的人而言。DeepSeek已經展示了一條前進的道路，其他人將會跟隨，但會在這些基本創新上加上自己的領域特定的變化。

這一切都表明，未來AI的發展將不僅僅依賴於技術的進步，還需要結合深厚的領域知識，這為許多初創公司和專業團隊提供了無限的可能性和挑戰。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

DeepSeek AI 新模型：專家知識勝算，唔靠算力都得？

🎬 YouTube Premium 家庭 Plan成員一位只需
HK$148/年！

chatgpt

✈️ Mastercard 尊享優惠｜預訂機票＋酒店減高達 HK$200！

DeepSeek AI 新模型：專家知識勝算，唔靠算力都得？

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年！

chatgpt

Related Articles

Google Gemini全新設計＋Pixel Watch 4修復大揭秘

Marvel新LOGO設計惹粉絲激烈爭議

中國倡共享AI未來 助發展中國家科技升級

✈️ Mastercard 尊享優惠｜預訂機票＋酒店減高達 HK$200！

🎬 YouTube Premium 家庭 Plan成員一位只需
HK$148/年！

中國倡共享AI未來助發展中國家科技升級