中國實驗室推出“推理”AI模型以與OpenAI的o1競爭
一個中國實驗室近日推出了一個被認為是首批“推理”AI模型之一,旨在與OpenAI的o1競爭。
週三,DeepSeek,一家由量化交易者資助的AI研究公司,發布了DeepSeek-R1的預覽,該公司聲稱這是一個與o1相當的推理模型。
與大多數模型不同,推理模型會通過花更多時間考慮問題或查詢來有效地自我事實檢查。這有助於它們避免一些通常會困擾其他模型的陷阱。
類似於o1,DeepSeek-R1在任務中進行推理,提前規劃,並執行一系列動作來幫助模型得出答案。這個過程可能需要一些時間。根據問題的複雜性,DeepSeek-R1可能會在回答之前“思考”幾十秒。
DeepSeek聲稱,DeepSeek-R1(準確來說是DeepSeek-R1-Lite-Preview)在兩個流行的AI基準測試AIME和MATH上表現與OpenAI的o1-preview模型相當。AIME使用其他AI模型來評估一個模型的表現,而MATH是一組文字問題。不過,這個模型並不完美。一些X平台的評論者指出,DeepSeek-R1在井字遊戲和其他邏輯問題上表現不佳(o1也存在類似問題)。
DeepSeek也很容易被“越獄”——即以某種方式提示它忽略安全措施。一位X用戶讓該模型給出了一個詳細的製毒配方。
而DeepSeek-R1似乎會阻止被認為過於敏感的政治問題。在我們的測試中,該模型拒絕回答有關中國領導人習近平、天安門廣場以及中國入侵台灣的地緣政治影響的問題。
這種行為可能是中國政府對當地AI項目施加壓力的結果。中國的模型必須經過中國互聯網監管機構的基準測試,以確保其回應“體現核心社會主義價值觀”。據報導,政府甚至提出了一個黑名單,列出不能用來訓練模型的來源,結果是許多中國AI系統拒絕對可能引起監管者不滿的主題作出回應。
對推理模型的關注度上升,正值“擴展法則”的可行性受到質疑之際。這些長期以來的理論認為,向模型投入更多數據和計算能力會持續提高其能力,但最近的報導顯示,包括OpenAI、Google和Anthropic等主要AI實驗室的模型並未如預期那樣顯著改善。
這導致了對新AI方法、架構和開發技術的急迫探索。其中一種是測試時計算,這是o1和DeepSeek-R1等模型的基礎。測試時計算,也稱為推理計算,基本上給模型額外的處理時間來完成任務。
“我們正在看到一種新的擴展法則的出現,”微軟首席執行官薩提亞·納德拉在本週微軟Ignite大會的主題演講中提到測試時計算。
DeepSeek表示,它計劃開源DeepSeek-R1並發布API,這是一個頗具好奇心的操作。它由一家名為High-Flyer Capital Management的中國量化對沖基金支持,該基金利用AI來指導其交易決策。
DeepSeek的第一個模型之一是名為DeepSeek-V2的通用文本和圖像分析模型,迫使字節跳動、百度和阿里巴巴等競爭對手降低某些模型的使用價格,並使其他模型完全免費。
High-Flyer為模型訓練建立自己的伺服器集群,最近的集群報導中擁有10,000個Nvidia A100 GPU,成本約為10億日元(約合1.38億美元)。該基金由計算機科學畢業生梁文峰創立,旨在通過DeepSeek組織實現“超智能”AI。
這篇文章引出了關於AI技術發展的重要問題,特別是推理模型的興起是否能真正帶來質的飛躍。隨著AI技術的迅速進步,我們不禁要思考,這些新模型是否能夠在保持創新與遵循社會道德之間找到平衡。特別是在中國,政府對AI技術的監管和控制可能會影響這些技術的發展方向和應用範圍。這也提醒我們,技術的進步不僅僅是數據和計算能力的比拼,還涉及到倫理和社會責任的深層考量。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。