中國AI DeepSeek爆紅!免費勁過ChatGPT,震驚業界

Ai

The Pulse #122: DeepSeek震撼科技行業

一個幾乎不為人知的中國實驗室釋放了一個開放、免費的人工智能模型,性能與ChatGPT最好的模型相當。更重要的是,它的運行成本也更低。這一消息在人工智能行業引起了震動。

1. 第一個感覺快速的「思考模型」 – 受歡迎的原因

本週,一個重大的事件震撼了科技行業:一個鮮為人知的中國人工智能實驗室推出了DeepSeek人工智能模型,這一模型的性能與OpenAI公開的最強大模型ChatGPT o1相當。儘管OpenAI擁有更先進的o3模型,但目前仍在預覽階段,尚未公開。DeepSeek則作為開放且免費的產品發布,任何人都可以在DeepSeek應用中使用或下載。

主要的人工智能公司不得不接受這個事實:一個聲稱資金有限且無法獲得NVIDIA最新AI芯片的小團隊,竟然能達成這樣的成就。這打破了OpenAI無敵的形象,顛覆了美國在人工智能競賽中的領導地位,也引發了關於開放模型是否會將先進的LLM變成商品的討論。

今日,我們將探討:

– 第一個感覺快速的「思考模型」 – 受歡迎的原因
– 效率是ChatGPT的10-40倍
– 開放模型迅速擴散
– DeepSeek突顯了OpenAI必須保持完全封閉的需求
– DeepSeek是如何做到的,為何要免費提供?
– 地緣政治與出口管制
– 谷歌擔心開源AI會勝出

2. 效率是ChatGPT的10-40倍

DeepSeek團隊找到數十種方法來提高模型的效率,並在一篇名為《DeepSeek-V3技術報告》的論文中發布了這些優化措施。這些新穎的優化方法使得DeepSeek的運行效率大幅提升。

DeepSeek的突然受歡迎是由於該公司更新了應用程序,使其啟用了“DeepThink (R1)”模式,這一模式使用了他們的DeepSeek-R1模型。這一模型在響應時需要更多的“思考時間”,通過更多的計算來提供更好的回應。

與OpenAI的o1模型相比,DeepSeek的一個重要區別在於,它展示了模型的“思考鏈”,而OpenAI則隱藏了“思考”階段的過程。因此,DeepSeek的反應顯得更加“靈敏”,也更具透明度和可親切感。實際上,觀看DeepSeek“思考”的過程比觀看ChatGPT的轉圈等候要來得更加愉悅。

當用戶提問“如果一隻雞說‘所有的雞都是說謊者’,那麼這隻雞是在說真話嗎?”時,DeepSeek會思考將近一分鐘,並生成大量的內部獨白來解釋過程。最終,它得出的結論是這是一個悖論。這一過程的輸出與OpenAI的o1相似,但o1需要相同的時間(38秒)來“思考”,卻不會向用戶展示任何內容。

DeepSeek的受歡迎還因為它是免費的,而OpenAI的收費則在每月20至200美元之間,提供的功能卻幾乎相同。DeepSeek在運行成本上似乎比OpenAI低了好幾個量級,這使得它能夠應對看似巨大的負載。

這一事件不僅展示了技術創新的潛力,還引發了對於未來人工智能市場的深思。隨著開放模型的興起,是否會出現一種新的市場格局,讓更多的創新者和小型團隊有機會參與其中?這不僅是對大型科技公司的挑戰,更是對整個行業生態的一次重新洗牌。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon