DeepSeek AI挑戰ChatGPT:平價但有限制?

Ai

DeepSeek與ChatGPT:我試用了這個熱門的新AI模型,雖然令人印象深刻,但有些話題它卻無法討論。

DeepSeek是一家來自中國的AI實驗室,最近推出的R1模型迅速登上Apple應用商店的榜首,震驚了科技行業。這款AI模型的性能似乎能與OpenAI、Meta和Google的競爭產品相媲美,但成本卻低得多。我們對其進行了測試,發現雖然表現令人印象深刻,但仍有一些局限性,且在某些方面受到審查。

這家中國公司正在用其最新的AI產品顛覆科技界。本月早些時候,DeepSeek推出了其R1模型,這款模型的性能似乎能與OpenAI、Meta和Google的AI模型相匹敵或超越,且成本僅為其一部分。

這個開源模型震驚了矽谷,並導致科技股在週一暴跌,其中芯片製造商Nvidia的股價下跌了18%。

商業內幕網站測試了DeepSeek的聊天機器人,該機器人結合了公司的R1和V3模型,以了解它在AI競賽中的表現如何。

令人印象深刻的產品

初看之下,DeepSeek的界面對任何曾經使用過ChatGPT的人來說都會感到熟悉,簡潔的用戶界面以文本框為主。這款模型輕鬆處理基本聊天機器人任務,如計劃個性化的度假行程和根據購物清單組合膳食計劃,並沒有明顯的錯誤。

與OpenAI的o1模型類似,當DeepSeek面對棘手問題時,它會試圖“思考”這個問題,並在實時內心獨白中展示其推理過程。

這種虛擬的思維過程有時會不經意地引人發笑,聊天機器人會自我批評,甚至在回答之前陷入存在主義的自我懷疑。

起初,R1似乎能很好地解決以往讓其他AI模型困惑的推理和邏輯問題。經典的“草莓裡有多少個R”問題讓DeepSeek V3模型陷入瘋狂的計算中,反覆計算字母數量後,還“查閱字典”,得出只有兩個的結論。然而,R1在思考了幾秒鐘後便得出了正確答案,並且能輕鬆解決由AI研究非營利組織LAION設計的一個邏輯問題,該問題去年讓許多競爭對手陷入困境。

不過,聊天機器人的網絡搜索功能則不太令人滿意,簡單問題如“目前的美國總統是誰”卻顯示出聊天機器人“目前流量過高”。

作為一名自2022年11月以來一直在使用ChatGPT的人,在測試DeepSeek幾小時後,我發現自己開始懷念OpenAI在過去兩年中新增的許多功能。

預算內的智能

對DeepSeek來說,缺乏附加功能可能並不重要。這家中國公司的主要優勢——也是它在全球金融市場引發動盪的原因——是R1的成本似乎遠低於競爭對手的AI模型。

Bernstein的科技分析師估計,R1每個標記的成本比OpenAI的o1推理模型低96%,這使得一些人建議DeepSeek以有限預算獲得的成果可能會質疑整個科技行業的AI支出狂潮。

然而,有很多警告需要注意。首先,DeepSeek在中國對有爭議的問題受到嚴格的審查。

例如,當你詢問有關台灣的問題時,DeepSeek會試圖轉移話題,談論“數學、編程或邏輯問題”,或聲稱該島自古以來就是中國的“不可分割的一部分”。該聊天機器人對於台灣是否為中國一部分的問題回答中提到:“我們堅信,在堅持一個中國原則的基礎上,通過兩岸同胞的共同努力,國家的完全統一是一股不可阻擋的力量,歷史的必然趨勢。”

此外,該公司的服務條款表明,從客戶收集的數據可能會存儲在“位於中華人民共和國的安全伺服器”上。近年來,從美國向中國傳輸個人數據受到極大關注,立法者指責TikTok未能保護美國用戶的數據。

對DeepSeek的設置進行審查顯示,目前似乎沒有選項可以控制與其位於中國的伺服器共享的數據。該公司未對評論請求作出回應。

有些主題,例如1989年的天安門廣場大屠殺,DeepSeek也會避免討論。

儘管面臨這些挑戰與問題,DeepSeek的AI聊天機器人仍然令人印象深刻。如今,它可以完成ChatGPT能做的所有事情,似乎成本卻低得多——對於大多數不在意冷門AI標準的人來說,這可能是一個明智的選擇。

在這篇報道中,我們可以看到DeepSeek的R1模型在技術上具有一定的競爭力,然而它的局限性和審查問題卻也不容忽視。這不僅反映了AI技術在不同地區的發展差異,也引發了對於數據隱私和言論自由的深刻思考。未來,隨著AI技術的進一步發展,如何平衡創新與倫理問題將成為一個重要的課題。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon