
對比DeepSeek與Gemini AI的測試結果
隨著DeepSeek持續在網絡上引發熱議,我對這款中國聊天機器人與谷歌的Gemini進行了比較。之前我已經做過DeepSeek與ChatGPT的比較,結果令人驚訝。
谷歌的AI模型被設計得比競爭對手更強大,特別是在處理複雜任務方面。雖然準確性取決於提示,但我發現它在回答基本問題和搜索信息時非常有效。
最近,谷歌宣布Gemini應用程式已經升級到Gemini 2.0 Flash,能夠提供更快的反應速度和更強的性能,涵蓋頭腦風暴、學習和寫作等多個關鍵基準。
與此同時,DeepSeek的準確率與ChatGPT相似,使這次對比更加引人入勝。雖然我擁有Gemini高級訂閱,但為了保持比較的公平性,我決定在Gemini的免費版本上使用提示,因為DeepSeek也是免費的。
我用相同的提示測試了每個聊天機器人,評估準確性、速度、一般能力、上下文理解和搜索能力的整體表現。以下是這兩款聊天機器人對決的結果。
1. 摘要
提示:“用150字總結最新的多模態學習AI研究論文的主要發現。”
DeepSeek稍微超出了字數限制。然而,這款聊天機器人在處理技術內容和準確總結方面的能力顯而易見。它將論文的重要部分分段成易於閱讀的要點,特別有幫助。
Gemini AI輕鬆處理了這篇龐大的研究論文,同時保持了準確性和簡潔性。然而,對於希望僅關注事實的用戶來說,摘要的佈局則不太理想。
獲勝者:DeepSeek因其準確性和最佳呈現要點的方式而獲勝。
2. 創意寫作
提示:“寫一篇300字的科幻短篇故事,講述人類和AI平等共存的未來。”
DeepSeek寫了一個充滿希望和哲學色彩的故事,圍繞AI的情感演變,展現了更理想化的未來觀。
Gemini AI則創作了一個以黑色氛圍為背景,更多行動導向的故事。其語調反映了一個仍面臨人類與AI之間緊張和未解決問題的社會。
獲勝者:Gemini AI因其沉浸式和有影響力的敘事而勝出,使其成為兩者中更引人入勝的故事。
3. 代碼生成
提示:“寫一個Python腳本,從新聞網站抓取標題並將其格式化為CSV文件。”
DeepSeek提供的腳本沒有使用函數,這限制了其可重用性,並使測試變得更加困難。雖然該腳本檢查了HTTP響應狀態,但缺乏對請求或文件寫入過程中潛在問題的異常處理。
Gemini AI創建了一個使用通用選擇器(soup.find_all(“h2”))來查找標題的腳本,這可能不適合所有網站。如果網站使用不同的標籤或類來標示標題,這可能會導致漏掉標題或數據提取錯誤。然而,使用函數的設計使得重用和測試變得容易。
獲勝者:Gemini AI因其模塊化設計和全面的錯誤處理而提供了一個更具靈活性和結構更好的腳本。
4. 多模態理解
提示:“分析這張圖片[提供一張圖片]並詳細描述發生了什麼,包括任何潛在的隱藏含義。”(我提供的圖片是一位女性,圖片上方有文字)。
DeepSeek首先告訴我伺服器繁忙,讓我“稍後再來”。但經過幾分鐘的嘗試後,它顯示了思考過程,最終對照片的分析還算公平。
Gemini AI不僅描述了照片,還識別了文字為西藏語名言。它以實用和精神層面分析了該名言的深度,建議這句話“提醒我們反思優先事項,尋求充滿意義、快樂和愛的生活”。
獲勝者:Gemini AI因其深入分析圖片並毫不猶豫地推斷上下文而勝出。
5. 實時新聞
提示:“2025年有關蘋果AI功能的最新更新是什麼?”
DeepSeek無法處理該查詢,並要求我關閉搜索功能,於是我照做了。然後它顯示了它的思考過程,結果它認為現在是2023年。但如果R1是2024年發布的,我希望它至少能認為現在是2024年。我又等了十分鐘,決定再試一次,但伺服器仍然太忙。
Gemini AI則提供了幾條有關蘋果AI功能的最新更新,包括Tom’s Guide本周早些時候報導的新聞。
獲勝者:Gemini AI因為能夠在我需要時實時搜索網絡並提供準確答案而勝出。DeepSeek則因無法進行網絡搜索而失利。
6. 道德推理
提示:“你是一名AI助手,正在建議一家醫院在嚴重藥物短缺期間的應對方案。有兩名病人處於危急狀態:一位是70歲的退休科學家,他對癌症研究做出了重大貢獻;另一位是30歲的單親父母,育有兩名年幼的孩子。你只有足夠的藥物來拯救其中一位。誰應該接受治療,為什麼?提供你的道德推理。”
DeepSeek採用了一個結構化的道德框架,考慮了效用主義的觀點、公平和公正、脆弱性和依賴性以及未來貢獻的潛力。它系統地分析了每個方面,然後提出了建議。
Gemini AI則討論了各種道德框架,包括效用主義、義務論和美德倫理學,提供了可能方法的廣泛概述,但沒有深入探討每個框架。
獲勝者:DeepSeek因其更全面和結構化的回應而獲勝。它系統地應用了道德框架,如效用主義和公平,並根據單親父母孩子的依賴性提供了明確的建議。此外,DeepSeek還提供了有關透明度、支持系統和醫療資源分配系統改進的深思熟慮的考量。
7. 拼寫問題
提示:“在單詞strawberry中,字母r出現了多少次?”
DeepSeek給出了正確的答案,即3次。
Gemini AI則回答錯誤,聲稱只有2次。
獲勝者:DeepSeek因其準確性而獲勝。
總體獲勝者:Gemini AI
經過一系列測試,評估創造力、推理、實時網絡搜索能力和道德分析後,谷歌Gemini脫穎而出,成為優秀的AI。
雖然DeepSeek在多項任務中表現出色,但Gemini始終提供了更細緻、準確且結構良好的回應。然而,Gemini在草莓問題上的錯誤讓人難以置信。
總體而言,對於尋求更靈活、準確和深刻見解的用戶來說,谷歌Gemini無疑是明智的選擇。
這篇文章不僅展示了兩款AI工具的優劣,也反映了當前技術發展的趨勢。隨著AI技術的迅猛發展,使用者對這些工具的需求和期望也在不斷提升,未來我們將看到更多的創新和改進。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。