OpenAI o3 vs Google Gemini 2.0:邊個更接近真正人工智能?

Ai

OpenAI o3 與 Google Gemini 2.0:哪個模型更接近人工通用智能?

2025 年將成為人工智能創新的關鍵時刻,這是由科技巨頭們在建設人工通用智能(A.G.I.)的競賽所推動的,這種智能能達到人類的智力水平。最近,OpenAI 和 Google 分別推出了他們的新人工智能模型:o3 和 Gemini 2.0。OpenAI 的 o3 於 12 月 20 日宣布,是一個推理模型,首席執行官 Sam Altman 宣稱,該模型一旦通過安全測試,可能會實現 A.G.I.,而 Google 首席執行官 Sundar Pichai 則將 Gemini 2.0 稱為公司“迄今為止最具思考性的模型”。這兩個模型都展現了顯著的 A.G.I. 能力,但它們的方式有所不同。OpenAI 的新模型專注於認知能力,而 Google 則將 Gemini 2.0 定位為一個“高度集成的代理人工智能工具”,旨在提高效率和實時解決問題的能力。

OpenAI 的 o3 專注於高層次的推理,使用“私有思維鏈”來解決問題。這種方法使它在物理學、數學和科學推理方面表現出色。它在 ARC-AGI 測試中取得了令人印象深刻的結果——這是一個用於評估人工智能模型在其訓練數據之外學習新技能的基準。o3 模型在高計算設置和低計算設置下的得分分別為 87.5% 和 75.7%,其表現是前身 o1 的三倍。(據報導,OpenAI 避免將該模型命名為“o2”,因為與英國電信公司 O2 的商標衝突。)

不過,這一突破是昂貴的。目前,OpenAI 在低計算模式下每個任務的成本為 20 美元,而高計算模式則需數千美元。“這些能力是新領域,需要認真的科學關注,”ARC-AGI 基準的共同創建者 François Chollet 表示。值得關注的是,OpenAI 如何為 o3 的訂閱定價,尤其是因為 Altman 表示,由於高使用成本,該公司在 OpenAI Pro 訂閱上虧損。

Gemini 2.0 的強項在於多模態能力,如處理音頻的能力。其“思考模式”是突出的特點,能增強推理並提供逐步解釋。Gemini 2.0 還支持創建組合輸出——如一篇結合文本、人工智能生成的視覺效果和多語言文本轉語音音頻的博客文章,只需一個提示。用戶還可以微調音頻的語調和風格。

專家對這些進展是否標誌著 A.G.I. 的真正進步仍存在分歧。“我們確實在 A.G.I. 方面取得了進展,但我認為仍然相距甚遠,有些熱度是市場營銷的炒作,”麻省理工學院集體智慧中心主任 Thomas Malone 告訴《Observer》。他指出,基準測試是一種創新的方式來衡量人工智能能力,但它們並未捕捉到所有形式的人類智能。

Chollet 表示擔憂,認為 OpenAI 的 o3 可能尚未具備 A.G.I. 所需的“通用”智能。“我不認為 o3 還不是 A.G.I.,”他在一篇博客文章中寫道。他指出,未來的 ARC-AGI-2 基準測試可能對 o3 仍然是一個重大挑戰,可能會降低其在高計算條件下的表現。

“人工智能在朝著 A.G.I. 進步的過程中面臨的一個主要技術障礙是長期記憶,這使得模型能夠保留每個行動的完整上下文。延遲和成本也是挑戰,但這些問題可能會迅速改善——這僅僅是第一代產品,”Exa 的首席執行官 Will Bryk 告訴《Observer》,該公司正在為人工智能聊天機器人建立網絡搜索基礎設施。“A.G.I. 的最佳定義是當它能自動化知識經濟中的大部分時。我們尚未達到,但正在逐步接近 A.G.I.”

在這個瞬息萬變的科技世界中,OpenAI 和 Google 的最新模型各具特色,展現了不同的發展方向和潛力。雖然這些技術進步令人興奮,但我們也應保持謹慎,因為真正的 A.G.I. 還需要跨越多個技術障礙。未來的發展不僅依賴於技術的突破,更需要對人類智能的深刻理解和認知。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon