《Google Gemini 2:挑戰OpenAI的新篇章》

Ai

谷歌Gemini 2可能會取代OpenAI的o1

隨著谷歌Gemini 2的即將推出,市場的關注度不斷上升。根據最近在X上的洩漏消息,谷歌正在準備推出一個新模型:Gemini-2.0-Pro-Exp-0111。

谷歌的高級產品經理Logan Kilpatrick在X上發文表示:“AI還不錯吧”,似乎是在暗示OpenAI的首席執行官Sam Altman。

這個新模型預計會出現在“高級”版塊中,但目前尚不清楚它是針對內部測試小組還是公開推出。用戶在測試該模型時獲得了一些回應,據他們所述,該模型似乎運行速度很快,但仍不確定這些回應是否真的來自2.0版本。

AIM之前曾探討過「為何谷歌會製作比OpenAI的o1更好的模型」,而現在這一預測似乎正在成為現實。

一位用戶在X上發文說:“一個未知的Gemini模型正在LMSYS Arena(對抗賽)中可用。儘管不清楚這是否是Gemini 2.0,但這個‘Gemini-test’在我的OpenAI o1-mini測試中表現更好。”

同時,AI內部人士Jimmy Apples分享了一個關於Gemini 2的消息,稱:“有人可能喝醉了,說Gemini 2.0已經部署給選定的B2B客戶……”

與Gemini 1.5類似,Gemini 2將繼續生成圖像和執行網絡搜索,這些功能可能是為了幫助谷歌與OpenAI的Search GPT和Perplexity AI競爭。Meta也預計將加入這場搜索競賽。

有趣的是,谷歌AI Studio和Gemini API最近推出了“與谷歌搜索的基礎對接”功能,允許開發者通過整合來自谷歌搜索的實時數據來提高回應的準確性。隨著這一更新,Gemini 1.5模型可以從谷歌搜索中獲取實時信息,從而提高準確性和透明度。

開發者可以通過谷歌AI Studio中的“工具”部分直接訪問基礎對接功能,或在Gemini API中啟用‘google_search_retrieval’工具。Gemini 2及其API也很可能具備這一功能。

一位參加Kilpatrick在舊金山會議的用戶透露,Gemini 2將是一個更大的模型,具備多輪對話能力、視覺、音頻、嵌入等功能。

受Anthropic啟發

谷歌計劃推出一項新功能,可以控制用戶的網絡瀏覽器,以執行收集研究、購買產品或預訂航班等任務。這一功能也將整合到Gemini 2中。

根據一份報告,代號為“Jarvis”的產品最近被洩漏,並曾在谷歌的Chrome瀏覽器擴展商店中短暫上線,並自我描述為“與你一起瀏覽網絡的有用夥伴”。

這與Anthropic的“計算機使用”功能相似,後者可以控制用戶的屏幕,執行如查看屏幕、移動光標、點擊按鈕和輸入文本等動作。

同樣,微軟也在測試Copilot Vision,這一功能使其AI能夠理解和互動網頁內容。通過Copilot Vision,AI可以解釋用戶在Microsoft Edge上查看的內容,回答有關該內容的問題,並根據顯示的內容建議後續步驟。

谷歌搶佔OpenAI的焦點

谷歌最近在其最新產品上取得了成功,以NotebookLM為例,該產品受到廣泛讚譽,甚至被稱為谷歌的“ChatGPT時刻”。此外,在最近的財報電話會議中,谷歌首席執行官Sundar Pichai透露,谷歌Gemini API的調用量在過去六個月中增加了14倍。

GitHub最近與谷歌合作,將Gemini 1.5 Pro引入GitHub Copilot。Gemini 1.5以其200萬令牌的上下文窗口和同時處理代碼、圖像、視頻和文本的能力而聞名。

Gemini的推理能力預計會比OpenAI的o1更強。最近的一份報告顯示,谷歌正在開發具有類似人類推理能力的AI,這很可能是為了其Gemini平台。

Kilpatrick在接受AIM獨家訪問時表示,谷歌計劃推出Gemini 2,這將具備更好的推理質量和更長的上下文窗口,潛在地可達到數十億或數萬億個令牌。根據Kilpatrick的說法,該模型將全面多模態,能夠理解大型視頻。

最近,Apples在X上分享了一份去年日期的文件,顯示谷歌計劃在LLM中整合“規劃”部分。此外,在一篇舊的Wired文章中,谷歌的Demis Hassabis也表示,他的團隊將結合AlphaGo使用的技術,為系統提供新的能力,例如規劃和解決新問題。

值得注意的是,谷歌最近發表了一篇名為《通過強化學習訓練語言模型自我修正》的論文。谷歌DeepMind已開發出一種多輪在線強化學習方法,以提高LLM自我修正的能力。

隨著谷歌DeepMind的RL技術進一步改進,並與Gemini中的思維鏈結合,谷歌可能輕鬆創建出超越OpenAI的o1的模型。

Kilpatrick告訴AIM,谷歌Gemini和谷歌DeepMind密切合作,谷歌DeepMind專注於使AI對開發者和公眾更可及。谷歌DeepMind最近的模型AlphaProof和AlphaGeometry 2在國際數學奧林匹克(IMO)中獲得了銀獎,而OpenAI的o1-preview在類似測試中僅獲得了83%的分數。

同時,OpenAI也在準備推出o1。根據最近的一個Reddit主題,Altman似乎對AGI的即將到來更加自信,這可能是因為他們最新的模型o1。

他甚至表示,他們已經達到了人類水平的推理,並將開始朝著AGI路線圖的第三階段邁進。許多人現在認為,OpenAI的o1可能被視為系統2 LLM的首次成功商業推出。

隨著競爭的加劇,谷歌似乎終於準備好從OpenAI手中搶走焦點。正如一位X用戶所言:“我們終於將看到Gemini 2.0 Pro的到來,早該如此。但他們可能會等到o1的全面發布再搶風頭,就像OpenAI每次都對谷歌所做的那樣。”

在這場AI競賽中,谷歌的策略和技術進步將如何影響市場格局,值得我們持續關注。谷歌的Gemini 2不僅可能對OpenAI造成挑戰,也可能重新定義整個AI生態系統的競爭態勢。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *