谷歌宣佈以Gemini 2.0推動“新代理時代”AI代理
谷歌的AI研究實驗室DeepMind表示,其新推出的人工智能模型Gemini 2.0將成為構建更先進AI代理的基石。
根據DeepMind的首席執行官Demis Hassabis和首席技術官Koray Kavukcuoglu在12月11日的部落格文章中,基於Gemini 2.0的AI代理能夠理解複雜指令、進行計劃、推理、在網站上採取行動,甚至能協助視頻遊戲策略的制定。
Hassabis和Kavukcuoglu表示:“AI代理的實際應用是一個充滿激動人心可能性的研究領域。我們正在探索這個新前沿,並開發一系列原型,幫助人們完成任務和達成目標。”
他們指出,有幾個基於Gemini的實驗性AI助手項目,各自有不同的功能。
其中一個名為Deep Research的項目,可以幫助用戶探索複雜主題,通過搜索網絡創建多步研究計劃,然後生成詳細的報告。
另一個名為Project Astra的項目,則是一個通用AI助手,旨在處理日常任務,比如根據用戶提供的提示提供建議和資訊,例如如何洗衣服或某個地標的更多信息。
Project Mariner專注於創建一個能夠控制Chrome瀏覽器的AI代理,能夠移動光標、點擊按鈕、填寫表單和導航網站。
Hassabis和Kavukcuoglu表示,這些項目“仍處於開發的早期階段”,但他們希望在進行測試和進一步開發後,能在未來的產品中“廣泛應用”。
他們提到:“雖然目前仍然很早,但Project Mariner展示了在瀏覽器內導航的技術可能性,儘管現在的準確性和完成任務的速度還不理想,但隨著時間的推移會迅速改善。”
同時,Project Jules正被開發為一個為開發者提供幫助的助手,可以直接整合進GitHub工作流程,協助編碼和計劃等任務。
Hassabis和Kavukcuoglu還提到,他們使用Gemini 2.0為視頻遊戲構建了代理,能夠即時與玩家進行對話,提供建議,並在網上搜尋“豐富的遊戲知識”。
他們表示:“我們正在與像Supercell這樣的頂尖遊戲開發商合作,探索這些代理的運作,測試它們在各種遊戲中解釋規則和挑戰的能力,從策略遊戲到農場模擬器不等。”
在11月,美國雲計算軟件公司Salesforce的首席執行官Marc Benioff表示,AI的未來在於自主代理,而不是大型語言模型(LLMs)。“我認為我們目前正處於大型語言模型的上限,”他在《華爾街日報》的“未來一切”播客中提到。
Nvidia也在專注於這一趨勢。“我們看到AI原生公司的數量持續增長。當然,我們開始看到企業對代理AI的採用成為最新的潮流,”Nvidia首席執行官Jensen Huang在11月的第三季度財報電話會議中表示。
此外,Hassabis和Kavukcuoglu表示,團隊正在“實驗能夠在物理世界中提供幫助的代理”,通過機器人技術。谷歌的AI代理目前僅向測試者和開發者發布。
—
在這篇文章中,谷歌的Gemini 2.0不僅是技術上的進步,更是AI應用的一次重要飛躍。從幫助用戶進行深入研究到日常生活的助手,這些AI代理的多樣化用途顯示了未來科技將如何融入我們的日常生活。而這些技術的發展,無疑會引發對於AI倫理和自主性的討論。這些AI代理的準確性和效率仍需改進,但隨著技術的進步,未來的應用場景將更加廣泛。此時,業界需要關注如何平衡技術進步與道德責任,確保技術的發展不會對人類社會造成負面影響。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。