谷歌新計劃「Mariner」挑戰AI市場!

Ai

谷歌推出早期研究原型Project Mariner

谷歌近日宣布了一個早期研究原型,名為Project Mariner,旨在理解和推理用戶在網頁瀏覽器中訪問的信息。這項功能是基於谷歌最新的Gemini 2.0技術構建的。

谷歌表示,這個智能助手能夠通過谷歌Chrome擴展程序查看屏幕上的信息,以完成相關任務。它能夠讀取各種信息,如文本、代碼、圖片、表單,甚至是基於語音的指令。

這個智能助手還能代表用戶瀏覽和與網站互動,並自動化某些任務。

在一段演示視頻中,谷歌展示了Project Mariner的能力。該助手被要求從谷歌藝術與文化網站上找到“最著名的後印象派”畫作,並將其與一個無關的任務結合,後者涉及將“多彩的顏料”添加到Etsy購物車中。

Project Mariner隨後將指令傳遞給Gemini,尋找藝術家和畫作,獲取詳情,然後自動將用戶重定向到谷歌藝術與文化網站。隨後,它在該網站上查找畫作。接下來,它導航至Etsy並將一套水彩顏料添加到購物車中。

在整個過程中,Project Mariner理解了指令,並將其進一步分解為逐步可操作的任務。該工具在活動標籤中執行操作,而不是通過任何背景活動。

目前,Project Mariner可通過“受信測試者候補名單”獲得。隨著這一公告,谷歌還正式推出了Gemini 2.0系列模型,首個版本為Gemini 2.0 Flash。

此外,谷歌還宣布了Project Astra的更新,如更好的對話和記憶能力,以及使用外部工具的能力。與Project Mariner一起,谷歌也推出了一個名為Jules的AI代碼助手,可以直接集成到GitHub工作流中。

值得注意的是,谷歌的這一智能助手剛好是在微軟宣布Copilot Vision作為實驗性功能後不久推出的。

Copilot Vision可以讀取和分析網頁,並向用戶提供相關的摘要和信息。不過,與Project Mariner不同的是,Copilot Vision無法代表用戶行動。

因此,谷歌真正的競爭對手是Anthropic的Computer Use,該工具不僅能執行自主操作,還不受瀏覽器環境的限制。許多開發者已經在實驗Computer Use,最近Hume AI探索了一種能力,讓用戶僅通過語音控制桌面。

非常令人期待的是,OpenAI傳聞中的“Project Operator”會是什麼樣子。幾天前,OpenAI在巴黎的GenerationAI大會上展示了一個基於GPT-4o的智能助手,協助處理客戶問題。

有可能OpenAI會在正在進行的12 Days of OpenAI活動中正式宣布類似的功能。

從這篇文章中,我們可以看到谷歌在AI助手領域的積極探索,特別是Project Mariner的推出,顯示出它對於提升用戶體驗和自動化任務的重視。這不僅是技術上的進步,也反映了市場競爭的激烈程度。隨著AI技術的快速發展,各大科技公司都在努力創造更智能的助手,以滿足用戶日益增長的需求。

然而,谷歌的成功不僅依賴於技術的創新,還需要考慮到用戶的隱私和數據安全問題。隨著這些智能助手越來越深入我們的生活,如何平衡技術的便利性與用戶的隱私權益,將成為未來的重要議題。對於用戶來說,選擇一個既能提供高效服務又能保護個人信息的智能助手,將是一個不容忽視的考量因素。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Chat Icon