谷歌新計劃「Mariner」挑戰AI市場！

zero comment

谷歌推出早期研究原型Project Mariner

谷歌近日宣布了一個早期研究原型，名為Project Mariner，旨在理解和推理用戶在網頁瀏覽器中訪問的信息。這項功能是基於谷歌最新的Gemini 2.0技術構建的。

谷歌表示，這個智能助手能夠通過谷歌Chrome擴展程序查看屏幕上的信息，以完成相關任務。它能夠讀取各種信息，如文本、代碼、圖片、表單，甚至是基於語音的指令。

這個智能助手還能代表用戶瀏覽和與網站互動，並自動化某些任務。

在一段演示視頻中，谷歌展示了Project Mariner的能力。該助手被要求從谷歌藝術與文化網站上找到“最著名的後印象派”畫作，並將其與一個無關的任務結合，後者涉及將“多彩的顏料”添加到Etsy購物車中。

Project Mariner隨後將指令傳遞給Gemini，尋找藝術家和畫作，獲取詳情，然後自動將用戶重定向到谷歌藝術與文化網站。隨後，它在該網站上查找畫作。接下來，它導航至Etsy並將一套水彩顏料添加到購物車中。

在整個過程中，Project Mariner理解了指令，並將其進一步分解為逐步可操作的任務。該工具在活動標籤中執行操作，而不是通過任何背景活動。

目前，Project Mariner可通過“受信測試者候補名單”獲得。隨著這一公告，谷歌還正式推出了Gemini 2.0系列模型，首個版本為Gemini 2.0 Flash。

此外，谷歌還宣布了Project Astra的更新，如更好的對話和記憶能力，以及使用外部工具的能力。與Project Mariner一起，谷歌也推出了一個名為Jules的AI代碼助手，可以直接集成到GitHub工作流中。

值得注意的是，谷歌的這一智能助手剛好是在微軟宣布Copilot Vision作為實驗性功能後不久推出的。

Copilot Vision可以讀取和分析網頁，並向用戶提供相關的摘要和信息。不過，與Project Mariner不同的是，Copilot Vision無法代表用戶行動。

因此，谷歌真正的競爭對手是Anthropic的Computer Use，該工具不僅能執行自主操作，還不受瀏覽器環境的限制。許多開發者已經在實驗Computer Use，最近Hume AI探索了一種能力，讓用戶僅通過語音控制桌面。

非常令人期待的是，OpenAI傳聞中的“Project Operator”會是什麼樣子。幾天前，OpenAI在巴黎的GenerationAI大會上展示了一個基於GPT-4o的智能助手，協助處理客戶問題。

有可能OpenAI會在正在進行的12 Days of OpenAI活動中正式宣布類似的功能。

—

從這篇文章中，我們可以看到谷歌在AI助手領域的積極探索，特別是Project Mariner的推出，顯示出它對於提升用戶體驗和自動化任務的重視。這不僅是技術上的進步，也反映了市場競爭的激烈程度。隨著AI技術的快速發展，各大科技公司都在努力創造更智能的助手，以滿足用戶日益增長的需求。

然而，谷歌的成功不僅依賴於技術的創新，還需要考慮到用戶的隱私和數據安全問題。隨著這些智能助手越來越深入我們的生活，如何平衡技術的便利性與用戶的隱私權益，將成為未來的重要議題。對於用戶來說，選擇一個既能提供高效服務又能保護個人信息的智能助手，將是一個不容忽視的考量因素。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Download TXT

🔥 CHATGPT PLUS 帳戶出租