免費!最新GPT 4o 繪圖 + 修圖! 整MEME圖、漫畫一流!

Amazon出招!Nova Act AI代理操控網頁,挑戰OpenAI、Anthropic!

Ai

亞馬遜推出Nova Act,一個能控制網頁瀏覽器的AI代理

亞馬遜於週一推出了Nova Act,一個通用的AI代理,能夠控制網頁瀏覽器並獨立執行一些簡單的操作。與這個新的代理型AI模型一同,亞馬遜還推出了Nova Act SDK,一個工具包,讓開發者能夠使用Nova Act建立代理原型。

Nova Act由亞馬遜最近開設的位於舊金山的AGI實驗室開發,將成為即將推出的Alexa+升級版的核心功能之一,這是一個增強型的語音助手,利用生成型AI技術進行升級。然而,目前從今天起推出的Nova Act版本仍然比較粗糙,亞馬遜稱其為研究預覽版。

開發者可以通過nova.amazon.com這個新網站來使用Nova Act工具包,該網站同時也是亞馬遜各種Nova基礎模型的展示平台。

Nova Act是亞馬遜對抗OpenAI的Operator和Anthropic的Computer Use的一次嘗試,亞馬遜希望利用自家通用AI代理技術來應對這些競爭者。許多領先的科技公司相信,能夠為用戶瀏覽網頁的AI代理將使當前的AI聊天機器人變得更有用。

儘管亞馬遜可能不是第一家開發這種代理技術的公司,但通過Alexa+,它有可能擁有最廣泛的覆蓋範圍。

亞馬遜表示,使用Nova Act SDK開發的應用將能夠自動執行一些簡單的用戶操作,例如從Sweetgreen訂購沙拉或進行晚餐預訂。開發者可以利用Nova Act工具包來創建能夠導航網頁、填寫表單或選擇日曆日期等功能的AI代理。

亞馬遜聲稱,Nova Act在公司的一些內部測試中表現超過了OpenAI和Anthropic的代理。例如,在ScreenSpot Web Text測試中,該測試衡量AI代理與屏幕上的文本交互情況,Nova Act得分94%,超過了OpenAI的CUA(得分88%)和Anthropic的Claude 3.7 Sonnet(得分90%)。

然而,亞馬遜並未使用更常見的代理評估標準,如WebVoyager,來對Nova Act進行基準測試。

Nova Act是亞馬遜AGI實驗室推出的首個公共產品,該實驗室由前OpenAI研究員David Luan和Pieter Abbeel共同領導。Luan曾創辦了Adept,而Abbeel則共同創立了Covariant,兩人在去年被亞馬遜招募來領導該公司在AI代理領域的工作。

儘管AI代理能夠訂購SweetGreen沙拉可能讓人覺得有些奇怪,但Luan向TechCrunch表示,他認為代理是創建超智能AI系統的重要一步。他將AGI定義為“一個能幫助你做任何人類在電腦上做的事的AI系統。”

Luan表示,他的團隊設計Nova Act SDK是為了可靠地自動化簡短、簡單的任務,並為開發者提供工具,精確定義何時需要人類介入代理工作流。他希望這能讓開發者創建出更可靠的代理應用,儘管這些應用可能不一定是完全自主的。

亞馬遜在這個競爭激烈的領域推出其首個通用AI代理,但這對該公司來說是一項至關重要的技術,亞馬遜有很多希望寄託於此。對Nova Act的早期測試可能會提供一些關於Alexa+的功能預覽,這對亞馬遜的AI努力來說是一個關鍵時刻。

來自OpenAI、Google和Anthropic的早期AI代理存在一個主要問題,就是在不同領域中的可靠性。在TechCrunch的測試中,這些系統表現緩慢,難以長時間獨立運作,且容易犯下人類不會犯的錯誤。我們很快就會知道亞馬遜是否已經解開了這個難題,或者它的代理是否也會遭遇與競爭對手類似的缺陷。

**評論與觀察:**

亞馬遜此次推出的Nova Act顯示出它對AI代理技術的重視,並希望能在這個領域占有一席之地。值得注意的是,儘管這些AI代理被賦予了相當大的期望,實際的應用場景仍然是有限的,像是訂購餐飲這樣的簡單任務固然可以透過AI進行自動化,但真正要實現更高效和複雜的功能,這些技術仍面臨挑戰。

一方面,Nova Act作為Amazon Alexa+的一部分,可能能夠借助已有的巨大用戶基礎,進一步提升其在市場上的影響力;但另一方面,從技術測試結果來看,AI代理目前的表現仍未達到完美,尤其是在多領域運作的穩定性和準確性方面。因此,亞馬遜要如何應對這些挑戰,提升其AI代理的可用性,將是未來關鍵的發展方向。

亞馬遜能否藉此突破競爭對手,還有賴於它如何精細調整Nova Act的運作,並解決當前存在的問題。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon