Amazon出招!Nova Act AI代理操控網頁,挑戰OpenAI、Anthropic!

Ai




亞馬遜推出Nova Act,一個能控制網頁瀏覽器的AI代理

亞馬遜於週一推出了Nova Act,一個通用的AI代理,能夠控制網頁瀏覽器並獨立執行一些簡單的操作。與這個新的代理型AI模型一同,亞馬遜還推出了Nova Act SDK,一個工具包,讓開發者能夠使用Nova Act建立代理原型。

Nova Act由亞馬遜最近開設的位於舊金山的AGI實驗室開發,將成為即將推出的Alexa+升級版的核心功能之一,這是一個增強型的語音助手,利用生成型AI技術進行升級。然而,目前從今天起推出的Nova Act版本仍然比較粗糙,亞馬遜稱其為研究預覽版。

開發者可以通過nova.amazon.com這個新網站來使用Nova Act工具包,該網站同時也是亞馬遜各種Nova基礎模型的展示平台。

Nova Act是亞馬遜對抗OpenAI的Operator和Anthropic的Computer Use的一次嘗試,亞馬遜希望利用自家通用AI代理技術來應對這些競爭者。許多領先的科技公司相信,能夠為用戶瀏覽網頁的AI代理將使當前的AI聊天機器人變得更有用。

儘管亞馬遜可能不是第一家開發這種代理技術的公司,但通過Alexa+,它有可能擁有最廣泛的覆蓋範圍。

亞馬遜表示,使用Nova Act SDK開發的應用將能夠自動執行一些簡單的用戶操作,例如從Sweetgreen訂購沙拉或進行晚餐預訂。開發者可以利用Nova Act工具包來創建能夠導航網頁、填寫表單或選擇日曆日期等功能的AI代理。

亞馬遜聲稱,Nova Act在公司的一些內部測試中表現超過了OpenAI和Anthropic的代理。例如,在ScreenSpot Web Text測試中,該測試衡量AI代理與屏幕上的文本交互情況,Nova Act得分94%,超過了OpenAI的CUA(得分88%)和Anthropic的Claude 3.7 Sonnet(得分90%)。

然而,亞馬遜並未使用更常見的代理評估標準,如WebVoyager,來對Nova Act進行基準測試。

Nova Act是亞馬遜AGI實驗室推出的首個公共產品,該實驗室由前OpenAI研究員David Luan和Pieter Abbeel共同領導。Luan曾創辦了Adept,而Abbeel則共同創立了Covariant,兩人在去年被亞馬遜招募來領導該公司在AI代理領域的工作。

儘管AI代理能夠訂購SweetGreen沙拉可能讓人覺得有些奇怪,但Luan向TechCrunch表示,他認為代理是創建超智能AI系統的重要一步。他將AGI定義為“一個能幫助你做任何人類在電腦上做的事的AI系統。”

Luan表示,他的團隊設計Nova Act SDK是為了可靠地自動化簡短、簡單的任務,並為開發者提供工具,精確定義何時需要人類介入代理工作流。他希望這能讓開發者創建出更可靠的代理應用,儘管這些應用可能不一定是完全自主的。

亞馬遜在這個競爭激烈的領域推出其首個通用AI代理,但這對該公司來說是一項至關重要的技術,亞馬遜有很多希望寄託於此。對Nova Act的早期測試可能會提供一些關於Alexa+的功能預覽,這對亞馬遜的AI努力來說是一個關鍵時刻。

來自OpenAI、Google和Anthropic的早期AI代理存在一個主要問題,就是在不同領域中的可靠性。在TechCrunch的測試中,這些系統表現緩慢,難以長時間獨立運作,且容易犯下人類不會犯的錯誤。我們很快就會知道亞馬遜是否已經解開了這個難題,或者它的代理是否也會遭遇與競爭對手類似的缺陷。

**評論與觀察:**

亞馬遜此次推出的Nova Act顯示出它對AI代理技術的重視,並希望能在這個領域占有一席之地。值得注意的是,儘管這些AI代理被賦予了相當大的期望,實際的應用場景仍然是有限的,像是訂購餐飲這樣的簡單任務固然可以透過AI進行自動化,但真正要實現更高效和複雜的功能,這些技術仍面臨挑戰。

一方面,Nova Act作為Amazon Alexa+的一部分,可能能夠借助已有的巨大用戶基礎,進一步提升其在市場上的影響力;但另一方面,從技術測試結果來看,AI代理目前的表現仍未達到完美,尤其是在多領域運作的穩定性和準確性方面。因此,亞馬遜要如何應對這些挑戰,提升其AI代理的可用性,將是未來關鍵的發展方向。

亞馬遜能否藉此突破競爭對手,還有賴於它如何精細調整Nova Act的運作,並解決當前存在的問題。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

✨🎱 Instagram留言 →

AI即回覆下期六合彩預測

🧠 AI 根據統計數據即時生成分析

💬 只要留言,AI就會即刻覆你心水組合

🎁 完!全!免!費!快啲嚟玩!

IG 貼文示意圖 AI 即時回覆示意圖

下期頭獎號碼

📲 去 Instagram 即刻留言

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
Generate an ultra-realistic, highly ultra-detailed, 8k resolution with 1080x1080 pixel, true-to-life portrait of me using the uploaded image for reference (preserved the likeness and the original face for reference). Create a portrait of a  fair-skinned woman with long, curly dark hair styled in a high ponytail, her head turned to the side, her expression neutral and serene; her makeup features defined eyebrows, subtle eyeliner, light blush, and glossy lips; she wears dangling earrings with a floral design; she has a piercing in her ear; the image is in ultra-high 8K resolution, showcasing detailed skin textures, crisp edges, and sharp focus on her eyes; a medium shot, taken from the side to emphasize her profile, with a shallow depth of field that softly blurs the background; soft, diffused lighting illuminates her face evenly, creating subtle shadows and highlights, with a warm color palette of soft browns and creams; she is wearing a dark strapless top; the background is a soft, neutral tone, ensuring the focus remains on the subject; no additional props are present; photorealistic style, akin to a raw camera capture, is achieved using an 85mm lens, ISO 100, and an aperture of f/2.0 for a shallow depth of field and soft background blur.

➖Additional details:
- Negative Prompt: whimsical , doll skin, plastic skin, cartoon, 3d render, cgi,a low poly, painting, drawing, sketch, anime, deformed, bad anatomy, mutated hands, extra limbs, low quality, blurry, artifacts, plastic skin, out of frame, out of focus, wrong spelling, rumble letters, missing letter, blurry letter, blurry face, lowres, pixelated, jpeg artifacts, repeated face and repeated word. A dynamic, ultra-realistic action shot of a snowboarder performing a high-air jump on a snowy mountain slope. The rider wears a bright green winter jacket, black snow pants, gloves, and a dark beanie, with reflective goggles catching the cold mountain light. A cloud of visible breath escapes from the rider’s mouth in the freezing air. Snow explodes upward from the snowboard, creating sharp, frozen particles suspended mid-air. The background features a dramatic high-altitude landscape with forested slopes and distant mountains under soft, cold blue lighting. Capture cinematic contrast, DSLR realism, 85mm lens, f/2.8, crisp details, slow-motion energy, dynamic composition, atmospheric depth, high-clarity sports photography. A low-angle, wide-lens street shot in a bustling cityscape (similar to Shibuya, Tokyo). A young woman crouches confidently beside a modified, glossy purple sports car with a Japanese license plate. She wears a black graphic tee, cargo pants, white sneakers, and silver jewelry. The background features tall glass skyscrapers, colorful billboards, neon signage, and warm late-afternoon lighting. Strong perspective distortion emphasizes the height of the buildings and the car’s aggressive stance. The mood is stylish, bold, and modern, capturing urban automotive culture with a cinematic, hyper-real aesthetic. High detail, high contrast, crisp reflections, editorial fashion vibe, dynamic street energy.