OpenAI ChatGPT全新智能網頁助理登場

Ai




OpenAI 推出全新 ChatGPT 網頁瀏覽代理人

OpenAI 於星期四宣布推出 ChatGPT agent,一個能夠自主瀏覽網頁並代用戶執行任務的智能工具。早前在 X(前身為 Twitter)上的預告中,OpenAI 表示這款代理人結合了先前 Operator 代理人的自主操作能力及 Deep Research 工具的推理智能。

OpenAI 於今年一月推出的 Operator,曾提供給 ChatGPT Pro 用戶預覽試用,能在網頁上滾動、點擊及輸入,但功能有限,未有全面推廣。而 Deep Research 則能幫助用戶搜尋網頁和整理資訊,但無法進一步互動或行動。今次新推出的 ChatGPT agent 則將兩者優點合而為一,既能分析又能操作。

結合分析與操作的全新瀏覽體驗

OpenAI 表示,Operator 無法深入分析或撰寫詳細報告,而 Deep Research 則無法與網站互動調整搜尋結果或處理需要用戶認證的內容。兩者各有長短,因為不少用戶查詢更適合 Deep Research,故此新代理人整合兩者優勢,提升使用體驗。

這款代理人並非完整的網頁瀏覽器,但功能類似 Perplexity 推出的 Comet 瀏覽器助理。Anthropic 亦有類似工具「computer use」,可控制滑鼠游標並撰寫程式碼。隨著 AI 技術進步,這類能自主執行任務的代理人越來越普遍。網頁瀏覽成為 AI 競爭的新戰場,包括 OpenAI、Anthropic、Perplexity 及 Google 的 Project Mariner 等都在積極研發。

實用又安全的代理人操作模式

使用代理人模式時,用戶可請 ChatGPT 執行如「查看我的行事曆並根據最新新聞簡報即將的客戶會議」或「計劃並購買材料為四人準備日式早餐」等任務。OpenAI 強調用戶始終掌控主導權,代理人執行任何操作前均會先徵求許可,像是提交表格、購物或處理個人資料等。用戶亦可隨時中斷或接管操作。部分任務如發送電郵,則需額外監督的「觀察模式」保障安全。

在安全方面,ChatGPT agent 不會執行高風險操作,例如金融交易或法律諮詢,並具備辨識惡意提示注入及其他操控手法的能力。數據隱私方面,用戶可一鍵刪除瀏覽紀錄並登出網站,且在輸入密碼等敏感操作時,代理人不會收集數據。

由於功能提升,出錯風險亦相對提高。OpenAI 在其生物及化學能力準備框架中將 ChatGPT agent 分類為高風險工具。

誰可以使用?

此功能現已向 ChatGPT Pro、Plus 及 Team 用戶開放。Pro 用戶即時可用,每月可發送 400 條訊息;Plus、Team 及其他付費用戶則有 40 條訊息額度,並會在未來數日內陸續開放。

編者評論

OpenAI 這次推出的 ChatGPT agent,標誌著 AI 助理在自主操作網絡世界上又邁進一大步。過往 ChatGPT 只能被動回答問題,而今次代理人能主動瀏覽、操作網頁,甚至完成複雜任務,顯示 AI 的實用性大幅提升。

不過,這種「半自主」的工具同時帶來不少挑戰。首先是安全與隱私風險,代理人需要處理用戶敏感資料及網上交易,如何防止誤操作及惡意攻擊,成為頭號難題。OpenAI 對此採取嚴格限制並設置監督模式,雖然是正確方向,但仍需長期監控與改進。

此外,代理人的操作邏輯及決策透明度亦是關鍵。用戶如何確信代理人不會誤判或誤操作,且在複雜任務中能真正達成目標?這要求 OpenAI 持續優化模型的理解能力及錯誤修正機制。

最後,功能開放只限付費用戶,反映高端 AI 服務仍屬少數人專享,如何平衡商業利益與普及化,將影響 AI 技術的社會接受度與公平性。

總的來說,ChatGPT agent 的誕生為 AI 助理帶來全新可能,從被動資訊提供轉向主動任務執行,未來或將改變我們與網絡互動的方式。但同時也提醒我們,技術進步必須伴隨嚴謹的安全與倫理框架,確保科技帶來的便利不會成為新風險的溫床。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放

立即升級 🔗

✨🎱 Instagram留言 →

AI即回覆下期六合彩預測

🧠 AI 根據統計數據即時生成分析

💬 只要留言,AI就會即刻覆你心水組合

🎁 完!全!免!費!快啲嚟玩!

IG 貼文示意圖 AI 即時回覆示意圖

下期頭獎號碼

📲 去 Instagram 即刻留言