OpenAI新AI「Operator」登場,幫你操控電腦完成任務

Ai

OpenAI 據報即將推出“Operator”,可控制你的電腦

OpenAI 據報準備在本周推出其新產品“Operator”,這是一種可以在用戶的網頁瀏覽器中代替用戶完成任務的計算機使用代理。其他公司如 Google 和 Anthropic 也在開發類似的“代理”,希望這將成為 AI 在執行目前由人類完成的任務上邁出的重要一步。

根據《信息》(The Information)的報導,Operator 將為用戶提供旅行、餐飲和活動等類別的建議提示。用戶可以請求 Operator 幫助他們找到從紐約到毛伊島的合適航班,並確保不會在晚上太晚的時候抵達。值得注意的是,Operator 不會完成交易,用戶仍需保持在過程中並完成結帳。

想像一下,Operator 的一些應用場景是相當容易的。對於不擅長使用電腦的老年人來說,他們可以請求 Operator 幫助發送電子郵件,Operator 將能夠導航至 Gmail 並為他們打開撰寫窗口。雖然技術精通的人不需要這種幫助,但老一輩的人在網絡導航和完成簡單任務時常常會遇到挑戰。此外,機器人還可以在質量保證測試等其他領域發揮作用,幫助公司測試其新網站或服務是否正常運作。

然而,這類“計算機使用代理”也存在潛在風險。我們已經看到某些初創公司推出了自動化發佈營銷垃圾郵件的網絡導航機器人。能夠控制最終用戶客戶端的機器人能夠繞過旨在阻止自動化的 API 限制。AI 初創公司需要採取一些措施來防止濫用,否則網站上的垃圾郵件將比現在更加泛濫。

這些代理如 Operator 本質上是通過截取用戶瀏覽器的屏幕截圖並將圖像發送回 OpenAI 進行分析來工作的。一旦其模型確定完成任務所需的下一步,指令將發回瀏覽器,移動並單擊相應的目標,或在輸入框中輸入文字。這利用了 OpenAI 和其他公司正在開發的多模態技術,能夠解釋多種形式的輸入,在這種情況下是文本和圖像。

最近一批 AI 初創公司的整體承諾是,它們將能夠創造出能夠取代人類執行大多數任務的人工通用智能(AGI),從而使每個人的生活更加高效。隨著語言模型性能的指數增長放緩,這些公司一直在尋找新的突破,而計算機使用代理就是其中之一。人工智能在能夠物理地為人類完成任務之前,無法真正取代人類——寫作只是任務的一部分。機器人還需要能夠操作電子表格、觀看視頻等。

在 Anthropic 發布其計算機使用機器人的初步預覽後,早期測試者抱怨該產品最好的情況下也只是半成品,經常在不知道該做什麼時陷入循環,或忘記任務轉而做其他事情,比如在 Google 圖片上查看自然風光的圖片。它的運行速度也慢,成本高昂。

在賦予機器人如此高級別的控制權和訪問關鍵數據的情況下,保持人類在過程中將是至關重要的。計算機使用代理可能會類似於自駕車。谷歌能夠讓汽車在筆直的道路上自行駕駛,但邊界案例的解決卻花了數年時間。

對於如何衡量 AGI 以及何時會“實現”存在著爭議,但 OpenAI 已告訴其最大支持者微軟,認為 AGI 將在其創造出一種能夠產生至少 1000 億美元利潤的人工智能時達成。考慮到 OpenAI 預測其在2025年將產生120億美元的收入,仍然虧損數十億,這是一個相當高的目標。

同時,微軟和谷歌都沒有看到企業客戶能夠像他們希望的那樣快速採用 AI 工具。這兩家公司現在不再向每位員工收取20至30美元的額外費用來增加 AI 工具,而是將 AI 直接納入其標準包並分別提高幾美元的價格。

這篇報導讓我們看到,AI 技術的發展正處於一個關鍵的轉折點。OpenAI 的 Operator 可能會為某些人提供便利,但同時也帶來了許多潛在的風險和挑戰。我們需要更加謹慎地思考人類與技術之間的關係,尤其是在自動化和人工智能日益普及的今天。如何在技術進步與人類控制之間找到平衡,將是未來科技發展中不可忽視的重要課題。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon