自動化電腦操作:AI新技術崛起

Ai

自動點擊電腦的興起

AI初創公司Anthropic,亦即是熱門聊天機械人Claude的創造者,本週宣佈了一項名為「電腦使用」的新功能,這是一套可以操作電腦桌面環境的工具。簡而言之,這是一個可以為你操作電腦的AI。

過去一年,AI領域的大玩家們一直在聲稱:「代理人」——即能夠在用戶授權下進行任務的系統——是行業的下一步。不同公司對這個詞的定義和願景各有不同,但基本概念相當直觀。真正有用的AI自動化,必須能與現實世界互動,而不僅僅是在聊天窗口中與用戶交互。以Claude為例,它是透過桌面電腦來接觸現實世界。

Anthropic的軟件目前正在有限測試中,但早期評價顯示這一概念是可行的。管理學教授兼AI影響者Ethan Mollick表示,該系統「具備一定的計劃能力,可以通過查看螢幕截圖和使用虛擬滑鼠與電腦互動」。儘管存在「很大的差距」,他對系統的能力和靈活性感到驚訝,並相信類似方法可能會越來越普遍。若未曾與最近的AI模型互動,這些演示影片值得觀看,包括這個公司展示的影片,代理人偏離任務:

在錄製這些演示時,我們遇到了一些有趣的時刻。其中一個是Claude意外停止了一個長時間的屏幕錄製,導致所有影片丟失。

後來,Claude從我們的編碼演示中抽身出來,開始瀏覽黃石國家公園的照片。

實際上,這類功能需要大量訪問權限才能運作,這種緊張關係將隨著科技公司在AI工具上的野心增大而變得更加明顯。當Google、Apple、Microsoft和OpenAI談論AI助手、更加實用的聊天機械人和代理人的崛起時,他們也在談論一個他們對用戶生活的數字內容擁有前所未有訪問權限的世界。Claude的演示讓這一點變得非常明顯。通過攝取和與用戶螢幕上的所有內容互動,Claude與用戶的關係比他們與其他數字服務的關係更加親密。這種訪問水平為AI公司提供了一個巨大的次要機會,可能會在用戶數據訪問方面超越上一代最大的科技公司,從而大幅改變隱私的規範。

這些演示的另一個引人注目的地方是,儘管令人印象深刻且新穎,但它們顯然展示了一種過渡技術。AI代理人在描述中是一個能夠獲取資源的實體,例如訂機票或編寫文件。但在這個早期階段,它是一種通過模仿用戶來與人類界面互動的工具,有點像由人形機器人駕駛的普通汽車,而不是完全自動駕駛的車輛。

這是一個有很多改進空間的概念驗證,但也與某些「使用」的軟件形成了對抗關係。例如,Claude在這裡被看到使用Google來完成其他任務;而Google依賴於向實際用戶展示廣告來賺錢,最終將對這類系統有話要說,因為這些系統既依賴於又削弱了它。同樣,Google自2018年以來一直在討論可以代表用戶撥打電話的基本代理系統,能夠自動處理繁瑣的電話樹或客戶支持情況。同樣,那些將人們引入電話樹或複雜客戶服務互動的公司,也不太可能在大多數電話由機器人處理的情況下袖手旁觀(事實上,餐廳已經在適應)。

Claude在這裡能做到的已經令人驚訝,但在很大程度上依賴於以生產力為名的小欺騙。如果目標是讓AI與現實世界互動,那麼要求控制用戶的電腦是一個非常有用的第一步,也是通向大量可能任務的捷徑,但對於一個不像其他AI玩家那樣已經擁有用戶電子郵件帳戶或社交媒體資料訪問權的公司來說,這也是一個大膽且可能有風險的方法。(就直接功能而言,值得注意的是,Anthropic的電腦使用功能與自動點擊器、宏工具和按鍵器等應用有很多共同點,這些應用被用來在電腦和手機上自動執行類人行為,並廣泛用於產生垃圾郵件和進行欺詐。)

正如Mollick所說,這類軟件正由OpenAI等公司開發,代表了AI公司「突破聊天框」的一種方式,至少在概念上是如此。行業內的人喜歡說,就原始能力而言,這是「它將永遠最差的時候」,但或許矛盾的是,這也是它將永遠最不受限制的時候,因為它運行在一個尚未有時間適應或阻止其存在的世界中。

評論

AI技術的發展正以驚人的速度推進,而Anthropic的新功能正是這種創新潮流的一部分。這不僅僅是技術上的突破,更是對人機交互的一次重新定義。從某種角度來看,AI能夠「自動點擊」電腦,標誌著我們對於數字世界的控制權的重新分配。這讓人不禁思考:我們願意交出多少控制權給機械?這樣的技術進步,雖然在效率和便利性上具有吸引力,但也對隱私和安全提出了新的挑戰。

技術的發展往往伴隨著道德和倫理的考量。當AI能夠深入我們的數字生活,甚至替我們做出決策時,我們是否應該制定更加嚴格的監管和保護措施?此外,這樣的技術是否會進一步加劇數字鴻溝,使得那些無法適應新技術的人群被邊緣化?

總而言之,Anthropic的「電腦使用」功能讓人看到了AI的無限潛力,但同時也提醒我們在擁抱技術進步的同時,必須謹慎對待其可能帶來的深遠影響。技術的未來不僅取決於其本身的發展,也取決於我們如何選擇使用和管理這些技術。

以上文章由特價GPT API KEY所翻譯

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *