**AI代理已到來:電腦將為你計算,一切將不同以往**
今年早些時候,Google在其年度開發者活動中承諾,其AI增強搜索引擎很快將代替你進行搜索。五個月後,一個更廣闊的未來開始浮現:你的電腦將為你進行計算。
這就是Anthropic最新版本的語言模型Claude 3.5 Sonnet所承諾的。從今天開始,開發者可以使用一個名為“電腦使用”的功能。公司這樣描述:
開發者現在可以在API上指導Claude像人一樣使用電腦——觀看屏幕、移動光標、點擊按鈕和輸入文字。Claude 3.5 Sonnet是首個在公測中提供電腦使用功能的先鋒AI模型。此階段仍屬實驗性質,偶有繁瑣和錯誤。我們提前發布以獲取開發者的反饋,並期望此功能能夠迅速改進。
一段簡短的視頻展示了一位Anthropic研究員使用其代理從電腦上的各個地方收集信息並填寫表格。這是一個平凡的例子,但這正是重點:建造一個智能到足以自動化繁瑣工作的AI代理。
Anthropic迅速指出,這一技術的首個版本運行緩慢且錯誤頻出。但它也預示著AI實驗室在構建超級智能的路上進入了下一個重要階段。
Anthropic只是眾多正在構建AI代理的公司之一。今日,Microsoft宣布了其Dynamics 365業務應用套件的10項新自動化功能。Asana也推出了自己的代理。Salesforce的競爭技術Agentforce將於下週全面推出。還有許多初創公司正在競相打造各類“AI同事”。
Anthropic的代理之所以脫穎而出,是因為它運用了我們使用了近兩年的AI聊天機器人技術,並將其從文字框中釋放出來。它不再僅限於提供文字或語音回應,現在可以替你完成小型項目。
賓夕法尼亞大學沃頓商學院的副教授Ethan Mollick早期試用了Anthropic的代理。他讓它在自己忙其他事情時編寫了一份課程計劃:
作為一個例子,我要求AI為高中生編寫一份關於《了不起的蓋茨比》的課程計劃,將其分解為可讀的部分,然後創建與Common Core學習標準相關的作業和連結。我還要求它將這些內容整合到一個電子表格中。使用聊天機器人,我需要在每個步驟中指導AI,作為共同智力一起制定計劃。這次不同。一旦給出指示,AI自行完成了步驟:下載書籍、在網上查找課程計劃、打開電子表格應用並填寫初步課程計劃,然後查找Common Core標準,對電子表格進行多次修訂。結果還不錯(我檢查過,沒有明顯錯誤,但可能有一些——稍後會討論可靠性)。最重要的是,我看到的是完成的草稿,而不是需要管理的過程。我只是委派了一個複雜的任務,然後離開電腦,稍後回來查看它的成果(系統相當慢)。
隨後,他用它來玩Paperclip Clicker遊戲(諷刺的是,這是一個關於AI因專注於製造迴紋針而毀滅人類的遊戲)。結果不佳——一個錯誤導致更多錯誤,迫使Mollick介入。總體來說,他寫道,該代理能夠成功處理各種任務,但不足以讓他感到可以經常性地委派工作給它。
這肯定會導致許多幽默的TikTok視頻,展示Claude嘗試並未能展示基本電腦技能。但公司在開發代理的博客文章中指出,即使在這個最實驗性的階段,Claude在導航方面的表現已經是其最接近競爭對手的兩倍,可能比你想像的更接近人類水平:
目前,Claude是使用電腦像人一樣操作的模型中的最先進者——即從觀看屏幕到做出響應行動。在一項為測試開發者試圖讓模型使用電腦的評估中,Claude目前得分14.9%。這與人類水平的技能相差甚遠(通常為70-75%),但比同類中的次佳AI模型所獲得的7.7%高出許多。
需要澄清的是,14.9%的成績在大多數標準下是一個不及格。但在這個測試中,大多數人類只得C。這提醒我們,大多數人至少有時在處理基於電腦的任務時有多困難——這是邁向能讓這些麻煩消失的代理的重要里程碑。
然後會發生什麼?
可以很容易地想像使用AI代理來管理你的約會和日程安排,填寫在線表格和例行文書工作,為你的電子郵件起草回覆,並為你進行網上購物。或者它可以為你瀏覽網絡,為你準備個性化的摘要,讓你再也不必對抗付費牆。
同樣容易想像的是,擁有這些能力的代理會設置垃圾郵件操作,自動生成AI垃圾網站,並用大量AI生成的請求淹沒人類運營的企業和機構。
無論如何,使用AI代理的人將不得不面對一些非常現實的隱私問題。今年早些時候,微軟不得不推遲其新AI中心PC中的標誌性功能Recall的推出,該功能設計讓你可以通過AI驅動的搜索來搜索電腦上的所有過去活動,這些活動的截圖會在背景中默默拍攝。安全研究人員指出,除其他外,用戶將默認加入,並且他們的截圖未加密,這對黑客來說是一個吸引人的目標。(用戶現在必須選擇加入,並且截圖已加密。)
Anthropic將需要類似的用戶電腦訪問權限才能代表用戶操作電腦。我想企業在讓任何人使用它之前,會有許多關於公司如何處理客戶數據和員工數據的問題。
在短期內,我們對代理的期望可能還有實際的限制。一位初創公司CEO對我嘲笑AI圈中流行的觀點,即“下一個主要編程語言是英語。”(換句話說,即你將能夠通過說出你的要求來讓軟件做任何你想要的事情。)這位CEO解釋說,CEO們一直“用英語編程”,通過告訴他們的人類工程師要構建什麼。而這一過程也以錯誤和低效著稱。
但用AI圈中另一個流行的短語來說,Anthropic今天發布的代理是這種類型的軟件將會最差的時候。從此刻開始,AI將不再僅限於可以在框中輸入的內容。這意味著我們其他人也該開始跳出框框思考了。
**評論**
AI技術的進步讓我們看到了一個充滿機遇和挑戰的未來。Anthropic的Claude 3.5 Sonnet展示了AI代理如何從單純的聊天機器人進化為能夠完成複雜任務的智能助手。這不僅改變了工作流程,也可能改變我們對人機交互的理解。然而,這樣的技術進步也引發了隱私和安全的擔憂。企業和個人用戶都需要謹慎對待AI技術的應用,確保數據安全和隱私保護不被忽視。同時,我們也應該認識到,AI技術的潛力遠不止於此,未來的發展可能會帶來更多意想不到的影響和挑戰。在這個快速變化的時代,我們需要不斷學習和適應,以迎接AI帶來的各種可能性。
以上文章由特價GPT API KEY所翻譯