Anthropic推出新款Claude 3.5 Sonnet:智能到可以接管你的電腦
全球領先的人工智能公司Anthropic最近發布了其最新的AI模型,包括能夠物理控制電腦的新功能,標誌著從僅限於聊天的互動轉向實際操作的自動化。
Reddit用戶最先發現異常——Claude突然變得更聰明、更有能力。現在我們知道原因了:Anthropic推出了重大升級,包括增強版的Claude 3.5 Sonnet和輕量級的Haiku模型。
最令人毛骨悚然的更新是:這些AI現在可以物理控制電腦,移動游標、滾動頁面,甚至點擊按鈕,就像人類一樣。
在一段視頻演示中,Anthropic研究員Sam Ringer展示了Claude如何通過滾動電子表格、分析CRM後搜尋公司的信息,並填寫外部網站上的表格。
“今天在API上可用,開發者可以指導Claude像人類一樣使用電腦——通過看屏幕、移動游標、點擊按鈕和輸入文本。Claude 3.5 Sonnet是首個提供電腦使用功能的前沿AI模型,”Anthropic在今天早些時候的官方公告中表示。“我們提前發布電腦使用功能以獲取開發者的反饋,並期望該功能隨時間迅速改進。”
Anthropic似乎在宣布之前就已經釋放了這個模型。一段時間內,Claude和Anthropic的Subreddit論壇充滿了用戶試圖弄清楚發生了什麼事的帖子,因為他們的AI表現得如此出色:用戶報告它更快、更準確,而且驚人的是,它不再頻繁道歉。
“Claude回來了,變得更好。它真的理解你的意圖,而不是給出死板無生氣的回應,”一位Reddit用戶NextGenAIUser說。“我在使用o1-Mini和o1-Preview時卡在了一個編碼問題上,回復越來越糟。用同樣的提示詞給Claude,它一次就解決了,”另一位用戶Roth_Skyfire評論道。
他們說得對。Anthropic報告稱,經過改進後,Claude 3.5 Sonnet的編碼能力在SWE-bench Verified測試中從33.4%提升到49%,超越了競爭對手OpenAI的o1-preview。這不是小幅提升。Anthropic報告的每個基準測試都顯示,新版Claude 3.5 Sonnet比原始模型好得多。
更有趣的是,升級後的Sonnet不僅更聰明,它現在還能控制你的電腦。Anthropic稱這項新功能為“電腦使用”,目前處於公開測試階段。其工作原理是,你給Claude訪問你的桌面和執行任務的權限。AI然後會像人類一樣通過遠程桌面操作你的電腦——移動游標、點擊按鈕、輸入命令和填寫表格。
然而,這個功能僅通過API可用,因此短期內終端用戶無法享受。
Anthropic已經訓練Claude視覺解讀屏幕上的內容。開發者可以指導它執行例如填寫表格、瀏覽網站,甚至使用軟件應用程序等任務。這有點像讓你的AI坐在你的電腦前為你工作,除了它不會累(希望)也不會像我們人類那樣犯錯。
該功能處於測試階段,因為它在一些基本操作上仍然有困難——滾動和縮放是它的難題。因此,Anthropic密切關注,儲存至少30天的截圖並進行安全檢查以捕捉任何可疑行為。
公司的謹慎是有道理的。幾個月前,微軟推出了一項名為“Recall”的功能,允許Copilot+拍攝用戶電腦的截圖,以便AI能夠更有幫助和相關性。這引起了很大的爭議,以至於微軟不得不推遲其計劃,因為Copilot+ Recall功能被認為是“間諜軟件”,並引發了當局的調查。
但Anthropic聲稱他們與眾不同。“我們發現更新後的Claude 3.5 Sonnet,包括其新的電腦使用技能,仍然處於AI安全級別2——即不需要比我們目前的安全措施更高的標準,”研究團隊表示。
像Replit這樣的公司已經在整合Claude的電腦使用功能,以幫助自動化應用評估,而The Browser Company正在測試其簡化基於網頁的工作流程的能力。這些早期採用者正在探索讓Claude處理通常需要數十甚至數百步手動操作的任務的方法。
此外,Anthropic的經濟型模型Claude 3.5 Haiku現在與其之前的旗艦模型Claude 3 Opus一樣強大。然而,這個模型的運行成本僅為前者的一小部分,並且延遲更低,讓它在不犧牲太多性能的情況下更具可及性。
Claude 3.5 Haiku特別擅長編碼任務和工具使用,在SWE-bench Verified測試中得分為40.6%。這使得它超過了一些市場上更昂貴的模型,意味著預算有限的開發者不必在質量上妥協。
Claude 3.5 Haiku將於11月推出。
編輯評論:Anthropic的這次更新無疑標誌著AI技術的一個重要里程碑。AI不僅僅是提供文本回應,現在還可以實際操作電腦,這讓我們對未來的工作方式有了全新的思考空間。這種技術的潛力巨大,可以大幅提高生產力,尤其是在需要大量手動操作的行業中。然而,這也引發了新的安全和隱私問題,特別是在數據保護和AI責任方面。Anthropic需要確保他們在這些方面有足夠的措施來保護用戶。對於開發者來說,這是一個令人興奮的時刻,因為他們可以開始探索更多自動化的可能性,但同時也需要保持警惕,確保技術的應用在道德和法律的框架內進行。
以上文章由特價GPT API KEY所翻譯