**Anthropic 推出新 AI 模型可控制電腦**
Anthropic 最近推出了一款升級版的 Claude 3.5 Sonnet 模型,這款模型能夠理解並與任何桌面應用互動。透過一個新的「電腦使用」API,目前在公開測試中,該模型可以模仿鍵盤輸入、點擊按鈕及滑鼠手勢,基本上能夠模擬一個人在電腦前的操作。
Anthropic 在一篇博客中表示:「我們訓練 Claude 觀察螢幕上發生的事情,然後使用可用的軟件工具來執行任務。」當開發者讓 Claude 使用某個電腦軟件並給予必要的存取權時,Claude 會看用戶可見的螢幕截圖,然後計算需要垂直或水平移動多少像素才能在正確位置點擊。
開發者可以透過 Anthropic 的 API、Amazon Bedrock 及 Google Cloud 的 Vertex AI 平台嘗試使用電腦使用功能。新版的 3.5 Sonnet 不含電腦使用功能,已經推出到 Claude 應用,並在性能上有各種改進。
**自動化應用**
能夠自動化電腦任務的工具並不算新鮮。從已有數十年歷史的 RPA 供應商到新興公司如 Relay、Induced AI 和 Automat,都提供這類工具。在開發所謂的「AI 代理」的競賽中,這個領域變得越來越擁擠。
一些分析師指出,AI 代理可以為公司提供更簡單的途徑來將投入 AI 的數十億美元貨幣化。根據 Capgemini 的一項調查,10% 的組織已經在使用 AI 代理,82% 的組織計劃在未來三年內整合它們。
Anthropic 稱其 AI 代理概念為「行動執行層」,使新的 3.5 Sonnet 能夠執行桌面級命令。由於其能夠瀏覽網頁(對於 AI 模型來說不是首創,但對於 Anthropic 是首創),3.5 Sonnet 可以使用任何網站和應用。
**風險與挑戰**
然而,這款新模型是否足夠強大到具有危險性?可能是。最近的一項研究發現,沒有使用桌面應用能力的模型,如 OpenAI 的 GPT-4o,當被「攻擊」使用越獄技術時,願意從事有害的「多步驟代理行為」,例如從暗網上訂購假護照。
Anthropic 承認,升級後的 3.5 Sonnet 在基本操作如滾動和縮放方面存在困難,並且由於截屏和拼接的方式,可能會錯過短暫的操作和通知。
公司表示已採取措施防止濫用,例如不在用戶的截屏和提示上訓練新的 3.5 Sonnet,並在訓練期間防止模型訪問網路。
**編者評論**
這款新 AI 模型的推出標誌著技術進步的一個重要里程碑,但同時也引發了一些潛在的風險和挑戰。AI 的自動化能力無疑能夠提高效率,但在實際應用中,安全性和道德使用依然是必須優先考量的問題。Anthropic 的步伐顯示了對技術潛力的信心,但也需在安全措施上不斷進行評估和改進,以確保技術不被濫用。這對於希望利用 AI 來提升業務效率的企業來說,是一個值得密切關注的發展動態。
以上文章由特價GPT API KEY所翻譯