AI 編程工具正轉向一個意想不到的地方:終端機
多年來,像 Cursor、Windsurf 以及 GitHub 的 Copilot 這些代碼編輯工具,一直是 AI 助力軟件開發的標準選擇。然而,隨著具備自主行動能力的 AI 越來越強大,以及「vibe coding」的興起,一個微妙的轉變正在改變 AI 系統與軟件互動的方式。
它們不再只是處理代碼,而是越來越多地直接與安裝系統的終端機(shell)互動。這是軟件開發方式上的重大變革,雖然目前還不太顯眼,但未來可能會對整個領域的發展方向產生深遠影響。
終端機最為人熟悉的形象,可能是90年代黑白色的黑客電影裡的畫面——一種非常傳統的運行程序和處理數據的方式。雖然沒有現代代碼編輯器那樣華麗的視覺效果,但只要懂得使用,它就是一個極其強大的介面。代碼代理雖然能編寫和調試代碼,但通常需要終端機工具,才能將代碼轉化成實際可用的軟件。
這波向終端機轉移的最明顯跡象來自主要的 AI 研究機構。自今年二月起,Anthropic、DeepMind 和 OpenAI 相繼推出了命令行編程工具(分別是 Claude Code、Gemini CLI 和 CLI Codex),這些產品迅速成為它們旗下最受歡迎的服務之一。
這種轉變不易被察覺,因為它們大多沿用以往編碼工具的品牌名稱,但背後 AI 與其他計算機互動方式已有實質變化,無論是線上還是離線環境。部分業內人士認為,這才剛剛開始。
Terminal-Bench 共同創辦人 Mike Merrill 表示:「我們的重大賭注是,未來 95% 的大型語言模型與計算機互動,將通過類似終端機的介面實現。」
同時,終端機工具正正當其時。因為以代碼為基礎的工具開始顯得不穩固。AI 代碼編輯器 Windsurf 近期經歷了多重收購波折,核心高管被 Google 挖角,剩餘公司則被 Cognition 收購,令該產品的長遠發展充滿不確定性。
另一方面,新研究顯示,開發者可能高估了傳統工具帶來的生產力提升。METR 針對 Windsurf 競爭對手 Cursor Pro 的研究發現,雖然開發者估計能快 20% 至 30%,但實際操作反而慢了近 20%,換句話說,這些代碼助手反而拖慢了開發速度。
這為如 Warp 這類公司提供了機會。Warp 現時在 Terminal-Bench 排名第一,自稱是「具自主行動能力的開發環境」,介乎於集成開發環境(IDE)和命令行工具(如 Claude Code)之間。
Warp 創辦人 Zach Lloyd 對終端機前景持樂觀態度,認為它能解決 Cursor 等代碼編輯器無法觸及的問題。
他說:「終端機位於開發者技術棧的底層,是運行智能代理最靈活的地方。」
要理解這種新方法的不同,觀察它們所使用的評測標準很有幫助。以代碼為基礎的工具多集中於解決 GitHub 上的問題,這是 SWE-Bench 測試的核心。每個問題都是 GitHub 上的一個開放問題,基本上是有錯誤的代碼。
AI 模型通過不斷迭代代碼,直到找到可行方案,完成該問題。像 Cursor 這樣的集成產品對此有更複雜的處理方式,但 GitHub/SWE-Bench 模式仍是它們的核心思路:從壞代碼開始,一步步改成可用代碼。
終端機工具則視野更廣,不單看代碼本身,而是整個程序運行環境,包括配置 Git 服務器、排查腳本無法運行的原因等 DevOps 任務。
例如,TerminalBench 的一個問題是給出一個解壓程序和目標文本文件,挑戰 AI 反向推導出匹配的壓縮算法;另一個則要求 AI 從源代碼編譯 Linux 內核,且不告訴它需要自己下載源代碼。解決這些問題需要具備程序員必備的堅韌不拔的解決問題能力。
Terminal-Bench 共同創辦人 Alex Shaw 指出:「TerminalBench 難度不僅來自問題本身,更來自我們為 AI 創造的運行環境。」
關鍵是,這種新方法要求 AI 一步步解決問題,這正是 agentic AI 強大的原因。但即使是最先進的 agentic 模型,也無法完全應付所有這些環境。Warp 之所以能在 Terminal-Bench 獲得高分,僅解決了略多於一半的問題,顯示這個評測的挑戰性及終端機潛力尚未完全釋放。
不過,Lloyd 認為,現時終端機工具已能可靠地處理開發者大部分非編碼工作,這是一個難以忽視的價值所在。
他說:「如果你想像日常工作是建立新項目、理清依賴關係並讓它能運行,Warp 幾乎可以自動完成這些任務;如果做不到,它也會告訴你原因。」
—
評論與觀點
這篇報導揭示了 AI 編程工具的一個重要轉折點——由以往的純代碼編輯,逐漸向更底層、更靈活的終端機介面發展。這不僅意味著技術路線的調整,更暗示了未來軟件開發流程將更強調整合環境管理與自動化操作,而非單純的代碼生成。
終端機的回歸,看似復古,實則符合當下軟件開發日益複雜的需求。隨著 DevOps 和持續集成成為常態,開發者需要的不只是寫代碼,更要能快速配置環境、部署應用、排查問題。AI 直接介入這些底層環節,能大幅提升效率,甚至改變工作模式。
此外,研究指出傳統 AI 編碼工具可能因誤判生產力提升而帶來反效果,提醒業界不能盲目追求「智能」而忽略實際效益。相反,終端機工具結合 agentic AI 的自主問題解決能力,更貼合開發者需求。
未來,我們可能見證 AI 不再只是「代碼助手」,而成為具備獨立判斷和操作能力的「開發環境管家」。這樣的發展不僅提升個人開發者的生產力,也可能改寫團隊合作和軟件交付的模式。
對香港及華語地區的開發社群而言,理解並掌握這波工具變革,有助於在全球技術浪潮中保持競爭力。終端機雖然傳統,但正因其強大和靈活,值得更多開發者重新認識和應用。未來的 AI 開發工具,或許正是從「黑白終端」這個看似老舊的介面開始,展開全新的技術篇章。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。
🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年!
不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放
