一個AI代理的成本已超過印度的初級開發者
發布於2024年12月12日
來自AI起源與演變
以每月500美元的訂閱價格,這個AI代理能否實現其承諾?
印度的「I」代表IT服務。去年,印度IT行業招聘了超過250,000名剛畢業的年輕人。今年,又有超過100,000名新鮮人獲得了錄用通知。儘管工作機會有所下降,但預計未來幾個月將會增長。
讓我們看看數字。平均而言,新鮮人的年薪約為4,000美元(約合35萬印度盧比)。
現在來介紹Devin,一款由Cognition Labs開發的端到端AI驅動的軟件開發工具,旨在取代組織中的初級程序員或開發者。這個工具的成本是多少?每月500美元,合計每年6,000美元。
Cognition Labs不僅計劃模擬初級開發者的角色,實際上它的成本還超過了來自全球IT服務之都印度的實際人員。
在引發AI生態系統的熱潮後,Devin在幾個月內消失了。它承諾的功能充滿了虛假和誤導,工具如Cursor、GitHub Copilot和Windsurf在Devin推出之前便已開始崭露頭角。如今Devin終於登場,但它準備好實現承諾了嗎?
每個人桌上的初級開發者
雖然每月500美元的價格看似高昂,但Cognition Labs在使用該工具時對團隊中的座位數量並無限制。雖然被定位為全能工具,Devin建議用於前端錯誤修復、為待辦事項創建初稿的拉取請求(PR)以及進行有針對性的代碼重構。
除了主要的聊天界面,Devin還可以作為Slack的集成使用,用戶在對話中標註它時,它便會開始處理問題。用戶還可以直接從VS Code啟動Devin會話。
根據Cognition Labs的說法,Devin在其技術堆棧中影響顯著。上個月,它成為了許多內部工具和前端代碼庫的主要貢獻者。公司還展示了Devin如何監控從其啟動以來的數據,並要求該工具將數據整理成.csv文件並監控十二小時。
Cognition Labs還透露,Devin能夠解決、測試和修復Anthropic的模型上下文協議(MCP)中的一個問題。我們正見證一個AI代理修復另一個的情況。
這不僅關乎擁有者的驕傲;其他組織也能增強其工作流程和項目時間表。
Advantage Solutions的工程副總裁Sam Purtill在X上寫道:“我們的一位工程師給Devin一個錯誤,帶著兒子去鋼琴課,回來後發現完美的修復。總共花費的時間:幾分鐘。”
此外,Devin還可能幫助員工擺脫耗時且重複的任務。Ramp的創始人兼CTO Karim Atiyeh表示,Devin在幫助他們清理無用代碼和加快測試速度方面“發揮了重要作用”,從而使工程師能有更多時間專注於更重要的事務。
總部位於巴西的數字銀行Nubank表示,Devin將一個項目的時間從1.5年縮短至僅兩個月。
Cognition Labs在X上的一篇文章中寫道:“Devin成功地提高了工程時間的效率12倍,幫助Nubank工程師在其客戶數量超過1.1億的情況下減少了開發工作。”
即使Devin能編寫代碼和管理PR,但它是一個好的文化聘用人選嗎?它能在站會上說“不更新”嗎?它會參加DevOps團隊的季度攀岩活動嗎?
— JT (@jiratickets) 2024年12月10日
在另一個例子中,Devin還被用於Dagger.io解決團隊內部未被注意到的次要問題。
“三個月後,沒有人有時間去查看。直到Devin到來並在幾分鐘內打開了一個PR,”Dagger的聯合創始人Solomon Hykes說。他補充道,任何運行開源項目的人都無法不嘗試Devin。
Devin依然是初級工程師
對Devin的看法可以有兩種:它和初級開發者一樣好,或者它僅僅和初級開發者一樣好。
儘管看似令人印象深刻,但它的能力仍然有限。
雖然Devin在執行任務時顯示出魔力,但在過程中可能沒有太多機會進行監督或提供意見。摩根士丹利的AI研究員Will Brown在X上表示,當Devin陷入困境時,幫助它可能會變得更加困難。
在這種情況下,使用Cursor或Windsurf這樣的工具,讓用戶仍然掌控主導地位,將是有益的。
“我認為我稍微更喜歡Cursor代理的‘配對編程’工作流程,這種方式更為直接,你可以實時審查代碼,並且更容易給出建議,”他說。
此外,Devin仍然需要一些來回的交流,而用戶可能不希望這樣做,尤其是在他們支付一個聲稱具備自主能力的代理費用時。
一位用戶在X上觀察到PR的聊天會話,指出了同樣的問題,說:“3/5的Devin PR看起來不怎麼樣,[而且]自己提示或直接輸入代碼能快得多。”
在對Devin的詳細評價中,Builder.io的CEO Steve Sewell表示,他等了十五分鐘才拿到一個PR,然後在Slack上進行了幾次來回的交流。
“我更喜歡Cursor的工作流程,在那裡我可以在我的本地環境和IDE(集成開發環境)中完成所有這些,”他補充道。此外,用戶不希望Devin獨自行動,除非它能提供足夠的信任感和信心,讓他們相信它能夠完成任務。
因此,聘用實習生、初級開發者或Devin所面臨的相同擔憂仍然存在。這些人都能交付功能,但如果代碼庫缺乏行業標準的實踐和可解釋性,那將是個麻煩。
例如,Devin被要求對CSS代碼進行更改,但它添加了一些不相關和不必要的組件。
無法理解這樣的變更和一堆AI編寫的代碼是一個關鍵問題。“AI總是給你答案,而答案不僅是錯誤的,而且很難檢測出錯誤的地方。它只是編造東西,”Hotels.ng的CEO Mark Essien說。
SaaS Pegasus的創始人Cory Zue講述了類似的經歷,幾位實習生參與並交付了一個功能,但留下了一堆沒有人能理解的“代碼山”。
“我的直覺是,這確實在發生,許多項目將在糟糕的AI代碼的重壓下消亡,”他補充道。
總而言之,印度IT業是否會在其組織中接受像Devin這樣的工具?似乎不大可能。儘管印度IT正在全力以赴地投入生成AI項目和合作,但目前他們並不喜歡在工作場所使用這些工具。
今年早些時候,ISG的助理主任兼首席分析師Mrinal Rai在接受AIM採訪時表示:“許多這些[生成AI]解決方案未能令客戶印象深刻。印度IT服務提供商與企業之間有著長期的關係,並在大型或中型企業需求的具體細微差別方面擁有豐富的經驗。”
話雖如此,如果Devin真的能改變軟件開發,那麼500美元似乎真的是小事一樁。
這篇文章引發了對AI在軟件開發中角色的深思,尤其是它取代人類開發者的潛力。雖然AI的技術進步無疑為行業帶來了變革,但它的局限性和不確定性仍然需要我們謹慎考量。企業在選擇是否引入這類工具時,應該仔細分析其實際效益與可能的風險,特別是在代碼質量和團隊協作方面。AI工具或許能提高效率,但倘若無法保持代碼的可維護性和可理解性,最終可能會對開發流程造成負面影響。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。