AI 取代程式員?Cognition 的挑戰與機遇

Ai

程式員擔心這家價值20億美元的初創企業的AI可能取代他們的工作,但這是否真實?

在一次招聘活動中,Cognition的首席執行官Scott Wu挑戰應聘者,看看他們能否解決問題。

在2023年聖誕節前夕,Cognition的小團隊正在努力設置一個特別複雜的數據伺服器,這是這家總部位於舊金山的AI初創企業的編碼助手Devin的早期版本。他們花了幾個小時仔細閱讀安裝文檔並嘗試不同的命令,但始終無法讓它運行。疲憊而沮喪的他們決定看看Devin能否解決這個問題。

當AI開始運作時,它令創始人感到困惑。“它運行了一些看起來像巫術或黑魔法的命令,”聯合創始人兼產品負責人Walden Yan回憶道。起初,Devin的表現似乎不比他們好。然後,一個已經紅燈亮了好幾個小時的伺服器終端燈變成了綠燈。數據伺服器成功啟動了。

他們意識到,Devin刪除了團隊忽略的一個故障系統文件。“那一刻,我真的明白了軟件工程將會如何改變,”Yan說。

這是Devin完成的第一個重大任務,也是Cognition對AI能夠減輕編碼工作負擔的願景的證明。現在,幾乎一年後,Devin已經能夠處理基本的工程任務——查找和修復錯誤、更新代碼片段並在平台之間進行遷移。給它一個簡單的提示——“清理這個代碼庫”——它會制定行動計劃並執行。大多數時候,它都能成功。

這種方法與其他更知名且規模更大的玩家有所不同,例如Github(微軟於2018年以75億美元收購)和價值13億美元的Codeium,這些公司都提供數字助手,幫助人們通過AI驅動的建議編寫代碼。但Devin是一個自主的AI代理,理論上它可以自己編寫代碼——不需要人類參與——並能完成通常分配給開發者的整個項目(Devin這個名字來自“dev”,是開發者的縮寫)。Cognition的聯合創始人兼首席執行官Scott Wu表示:“我們看到這是一個真正的機會,可以從文本完成轉向任務完成。”

AI生成的代碼已經開始重新塑造行業。谷歌首席執行官Sundar Pichai在10月表示,該科技巨頭超過四分之一的新代碼是由AI編寫的。在Github,該公司在2024年的年收入達到20億美元,其代碼完成功能貢獻了今年40%的收入增長,微軟首席執行官Satya Nadella在7月說。Pitchbook分析師Brendan Burke表示,AI編碼已成為生成性AI中資金最充足的用例,專注於此的初創企業在2024年上半年就籌集了超過10億美元。

“現實世界中的軟件工程非常混亂。”

Cognition首席執行官Scott Wu

實際收入剛開始增長:研究公司IDC預計到2029年將超過40億美元。多家AI編碼初創企業的年收入運行率已超過1000萬美元;Cognition拒絕透露收入,但總裁Russell Kaplan表示,它已簽署數十個客戶,典型的年度合同金額在六到七位數之間。這一機會吸引了像Anthropic、亞馬遜和IBM這樣的巨頭推出自己的編碼工具,還有像Poolside(估值30億美元)和Anysphere(估值4億美元)這樣的初創企業。IDC分析師Ritu Jyoti指出,編寫代碼的能力已經成為典型AI模型的“入場券”,而在這一領域的領導者仍然是OpenAI的ChatGPT。但像Cognition正在開發的完全自主的編碼AI“將帶來巨大的變革”。

這對於500萬名美國程式員(中位數薪資為13萬美元)來說,無疑不是好消息,更不用說中國和印度的1300萬名編碼者了。Wu堅持認為,沒有即將到來的大規模失業,並且該領域的增長已經“受供應限制”。

日常的程式員可能會感到擔憂,但投資者卻對此充滿信心。彼得·蒂爾的Founders Fund和Khosla Ventures在4月向Wu和他的25名團隊投資了1.76億美元的B輪融資,使其估值在成立僅六個月後達到20億美元。這筆資金是在初創企業在1月完成2100萬美元的A輪融資後的僅三個月內注入的。

其客戶包括年收入3億美元的費用管理公司Ramp,該公司利用Devin編寫測試和清理無用代碼,以及年收入17億美元的數據平台MongoDB,對於該平台,Devin更新過時的代碼架構,為客戶節省了數百萬,首席產品官Sahir Azam表示。年收入80億美元的金融科技公司Nubank的程式員也在使用它進行更新代碼庫等任務。

雖然仍處於早期階段,但Founders Fund的合夥人John Luttig對Cognition的投資部分原因是他認為該公司有足夠的先發優勢,“讓其他人追趕上來將會非常困難”。微軟似乎也有類似的直覺。它在5月簽署了合作協議,將Devin提供給其Azure雲的開發者,首席技術官Kevin Scott在公司年度開發者大會上讚揚它是一個“非凡”的工具。

然而,矽谷裡充斥著曾經在亞馬遜和谷歌面前有輝煌優勢的公司的殘骸,直到它們不再如此。Cognition的支持者們相信,如果有人能創造出最終的編碼機器,那就是這三位擁有卓越成就的世界級程式員。創始人都是奧林匹克級別的金牌程式員,都是在競技編程賽道上相遇的。Wu在小學時期就是數學天才,在Codeforces這個網絡編程競賽網站上獲得了“傳奇大師”排名(最高級別)。Ramp的首席執行官Eric Glyman表示,Wu是他見過的“前五名IQ最高的人”。

“Scott顯然聰明、好奇且雄心勃勃,”風險投資家Sarah Guo說,她通過她的公司Conviction在三輪融資中投資了Cognition。Wu也是《福布斯》30位30歲以下精英的成員:他在2019年因其之前的公司Lunchclub上榜,該公司利用AI預訂網絡會議。一位Cognition的投資者告訴《福布斯》,Wu在2022年離開Lunchclub,因為他的興趣轉向其他領域(Wu拒絕置評),而Lunchclub目前已籌集約3000萬美元,仍在運行中。

“總是存在這種期望與可靠工作之間的差距。”

Codeium的首席執行官Varun Mohan

Cognition在3月推出Devin,受到了廣泛關注。在一段在X平台上獲得3000萬次觀看的演示視頻中,該公司聲稱Devin“成功通過了來自領先AI公司的實踐工程面試”,並完成了雜亂的編碼任務。一些工程師對Devin的技術能力印象深刻;而另一些則對自己的工作感到擔憂。推出不久後,Wu小學時期在數學比賽中表現出色的視頻再次被翻出,網上評論者開玩笑說:“他不是人,他是AI”和“Devin只是Scott在聊天應用中回答你的問題。”

然而,德克薩斯州奧斯汀的知名獨立開發者Carl Brown則發出了質疑。在一段標題為“揭穿Devin”的視頻中,他指責Cognition過度誇大了其AI工程師的能力,該視頻的觀看次數超過50萬。他的評論發現,Devin完成工作的時間遠遠超過人類,並且在過程中引入了錯誤。

這些經歷使一些人質疑Devin是否只是AI炒作泡沫中的又一個噱頭。Labelbox的工程師Krish Manair測試了該工具的Web應用程序創建能力,他表示,當要求其設計一個引人注目的用戶界面時,結果卻顯得平淡無奇。幾位競爭對手的創始人告訴《福布斯》,他們認為該公司在Devin的能力上過度承諾,讓人覺得工程師可以立即使用Devin編寫任何代碼。他們認為,當前的能力範圍狹窄,更適合預定義的任務,如清理現有代碼。在一次現場演示中,《福布斯》要求Devin構建一個調音器應用程序。它在大約10分鐘內完成,但該應用程序無法正確識別測試用的音符,而Cognition的創始人也不清楚原因。“總是存在這種期望與可靠工作之間的差距,”Codeium的首席執行官Varun Mohan說。

Wu承認Devin還遠未完美。“現實世界中的軟件工程非常混亂,”他在Founders Fund的總部俯瞰舊金山灣時說。“人類經常會寫錯誤。”值得一提的是,許多批評者對該工具的能力表示讚賞。Wu聲稱,Devin自推出以來已經顯著改善,部分原因是來自早期企業客戶的反饋,他們似乎接受這一工具還在不斷進步中。“我們不認為這個工具是我們所期待的那種神奇的東西,”Nubank的首席技術官Vitor Olivier說。“我們持謹慎樂觀的態度。”他表示,某些情況下,使用Devin的工程師在工作中速度提升了八倍。

Cognition仍在不斷實驗。今年早些時候,它給Devin新增了啟動下屬AI的能力。但當Cognition測試這種新“管理者”模式時,發現下屬的Devin會啟動自己的下屬,繼而又產生更多的下屬,形成一個龐大且無限的AI官僚體系。“我們最終不得不取消這個任務,因為他們只是在不斷委派工作,”Kaplan說。

不過,Kaplan指出,這個工具在多個Devin同時處理不同項目時效果最佳,就像一支“初級工程師的軍隊”。這個說法可能讓一些從事編碼工作的人感到不安,Wu表示,對Cognition的某些負面情緒來自於人們對AI是否會取代軟件工程工作崗位的焦慮。他認為,Devin能使公司追求更多項目,聘請人類來做更有意義的工作。

“外面確實存在很多恐懼,”他說。“人們對這種新模式下會發生什麼有很多問題。”

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *