MIT破解AI編程障礙 與人類共創軟件未來

Ai




人工智能真係可以寫程式碼?MIT研究團隊揭示自動化軟件工程面臨嘅挑戰

麻省理工學院(MIT)嘅計算機科學與人工智能實驗室(CSAIL)同多間合作機構嘅研究團隊,最近發表咗一篇名為《Challenges and Paths Towards AI for Software Engineering》(人工智能軟件工程嘅挑戰與發展路徑)嘅論文,全面剖析咗AI喺軟件開發中唔止係代碼生成嘅多重任務,指出現時嘅瓶頸,並提出未來嘅研究方向,期望可以令AI幫人類自動化處理日常嘅繁瑣工作,讓人類工程師專注於高層次嘅設計與創新。

軟件工程唔止係寫代碼,AI自動化仍有好大挑戰

MIT電腦科學與電機工程教授、CSAIL首席研究員Armando Solar-Lezama話:「而家大家成日講住將來唔使程序員,AI可以自動完成所有嘢,雖然呢個領域已經有好大進步,工具亦比以前強好多,但要完全實現自動化嘅願景,仲有好長嘅路要行。」

佢指出,大家對軟件工程嘅認識經常縮窄到好淺嘅程度,好似只係大學生嘅編程練習,或者係解決LeetCode嘅面試題。但實際嘅軟件工程遠比呢啲複雜得多,包涵咗日常重構、設計優化、大規模遷移(例如將幾百萬行COBOL代碼轉換成Java),以及持續嘅測試同分析工作,包括模糊測試、屬性測試等方法,去捕捉並修補併發錯誤或零日漏洞。仲有維護工作,好似記錄舊代碼、總結變更歷史、審查拉取請求,確保代碼風格、性能同安全。

現時業界用來衡量AI寫代碼能力嘅標準,諸如SWE-Bench,都係叫AI去修補GitHub嘅小問題,呢啲測試通常只涉及幾百行代碼,忽略咗大型項目嘅複雜情況,例如AI輔助重構、AI與人類配對編程、甚至涉及數百萬行代碼嘅性能優化。呢啲評估指標未能涵蓋真實世界中高風險嘅場景,令進展嘅測量同加速變得困難。

人機溝通同規模挑戰:AI未能掌握大型代碼庫嘅獨特性

論文第一作者、MIT研究生Alex Gu表示,現時AI同人類嘅互動仍然非常有限。當佢叫AI生成代碼時,通常會得到一大堆無結構嘅文件同埋幾個單元測試,但呢啲測試多數只係表面嘅,未能深入驗證代碼嘅真實正確性。更嚴重係,AI未能有效利用人類常用嘅各種軟件工程工具,例如調試器、靜態分析器,喺控制同理解方面仍有欠缺。Gu話:「我冇辦法控制AI寫啲咩,亦缺乏一個渠道俾AI表達佢嘅信心程度,例如‘呢部分係正確,呢部分可能要再檢查’。冇呢啲溝通,開發者可能會盲目相信AI生成嘅代碼,雖然睇落合理,但喺生產環境中可能會崩潰。AI知道幾時要搵人類澄清,係另一個重要嘅問題。」

此外,AI模型對大型代碼庫嘅掌握非常有限。現時嘅基礎模型主要係喺公開GitHub代碼訓練,但每間公司嘅代碼庫都獨一無二,有自己嘅規範同風格,呢啲都係AI訓練數據集之外嘅範疇。結果係,AI生成嘅代碼雖然睇落合理,但可能調用咗不存在嘅函數,違反內部代碼規範,或者無法通過持續集成測試。呢種現象叫做「幻覺」(hallucination),即AI自創內容但同公司內部實際需求唔符。

Solar-Lezama亦指出,AI檢索代碼時,經常因為只揀相似語法嘅代碼,而唔係相似功能同邏輯,導致檢索結果唔準確。「標準檢索技術好容易被外觀相似但功能完全唔同嘅代碼欺騙。」

呼籲業界合作,推動軟件工程AI研究前行

論文作者強調,面對呢啲多重難題,冇一個「銀彈」解決方案,必須靠社群規模嘅努力。包括收集更豐富嘅開發過程數據(例如開發者保留或棄用嘅代碼、代碼隨時間嘅重構情況)、建立共享嘅評估套件(評估重構質量、bug修復持久性、遷移正確性),以及開發透明嘅工具,讓AI能夠表達不確定性,並邀請人類指導,而非被動接受。

Gu形容呢個研究方向係一個「行動呼籲」,希望建立更大規模嘅開源合作,係單一實驗室難以完成嘅工作。Solar-Lezama則期待未來有逐步嘅研究成果,逐一攻克挑戰,再反饋入商業工具,令AI由自動補全嘅助手,真正進化成為軟件工程嘅合作夥伴。

Gu話:「點解呢啲嘢咁重要?軟件已經支撐住金融、交通、醫療同日常生活嘅方方面面,而人力建設同維護呢啲系統嘅成本已經成為瓶頸。一個能夠承擔繁重工作、同時唔引入隱藏錯誤嘅AI,能夠釋放開發者嘅創造力、策略同倫理思考。但呢個未來,係建立喺承認代碼補全只係易事,真正困難嘅係其他所有環節。我哋目標唔係取代程序員,而係放大佢哋嘅能力。當AI可以處理繁瑣同繁重嘅任務,人類工程師先可以專注於只有人類先做得到嘅工作。」

業界專家評價與展望

未參與研究嘅AI科學家Baptiste Rozière表示,喺AI寫代碼領域,社群經常追逐最新潮流,難以靜下心來反思最重要嘅問題。佢讚賞呢篇論文清晰概述咗AI軟件工程嘅關鍵任務同挑戰,並提出未來研究嘅有希望方向。

呢項研究獲得美國國家科學基金會(NSF)、SKY Lab工業贊助商、英特爾公司等支持,並將喺國際機器學習會議(ICML)發表。

評論與啟示:

呢篇MIT嘅研究論文為AI喺軟件工程嘅應用提供咗一個全面而深刻嘅視角,提醒我哋自動化寫代碼背後嘅複雜性遠超出表面。現時坊間對AI能取代程序員嘅誇大宣傳,往往忽略咗軟件開發中大量嘅隱性工作,包括重構、測試、維護同跨平台遷移等。呢啲都係AI目前未能完全掌握嘅領域。

特別係人機溝通問題,AI未能有效表達自信度或不確定性,導致開發者易受誤導,增加生產環境故障風險。呢點喺香港甚至全球軟件業都非常關鍵,因為一旦錯誤代碼被大量投入生產,可能帶來嚴重後果,尤其係金融、醫療等敏感領域。

另外,AI對大型、專有代碼庫嘅適應性不足,反映出未來AI模型需要更多針對企業內部環境嘅定制與學習能力。這意味著企業需要投入更多資源進行數據管理與模型訓練,或者依賴更開放嘅合作社群,共享開發過程嘅實際數據,推動行業標準化。

從香港市場角度睇,軟件行業規模雖然較矮,但金融科技、智慧城市等領域對軟件質量與安全要求極高,AI輔助工具嘅成熟度直接影響競爭力與風險控制。未來香港本地公司可考慮積極參與國際科研項目,或推動本地開源生態,培養符合本地需求嘅AI軟件工程解決方案。

總括而言,AI寫程式嘅未來唔係取代人類,而係成為人類工程師嘅強大助手,替代繁瑣同重複性工作,釋放人類嘅創造力同判斷力。呢篇論文為業界指明咗清晰嘅挑戰與路徑,值得所有關注軟件工程未來嘅開發者、企業同政策制定者深入思考同參與。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

✨🎱 Instagram留言 →

AI即回覆下期六合彩預測

🧠 AI 根據統計數據即時生成分析

💬 只要留言,AI就會即刻覆你心水組合

🎁 完!全!免!費!快啲嚟玩!

IG 貼文示意圖 AI 即時回覆示意圖

下期頭獎號碼

📲 去 Instagram 即刻留言