MIT破解AI編程障礙與人類共創軟件未來

zero comment

人工智能真係可以寫程式碼？MIT研究團隊揭示自動化軟件工程面臨嘅挑戰

麻省理工學院（MIT）嘅計算機科學與人工智能實驗室（CSAIL）同多間合作機構嘅研究團隊，最近發表咗一篇名為《Challenges and Paths Towards AI for Software Engineering》（人工智能軟件工程嘅挑戰與發展路徑）嘅論文，全面剖析咗AI喺軟件開發中唔止係代碼生成嘅多重任務，指出現時嘅瓶頸，並提出未來嘅研究方向，期望可以令AI幫人類自動化處理日常嘅繁瑣工作，讓人類工程師專注於高層次嘅設計與創新。

軟件工程唔止係寫代碼，AI自動化仍有好大挑戰

MIT電腦科學與電機工程教授、CSAIL首席研究員Armando Solar-Lezama話：「而家大家成日講住將來唔使程序員，AI可以自動完成所有嘢，雖然呢個領域已經有好大進步，工具亦比以前強好多，但要完全實現自動化嘅願景，仲有好長嘅路要行。」

佢指出，大家對軟件工程嘅認識經常縮窄到好淺嘅程度，好似只係大學生嘅編程練習，或者係解決LeetCode嘅面試題。但實際嘅軟件工程遠比呢啲複雜得多，包涵咗日常重構、設計優化、大規模遷移（例如將幾百萬行COBOL代碼轉換成Java），以及持續嘅測試同分析工作，包括模糊測試、屬性測試等方法，去捕捉並修補併發錯誤或零日漏洞。仲有維護工作，好似記錄舊代碼、總結變更歷史、審查拉取請求，確保代碼風格、性能同安全。

現時業界用來衡量AI寫代碼能力嘅標準，諸如SWE-Bench，都係叫AI去修補GitHub嘅小問題，呢啲測試通常只涉及幾百行代碼，忽略咗大型項目嘅複雜情況，例如AI輔助重構、AI與人類配對編程、甚至涉及數百萬行代碼嘅性能優化。呢啲評估指標未能涵蓋真實世界中高風險嘅場景，令進展嘅測量同加速變得困難。

人機溝通同規模挑戰：AI未能掌握大型代碼庫嘅獨特性

論文第一作者、MIT研究生Alex Gu表示，現時AI同人類嘅互動仍然非常有限。當佢叫AI生成代碼時，通常會得到一大堆無結構嘅文件同埋幾個單元測試，但呢啲測試多數只係表面嘅，未能深入驗證代碼嘅真實正確性。更嚴重係，AI未能有效利用人類常用嘅各種軟件工程工具，例如調試器、靜態分析器，喺控制同理解方面仍有欠缺。Gu話：「我冇辦法控制AI寫啲咩，亦缺乏一個渠道俾AI表達佢嘅信心程度，例如‘呢部分係正確，呢部分可能要再檢查’。冇呢啲溝通，開發者可能會盲目相信AI生成嘅代碼，雖然睇落合理，但喺生產環境中可能會崩潰。AI知道幾時要搵人類澄清，係另一個重要嘅問題。」

此外，AI模型對大型代碼庫嘅掌握非常有限。現時嘅基礎模型主要係喺公開GitHub代碼訓練，但每間公司嘅代碼庫都獨一無二，有自己嘅規範同風格，呢啲都係AI訓練數據集之外嘅範疇。結果係，AI生成嘅代碼雖然睇落合理，但可能調用咗不存在嘅函數，違反內部代碼規範，或者無法通過持續集成測試。呢種現象叫做「幻覺」（hallucination），即AI自創內容但同公司內部實際需求唔符。

Solar-Lezama亦指出，AI檢索代碼時，經常因為只揀相似語法嘅代碼，而唔係相似功能同邏輯，導致檢索結果唔準確。「標準檢索技術好容易被外觀相似但功能完全唔同嘅代碼欺騙。」

呼籲業界合作，推動軟件工程AI研究前行

論文作者強調，面對呢啲多重難題，冇一個「銀彈」解決方案，必須靠社群規模嘅努力。包括收集更豐富嘅開發過程數據（例如開發者保留或棄用嘅代碼、代碼隨時間嘅重構情況）、建立共享嘅評估套件（評估重構質量、bug修復持久性、遷移正確性），以及開發透明嘅工具，讓AI能夠表達不確定性，並邀請人類指導，而非被動接受。

Gu形容呢個研究方向係一個「行動呼籲」，希望建立更大規模嘅開源合作，係單一實驗室難以完成嘅工作。Solar-Lezama則期待未來有逐步嘅研究成果，逐一攻克挑戰，再反饋入商業工具，令AI由自動補全嘅助手，真正進化成為軟件工程嘅合作夥伴。

Gu話：「點解呢啲嘢咁重要？軟件已經支撐住金融、交通、醫療同日常生活嘅方方面面，而人力建設同維護呢啲系統嘅成本已經成為瓶頸。一個能夠承擔繁重工作、同時唔引入隱藏錯誤嘅AI，能夠釋放開發者嘅創造力、策略同倫理思考。但呢個未來，係建立喺承認代碼補全只係易事，真正困難嘅係其他所有環節。我哋目標唔係取代程序員，而係放大佢哋嘅能力。當AI可以處理繁瑣同繁重嘅任務，人類工程師先可以專注於只有人類先做得到嘅工作。」

業界專家評價與展望

未參與研究嘅AI科學家Baptiste Rozière表示，喺AI寫代碼領域，社群經常追逐最新潮流，難以靜下心來反思最重要嘅問題。佢讚賞呢篇論文清晰概述咗AI軟件工程嘅關鍵任務同挑戰，並提出未來研究嘅有希望方向。

呢項研究獲得美國國家科學基金會（NSF）、SKY Lab工業贊助商、英特爾公司等支持，並將喺國際機器學習會議（ICML）發表。

—

評論與啟示：

呢篇MIT嘅研究論文為AI喺軟件工程嘅應用提供咗一個全面而深刻嘅視角，提醒我哋自動化寫代碼背後嘅複雜性遠超出表面。現時坊間對AI能取代程序員嘅誇大宣傳，往往忽略咗軟件開發中大量嘅隱性工作，包括重構、測試、維護同跨平台遷移等。呢啲都係AI目前未能完全掌握嘅領域。

特別係人機溝通問題，AI未能有效表達自信度或不確定性，導致開發者易受誤導，增加生產環境故障風險。呢點喺香港甚至全球軟件業都非常關鍵，因為一旦錯誤代碼被大量投入生產，可能帶來嚴重後果，尤其係金融、醫療等敏感領域。

另外，AI對大型、專有代碼庫嘅適應性不足，反映出未來AI模型需要更多針對企業內部環境嘅定制與學習能力。這意味著企業需要投入更多資源進行數據管理與模型訓練，或者依賴更開放嘅合作社群，共享開發過程嘅實際數據，推動行業標準化。

從香港市場角度睇，軟件行業規模雖然較矮，但金融科技、智慧城市等領域對軟件質量與安全要求極高，AI輔助工具嘅成熟度直接影響競爭力與風險控制。未來香港本地公司可考慮積極參與國際科研項目，或推動本地開源生態，培養符合本地需求嘅AI軟件工程解決方案。

總括而言，AI寫程式嘅未來唔係取代人類，而係成為人類工程師嘅強大助手，替代繁瑣同重複性工作，釋放人類嘅創造力同判斷力。呢篇論文為業界指明咗清晰嘅挑戰與路徑，值得所有關注軟件工程未來嘅開發者、企業同政策制定者深入思考同參與。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Download TXT

🖼️ AI 圖庫｜抄咒語學玩法

想睇吓人哋點玩 AI 畫圖？圖庫集合大量 Flux / Gemini 作品，可以一 click 複製咒語，直入生成器再改做自己版本。

$Drone photo near Christ the Redeemer in Rio. Include a close-up of the tourist using {reference_image} as the face, standing at the viewpoint. He wears a casual t-shirt, shorts, and sneakers. Drone hovers slightly in front and above him, capturing both his face clearly and the giant statue towering behind.$ Gallery

Replace the words in the bottom by ‘tantamount Deco’

Gallery

$A selfie taken inside the Roman Colosseum. Insert {reference_image} as the face. He wears a button-down shirt and jeans, smiling as he holds the phone up. Sunbeams shine through the arches behind him. The face is sharp, centered, and well lit.$ Gallery

MIT破解AI編程障礙與人類共創軟件未來

🖼️ AI 圖庫｜抄咒語學玩法

chatgpt

✨🎱 Instagram留言 →

AI即回覆下期六合彩預測

MIT破解AI編程障礙 與人類共創軟件未來

🖼️ AI 圖庫｜抄咒語學玩法

chatgpt

Related Articles

紐約簽署AI安全法 力阻特朗普干預

清潔能源最新趨勢：科技點亮綠色未來

特朗普能源部長力推全美數據中心能源覆蓋新策略

✨🎱 Instagram留言 →

AI即回覆下期六合彩預測

MIT破解AI編程障礙與人類共創軟件未來

紐約簽署AI安全法力阻特朗普干預