疲憊不堪的波蘭程式員擊敗OpenAI AI模型,贏得世界編程冠軍賽
最近,一名精神和體力幾近透支的波蘭程式員完成了一項或許將來難以再現的壯舉:在一場正面對決的編程比賽中擊敗了OpenAI的先進AI模型。這場長達10小時的編程馬拉松讓他感到「完全筋疲力盡」。
星期三,前OpenAI員工、程式員Przemysław Dębiak(綽號「Psyho」)在東京舉行的AtCoder世界巡迴賽2025啟發式(Heuristic)決賽中,險勝這款定制AI模型。AtCoder是日本一個舉辦競技編程比賽及全球排名的平台,這次比賽可能是首個AI模型直接與頂尖人類程式員同場競技的世界級現場賽事。OpenAI作為贊助商,也派出AI模型參加名為「人類對抗AI」的特別展演賽。儘管AI不知疲倦,但最終只能屈居亞軍。
「人類暫時勝出!」Dębiak在X(前身Twitter)上寫道,他這幾天參加多場比賽,幾乎沒睡覺,「我完全累癱了……幾乎撐不下去。」
這場比賽要求參賽者在600分鐘內解決一個複雜的優化問題,讓人聯想到美國民間故事約翰·亨利(John Henry)與蒸汽鑽機的競賽。就像亨利那場與工業自動化機械的傳奇對決,Dębiak的勝利象徵著人類專家在AI日益強大的時代,仍以極限體力和智慧證明人類技能的重要性。
人類與AI的耐力較量
亨利在鐵軌鑽孔比賽中拼盡全力,最終心臟衰竭而亡;而Dębiak則在幾乎無睡眠狀態下編程10小時,兩者都展現了極限耐力。兩場勝利同時帶有苦澀意味:亨利雖贏卻死於比賽,象徵自動化的不可逆趨勢;Dębiak則承認「暫時」勝利,暗示未來人類仍需面對更強AI的挑戰。
這次AtCoder世界巡迴賽的啟發式賽事,要求選手們解決無法求得完美解的NP難優化問題,只能不斷尋求更優解方案。
編程馬拉松考驗人類耐力與AI效率
AtCoder世界巡迴賽是競技編程界極具聲望的賽事,只邀請過去一年表現最好的12名頂尖程式員參加。啟發式組專注於NP-hard問題,這類問題需要利用啟發式技巧,即利用捷徑與經驗判斷,尋找「足夠好」的解決方案,因為完美答案往往計算成本過高。
所有參賽者,包括OpenAI,均使用AtCoder統一提供的硬件,確保人類與AI在相同條件下競爭。根據比賽規則,參賽者可使用AtCoder支持的任何程式語言,提交無限次,但每次提交後須等待五分鐘。
最終,Psyho以1,812,272,558,909分奪冠,OpenAI的模型(名為OpenAIAHC)以1,654,675,725,406分緊隨其後,分差約9.5%。這款類似於o3的定制模擬推理模型,位列第二,超過其他10名通過年度排名晉級的頂尖人類程式員。
OpenAI表示,這是AI模型在競技編程領域的重要里程碑。「像o3這樣的模型已能進入編程和數學比賽的前100名,但據我們所知,這是首次在頂級編程數學賽中獲得前三名。」公司發言人通過電郵向Ars Technica表示,「AtCoder這類賽事讓我們測試模型在策略推理、長期規劃和通過反覆試錯改善方案的能力——這些都類似人類的思考過程。」
AI編程能力迅速提升
雖然OpenAI對比賽結果的評價顯得樂觀,但不可否認的是,近年來許多AI模型在完成編程任務上的表現顯著提升。斯坦福大學2025年AI指數報告指出,在SWE-bench編程能力基準測試中,AI系統在2023年僅解決了4.4%的問題,到了2024年則躍升至71.7%。
編程已成為OpenAI、Anthropic、Google和Meta等公司聊天機械人最常用的功能之一。GitHub Copilot和Cursor等工具已成為許多專業開發者的標準配備。GitHub 2024年調查顯示,超過九成開發者在工作流程中使用AI輔助編程工具。不過,近期研究指出,AI工具未必如預期般大幅節省開發時間,甚至可能讓開發速度降低近19%。
儘管如此,隨著AI模型在編程能力上日益精進,Dębiak的這場勝利更像是一個值得關注的數據點,而非永久的勝利。與亨利的悲壯勝利不同,這位程式員還能繼續挑戰未來,儘管下一次可能面對更快更強的AI對手。
「老實說,這股熱潮感覺有點奇怪,」Dębiak在X上說,「從沒想過會有這麼多人關注編程比賽。」
目前,人類在尋找意想不到解決方案的能力仍無可替代。但隨著OpenAI和其他公司持續優化模型,未來AtCoder的參賽者可能更多是與AI並肩作戰,甚至可能不再有純人類選手參賽。
—
評論與啟示
這場人類程式員與AI模型的激烈對決,不僅是科技實力的較量,更是人類智慧與機械效率的象徵性較勁。Dębiak的勝利提醒我們,儘管AI已強大到能在複雜任務上與人類匹敵,人類的創造力、直覺和持久力仍具備無可替代的價值。
然而,這場比賽也揭示了未來競技編程的趨勢可能將逐漸轉向人機合作,而非純粹競爭。當AI工具成為開發者日常工作的一部分,如何有效整合人類的創新思維和AI的高速計算,將是下一波技術革命的關鍵。
同時,這次比賽也讓我們反思人類在面對AI挑戰時的心理與體力負荷,Dębiak「幾乎撐不下去」的狀態,象徵著人類極限的考驗。未來,如何在保持競技精神的同時保障參賽者的健康,亦是賽事組織者應重視的課題。
總括而言,這場「人類對抗AI」的編程馬拉松,不僅是技術的里程碑,更是對人類智慧、耐力與精神的深刻詮釋。面對日益強大的AI,我們應該珍惜並發揮人類獨有的優勢,同時積極探索與AI共生共進的新模式,這才是未來科技與人文共榮的真正出路。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。