谷歌OpenAI AI數學奧林匹克奪金新紀錄

Google與OpenAI的人工智能模型於國際數學奧林匹克獲得金牌

路透社報導,Alphabet旗下的Google及OpenAI宣稱,他們的人工智能(AI)模型在全球數學比賽——國際數學奧林匹克(IMO)中獲得金牌,標誌著AI在數學能力上的一大突破,展示出與人類智慧比肩的潛力。

這是AI系統首次在高中生參加的IMO中,達到金牌得分標準。兩家公司的模型均成功解決了六道題目中的五道,並且是利用通用的「推理」模型,以自然語言處理數學概念,與以往AI公司使用的專門方法截然不同。

Google DeepMind與IMO官方合作,讓他們的模型由比賽委員會評分並認證,而OpenAI則沒有正式參賽。OpenAI於週六公開表示,他們的模型在今年的IMO問題中達到了金牌水準,並引用了三位外部IMO金牌得主的評分作為依據。

布朗大學數學教授兼Google DeepMind訪問研究員鄭俊赫(Junehyuk Jung)指出,這一成就表明,AI距離幫助數學家解決前沿未解研究問題不到一年時間。他說:「我認為當我們能夠用自然語言解決困難的推理問題時,AI與數學家之間的合作潛力將被充分釋放。」

OpenAI的突破來自一款新實驗性模型,核心在於大幅擴展「測試時計算能力」,即讓模型可以「思考」更長時間,並利用平行計算同時進行多條推理線路。OpenAI研究員Noam Brown透露,這種方法非常昂貴,但沒有透露具體耗費多少計算資源。

對OpenAI的研究團隊來說,這是AI具備廣泛推理能力的又一明顯證據,且這種能力有望延伸至數學以外的其他領域。Google的研究員也持同樣樂觀態度,鄭俊赫表示,這些AI模型的能力同樣可應用於物理學等其他研究難題。鄭本人在2003年也是IMO金牌得主。

今年第66屆IMO於澳洲昆士蘭陽光海岸舉行,630名參賽學生中約有67人(約11%)達到金牌水準。去年Google DeepMind使用針對數學專門設計的AI系統獲得銀牌,今年則採用通用模型Gemini Deep Think(該模型於5月的開發者大會首次亮相)。

與過往依賴正式語言和冗長計算的AI方法不同,Google今年的模型完全用自然語言操作,並在官方4.5小時的時間限制內完成解題,DeepMind在其官方博客中表示。

OpenAI則基於自家的推理模型,打造了一個實驗版本參賽。研究員Alexander Wei在社交平台X上透露,公司暫時不打算在未來幾個月內公開這種高數學能力的模型。

今年是IMO首次正式與部分AI開發者協作,這些開發者多年來一直利用IMO等著名數學比賽來測試模型能力。IMO評委認證了包括Google在內多家公司的結果,並要求他們在7月28日公布成績。

Google DeepMind執行長Demis Hassabis週一在X上表示:「我們尊重IMO董事會的原始要求,所有AI實驗室在官方成績經獨立專家驗證並且學生們獲得應有的讚譽之前,只能分享結果。」

OpenAI於週六率先公布了金牌成績,並表示經過IMO董事會成員許可才在閉幕式後公開。IMO董事會主席Gregor Dolinar告訴路透社,週一比賽正式允許合作公司公布結果。

個人評論與啟示

這次Google與OpenAI在IMO取得金牌的成就,標誌著AI在數學推理和問題解決領域的質變,不再只是基於符號計算或特定領域專家的規則,而是透過自然語言理解和推理,展現出更接近人類智慧的靈活性和深度。這種突破不僅讓AI在數學界掀起波瀾,更為跨學科的科學研究帶來無限可能。

鄭俊赫教授提及的「AI與數學家合作」願景,實際上是未來科研工作模式的一大轉變。當AI能理解並推動複雜理論發展,科學家們將更像是「指揮官」,引導AI探索未知領域,這將大幅提升研究效率和創新速度。

然而,OpenAI所採用的「測試時計算大規模擴展」方法,雖然帶來高效推理,但伴隨的是巨大的計算成本和能源消耗。這提示我們,未來AI技術的可持續發展必須在性能與資源間取得平衡,否則將難以普及應用。

此外,AI在數學比賽中達到人類頂尖水平,是否會對教育和人才培養模式帶來挑戰與變革?學生與教師將如何與這些強大工具共存,並發揮人類獨特的創造力,這是教育界需要深思的問題。

總括而言,這項成就不只是技術突破,更是AI與人類智慧共生的前奏,未來無論是數學、物理,抑或更廣泛的科學研究,都將迎來一場由AI推動的革命。香港的科學教育與科技產業,也應密切關注並積極布局,迎接這個新時代的挑戰與機遇。

以上文章由特價GPT API KEY所翻譯及撰寫。

📣 即刻用 Google Workspace|唔使vpn都能享用 Google AI Pro

即使你只係一個人,都可以透過 Google Workspace 使用 官方Gemini AI Pro(原價 HK$160), 而在 Google Workspace 只要 HK$131 / 月

🔓 14 天免費試用
🔖 用呢條連結申請再有 額外 9 折
🇭🇰 香港可直接付款(香港信用卡)
🛡️ 不用 VPN,立即開用
🤖 可用 最新最紅Gemini 3 Pro & Nano Banana Pro
👉 立即登記 14 天免費試用 + 額外 9 折