Google與OpenAI的人工智能模型在全球數學競賽奪金牌,展現數學能力新突破
路透社報道,Alphabet旗下的Google和OpenAI宣稱,他們的人工智能(AI)模型在一項全球數學競賽中獲得金牌,標誌著在數學能力方面取得了重大突破,推動AI系統向媲美人類智慧的方向邁進。
這次成績是AI系統首次在國際數學奧林匹克(IMO)——一項針對高中生的頂級數學競賽——達到金牌得分標準。兩家公司的AI模型均解答了六題中五題難題,並且是以通用的「推理」模型,用自然語言處理數學概念,與以往AI公司採用的傳統方法截然不同。
布朗大學數學教授兼Google DeepMind AI部門訪問研究員鄭俊赫(Junehyuk Jung)表示,這一成就顯示,AI距離被數學家用來破解尚未解決的研究問題僅有不到一年的時間。
鄭教授對路透說:「我認為當我們能用自然語言解決複雜推理問題的時候,就能開啟AI與數學家合作的新契機。」
OpenAI的突破來自一個實驗性的新模型,核心在於大幅提升「測試時計算能力」(test-time compute)。研究員Noam Brown指出,這是通過讓模型有更長時間「思考」,並利用並行計算同時執行多條推理線路實現的。Brown沒有透露這背後的計算成本,但表示「非常昂貴」。
對OpenAI團隊來說,這是AI模型擁有廣泛推理能力的又一明顯證據,這種能力未來或可擴展至數學以外的其他領域。
Google研究員同樣對此抱有樂觀態度,認為AI模型的能力可應用於物理學等其他領域的科研難題。鄭俊赫本人在2003年也曾獲得IMO金牌。
在今年於澳洲昆士蘭陽光海岸舉行的第66屆IMO中,630名參賽者中有67人(約11%)取得金牌成績。
去年,Google旗下的DeepMind AI部門曾憑專門針對數學的AI系統贏得銀牌。今年,Google則採用一款名為Gemini Deep Think的通用模型,該版本已於五月的年度開發者大會上亮相。
與過去依賴形式語言和長時間計算的AI嘗試不同,Google今年的模型完全用自然語言操作,並在官方4.5小時的規定時間內完成解題,該公司在博客中表示。
OpenAI也有一套推理模型,並為本次競賽打造了實驗性版本。研究員Alexander Wei在社交平台X(前身Twitter)上透露,該公司暫無計劃在未來數月內推出具備此數學能力的產品。
今年是該競賽首次與部分AI開發商正式合作,這些公司多年來一直利用IMO等頂尖數學賽事來測試模型能力。IMO的評委認證了這些公司的成績,包括Google,並要求他們在7月28日公開結果。
Google DeepMind執行長Demis Hassabis在X上表示:「我們尊重IMO理事會的原始要求,即所有AI實驗室必須在官方成績經獨立專家核實、學生們獲得應有讚譽後,才公開他們的結果。」
OpenAI則在週六公開了結果,並表示已獲得IMO理事會成員的許可於閉幕式後發布。
IMO理事會主席Gregor Dolinar向路透透露,週一競賽方允許合作公司發布結果。
—
評論與啟示:AI數學能力的突破,未來科研合作新篇章
這次Google與OpenAI在國際數學奧林匹克賽事中取得金牌成績,不僅是AI技術在數學領域的一大飛躍,更象徵著AI推理能力達到了一個新的高度。過去AI在數學上多依賴嚴謹的形式語言和繁複計算,這次則是利用自然語言理解和通用推理模型,這種方法更貼近人類思考方式,也更靈活。
這種突破意味著AI未來不僅能輔助解決教科書上的數學問題,還可能成為數學家解決尚未攻克的難題的強大助手。更重要的是,這種推理能力將可能跨界應用到物理、化學等其他科學領域,促進跨學科的科研革命。
然而,OpenAI提及的「非常昂貴」的計算成本也提醒我們,這種高性能AI模型背後的資源需求龐大,如何在推廣和商業化過程中實現效益最大化,仍是業界要面對的挑戰。
此外,IMO官方首次與AI公司合作,並嚴格審核成績,展現了對AI技術的謹慎態度,也為未來AI在教育和競賽領域的應用樹立了良好典範。
總括而言,這次突破不僅是技術上的里程碑,更是人類與AI在智力合作上邁向新階段的象徵。香港及全球的科研界應密切關注這股潮流,積極探索如何融合AI智慧,推動創新與發展。
以上文章由特價GPT API KEY所翻譯及撰寫。