人工智能超越人類 智能評估愈趨困難

Ai




AI不斷強大,令判斷模型智能程度變得更困難

由史丹福大學「以人為本人工智能研究所」執行董事羅素·沃爾德(Russell Wald)在新加坡Fortune Brainstorm AI會議上指出,當AI模型的表現已經開始超越人類,研究人員面對的最大挑戰便是如何評估這些模型的智能水平。

沃爾德表示:「截至2024年,幾乎沒有任務類別是人類能力超越AI的,即使有,兩者的差距亦急速縮小。」他強調,AI的能力已經超越人類,令評測標準變得愈來愈難制定。

史丹福HAI每年發布的《AI指數報告》,透過數據全面描繪AI的發展現狀。沃爾德在會議上分享了2025年報告中的幾個重點,包括模型能力大幅提升、產業界在AI領域的主導地位日益鞏固,以及中國有望超越美國成為AI領先者。

以下是羅素·沃爾德於會議的演講內容精簡版:

我是羅素·沃爾德,史丹福大學「以人為本人工智能研究所」執行董事。我們研究所成立於2019年,致力推動AI研究、教育、政策和實踐,目標是引導AI發展造福社會。我們亦是業界、政府及民間社會在AI治理方面值得信賴的合作夥伴。

我們每年發布的《AI指數》是一份基於數據的年度報告,追蹤AI在學術、政府和產業的研究、開發、應用及社會經濟影響。

AI性能每年穩步提升。舉例來說,我們用Midjourney這款文字生成圖像工具,從2022年2月至2024年7月,生成的《哈利波特》圖像質量飛躍提升。2022年時,它只能做出卡通化、失真版本,而2024年已經能創造出逼真得令人驚嘆的形象,從彷如畢加索畫作到猶如電影中丹尼爾·雷德克里夫的寫實肖像。

由於性能持續增強,評估這些模型的標準變得愈來愈難。2024年幾乎沒有任何任務是人類能力勝過AI,並且在圖像識別、競賽級數學、博士級科學問題等領域,AI均已超越人類。

AI從實驗室快速走向日常生活。2023年,美國食品藥品監督管理局批准了223款AI醫療設備,遠超2015年的6款。自動駕駛汽車亦不再是試驗品,例如我在舊金山常搭乘的Waymo每週提供超過15萬次自主駕駛服務;而中國百度的Apollo Go機器人出租車已在多個城市運營。

企業使用AI的熱度自2017至2023年停滯後,近期大幅回升。麥肯錫最新報告指出,78%受訪企業已在至少一個業務範疇開始使用AI,較2023年的55%大幅增加。

同時,隨着更小型但更強大的模型出現,執行類似GPT-3.5水平的推理成本自2022年11月至2024年10月降低了280倍以上。硬件成本每年下降30%,能源效率提升40%。開放權重模型與封閉模型的性能差距也從8%縮小至1.7%,大幅降低了進入先進AI領域的門檻。

然而,儘管推理和硬件成本下降,訓練成本依然高昂,學術界和小型團隊難以負擔。2024年約90%重要AI模型來自企業,較2023年的60%大幅上升。學術界雖然仍是高影響力研究的來源,但在前沿技術層面開始落後。

模型規模迅速擴大。訓練計算力每五個月翻倍,數據集每八個月翻倍,電力消耗每年增加。儘管如此,模型之間的性能差距縮小,排名前十的模型分數差由11.9%降至5.4%,頭兩名模型差距僅0.7%。前沿領域愈趨競爭激烈。

近年來,前沿AI模型的性能趨於一致,數家供應商均提供高性能模型。這與2022年末ChatGPT推出時的市場格局截然不同,當時僅有OpenAI與Google主導市場。

值得一提的是,2017年Google訓練Transformer模型的成本約為9.3萬美元(GPT架構基礎),而如今訓練Gemini Ultra的成本已高達2億美元。

去年《AI指數》首次指出缺乏標準化的AI安全與責任評估指標,並分析了全球公眾對AI的態度。非西方工業化國家對AI的正面評價較高,中國83%、印尼80%、泰國77%,相比之下加拿大40%、美國39%、荷蘭36%。

最後談談地緣政治局勢。美國仍保持AI領先地位,中國緊隨其後,但兩者差距正在縮小。我並非想強調中美AI軍備競賽,而是想指出兩國在AI發展路線上的不同策略。

過去幾年,美國依賴數家專有模型供應商;而中國則大力培養人才,更重要的是建立了開源生態系統。若此趨勢持續,中國有望在模型性能上超越美國。

評論與啟示

羅素·沃爾德的分享揭示了AI技術發展的兩大核心挑戰:一是當AI表現超越人類,傳統的性能評測標準已不敷使用,急需建立更全面、多維度的評估體系,尤其是安全性和倫理責任方面;二是AI研發的資源集中於大型企業,學術界和小型團隊面臨巨大壓力,可能影響創新生態的多元性。

此外,中美在AI競賽中的態勢微妙。中國通過開源策略和人才培養,快速縮小與美國的差距,這不僅是技術層面的較量,更是開放與封閉、協作與壟斷的博弈。這提醒我們,發展AI不僅要看技術本身,更要關注政策環境和生態系統建設。

對香港和整個亞洲地區而言,這種全球AI發展趨勢意味著本地企業和研究機構要加強國際合作與開放創新,避免被邊緣化。同時,政府應該積極制定合理的AI監管政策,平衡技術發展與社會責任,確保AI能真正惠及大眾,而非只服務於少數巨頭。

最後,隨着AI能力日益強大,公眾對AI的態度也呈現地域差異,這顯示文化背景和社會價值觀對AI接受度有深遠影響。未來AI推廣與教育工作需要更具文化敏感性,促進全球範圍內的公平與包容。

總結來說,AI的快速演進帶來前所未有的機遇與挑戰,唯有多方協作、跨界思考,才能在這場技術革命中找到最合適的發展之路。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放

立即升級 🔗