人工智能超越人類智能評估愈趨困難

zero comment

AI不斷強大，令判斷模型智能程度變得更困難

由史丹福大學「以人為本人工智能研究所」執行董事羅素·沃爾德（Russell Wald）在新加坡Fortune Brainstorm AI會議上指出，當AI模型的表現已經開始超越人類，研究人員面對的最大挑戰便是如何評估這些模型的智能水平。

沃爾德表示：「截至2024年，幾乎沒有任務類別是人類能力超越AI的，即使有，兩者的差距亦急速縮小。」他強調，AI的能力已經超越人類，令評測標準變得愈來愈難制定。

史丹福HAI每年發布的《AI指數報告》，透過數據全面描繪AI的發展現狀。沃爾德在會議上分享了2025年報告中的幾個重點，包括模型能力大幅提升、產業界在AI領域的主導地位日益鞏固，以及中國有望超越美國成為AI領先者。

—

以下是羅素·沃爾德於會議的演講內容精簡版：

我是羅素·沃爾德，史丹福大學「以人為本人工智能研究所」執行董事。我們研究所成立於2019年，致力推動AI研究、教育、政策和實踐，目標是引導AI發展造福社會。我們亦是業界、政府及民間社會在AI治理方面值得信賴的合作夥伴。

我們每年發布的《AI指數》是一份基於數據的年度報告，追蹤AI在學術、政府和產業的研究、開發、應用及社會經濟影響。

AI性能每年穩步提升。舉例來說，我們用Midjourney這款文字生成圖像工具，從2022年2月至2024年7月，生成的《哈利波特》圖像質量飛躍提升。2022年時，它只能做出卡通化、失真版本，而2024年已經能創造出逼真得令人驚嘆的形象，從彷如畢加索畫作到猶如電影中丹尼爾·雷德克里夫的寫實肖像。

由於性能持續增強，評估這些模型的標準變得愈來愈難。2024年幾乎沒有任何任務是人類能力勝過AI，並且在圖像識別、競賽級數學、博士級科學問題等領域，AI均已超越人類。

AI從實驗室快速走向日常生活。2023年，美國食品藥品監督管理局批准了223款AI醫療設備，遠超2015年的6款。自動駕駛汽車亦不再是試驗品，例如我在舊金山常搭乘的Waymo每週提供超過15萬次自主駕駛服務；而中國百度的Apollo Go機器人出租車已在多個城市運營。

企業使用AI的熱度自2017至2023年停滯後，近期大幅回升。麥肯錫最新報告指出，78%受訪企業已在至少一個業務範疇開始使用AI，較2023年的55%大幅增加。

同時，隨着更小型但更強大的模型出現，執行類似GPT-3.5水平的推理成本自2022年11月至2024年10月降低了280倍以上。硬件成本每年下降30%，能源效率提升40%。開放權重模型與封閉模型的性能差距也從8%縮小至1.7%，大幅降低了進入先進AI領域的門檻。

然而，儘管推理和硬件成本下降，訓練成本依然高昂，學術界和小型團隊難以負擔。2024年約90%重要AI模型來自企業，較2023年的60%大幅上升。學術界雖然仍是高影響力研究的來源，但在前沿技術層面開始落後。

模型規模迅速擴大。訓練計算力每五個月翻倍，數據集每八個月翻倍，電力消耗每年增加。儘管如此，模型之間的性能差距縮小，排名前十的模型分數差由11.9%降至5.4%，頭兩名模型差距僅0.7%。前沿領域愈趨競爭激烈。

近年來，前沿AI模型的性能趨於一致，數家供應商均提供高性能模型。這與2022年末ChatGPT推出時的市場格局截然不同，當時僅有OpenAI與Google主導市場。

值得一提的是，2017年Google訓練Transformer模型的成本約為9.3萬美元（GPT架構基礎），而如今訓練Gemini Ultra的成本已高達2億美元。

去年《AI指數》首次指出缺乏標準化的AI安全與責任評估指標，並分析了全球公眾對AI的態度。非西方工業化國家對AI的正面評價較高，中國83%、印尼80%、泰國77%，相比之下加拿大40%、美國39%、荷蘭36%。

最後談談地緣政治局勢。美國仍保持AI領先地位，中國緊隨其後，但兩者差距正在縮小。我並非想強調中美AI軍備競賽，而是想指出兩國在AI發展路線上的不同策略。

過去幾年，美國依賴數家專有模型供應商；而中國則大力培養人才，更重要的是建立了開源生態系統。若此趨勢持續，中國有望在模型性能上超越美國。

—

評論與啟示

羅素·沃爾德的分享揭示了AI技術發展的兩大核心挑戰：一是當AI表現超越人類，傳統的性能評測標準已不敷使用，急需建立更全面、多維度的評估體系，尤其是安全性和倫理責任方面；二是AI研發的資源集中於大型企業，學術界和小型團隊面臨巨大壓力，可能影響創新生態的多元性。

此外，中美在AI競賽中的態勢微妙。中國通過開源策略和人才培養，快速縮小與美國的差距，這不僅是技術層面的較量，更是開放與封閉、協作與壟斷的博弈。這提醒我們，發展AI不僅要看技術本身，更要關注政策環境和生態系統建設。

對香港和整個亞洲地區而言，這種全球AI發展趨勢意味著本地企業和研究機構要加強國際合作與開放創新，避免被邊緣化。同時，政府應該積極制定合理的AI監管政策，平衡技術發展與社會責任，確保AI能真正惠及大眾，而非只服務於少數巨頭。

最後，隨着AI能力日益強大，公眾對AI的態度也呈現地域差異，這顯示文化背景和社會價值觀對AI接受度有深遠影響。未來AI推廣與教育工作需要更具文化敏感性，促進全球範圍內的公平與包容。

總結來說，AI的快速演進帶來前所未有的機遇與挑戰，唯有多方協作、跨界思考，才能在這場技術革命中找到最合適的發展之路。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Download TXT

🖼️ AI 圖庫｜抄咒語學玩法

想睇吓人哋點玩 AI 畫圖？圖庫集合大量 Flux / Gemini 作品，可以一 click 複製咒語，直入生成器再改做自己版本。

人工智能超越人類智能評估愈趨困難

🖼️ AI 圖庫｜抄咒語學玩法

chatgpt

🎬 YouTube Premium 家庭 Plan成員一位只需 HK$148/年！

人工智能超越人類 智能評估愈趨困難

🖼️ AI 圖庫｜抄咒語學玩法

chatgpt

Related Articles

AI聊天機械人Grok大亂鬥 混淆Bondi槍擊事件真相

AI革新企業決策：由「買」轉「先造」新思維

Ottocast AI盒子＋無線轉接 車載智能升級新選擇

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年！

人工智能超越人類智能評估愈趨困難

AI聊天機械人Grok大亂鬥混淆Bondi槍擊事件真相

Ottocast AI盒子＋無線轉接車載智能升級新選擇

🎬 YouTube Premium 家庭 Plan成員一位只需 HK$148/年！