人工智能超越人類 智能評估愈趨困難

Ai

🎬 YouTube Premium 家庭 Plan成員一位 只需
HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放


立即升級 🔗

AI不斷強大,令判斷模型智能程度變得更困難

由史丹福大學「以人為本人工智能研究所」執行董事羅素·沃爾德(Russell Wald)在新加坡Fortune Brainstorm AI會議上指出,當AI模型的表現已經開始超越人類,研究人員面對的最大挑戰便是如何評估這些模型的智能水平。

沃爾德表示:「截至2024年,幾乎沒有任務類別是人類能力超越AI的,即使有,兩者的差距亦急速縮小。」他強調,AI的能力已經超越人類,令評測標準變得愈來愈難制定。

史丹福HAI每年發布的《AI指數報告》,透過數據全面描繪AI的發展現狀。沃爾德在會議上分享了2025年報告中的幾個重點,包括模型能力大幅提升、產業界在AI領域的主導地位日益鞏固,以及中國有望超越美國成為AI領先者。

以下是羅素·沃爾德於會議的演講內容精簡版:

我是羅素·沃爾德,史丹福大學「以人為本人工智能研究所」執行董事。我們研究所成立於2019年,致力推動AI研究、教育、政策和實踐,目標是引導AI發展造福社會。我們亦是業界、政府及民間社會在AI治理方面值得信賴的合作夥伴。

我們每年發布的《AI指數》是一份基於數據的年度報告,追蹤AI在學術、政府和產業的研究、開發、應用及社會經濟影響。

AI性能每年穩步提升。舉例來說,我們用Midjourney這款文字生成圖像工具,從2022年2月至2024年7月,生成的《哈利波特》圖像質量飛躍提升。2022年時,它只能做出卡通化、失真版本,而2024年已經能創造出逼真得令人驚嘆的形象,從彷如畢加索畫作到猶如電影中丹尼爾·雷德克里夫的寫實肖像。

由於性能持續增強,評估這些模型的標準變得愈來愈難。2024年幾乎沒有任何任務是人類能力勝過AI,並且在圖像識別、競賽級數學、博士級科學問題等領域,AI均已超越人類。

AI從實驗室快速走向日常生活。2023年,美國食品藥品監督管理局批准了223款AI醫療設備,遠超2015年的6款。自動駕駛汽車亦不再是試驗品,例如我在舊金山常搭乘的Waymo每週提供超過15萬次自主駕駛服務;而中國百度的Apollo Go機器人出租車已在多個城市運營。

企業使用AI的熱度自2017至2023年停滯後,近期大幅回升。麥肯錫最新報告指出,78%受訪企業已在至少一個業務範疇開始使用AI,較2023年的55%大幅增加。

同時,隨着更小型但更強大的模型出現,執行類似GPT-3.5水平的推理成本自2022年11月至2024年10月降低了280倍以上。硬件成本每年下降30%,能源效率提升40%。開放權重模型與封閉模型的性能差距也從8%縮小至1.7%,大幅降低了進入先進AI領域的門檻。

然而,儘管推理和硬件成本下降,訓練成本依然高昂,學術界和小型團隊難以負擔。2024年約90%重要AI模型來自企業,較2023年的60%大幅上升。學術界雖然仍是高影響力研究的來源,但在前沿技術層面開始落後。

模型規模迅速擴大。訓練計算力每五個月翻倍,數據集每八個月翻倍,電力消耗每年增加。儘管如此,模型之間的性能差距縮小,排名前十的模型分數差由11.9%降至5.4%,頭兩名模型差距僅0.7%。前沿領域愈趨競爭激烈。

近年來,前沿AI模型的性能趨於一致,數家供應商均提供高性能模型。這與2022年末ChatGPT推出時的市場格局截然不同,當時僅有OpenAI與Google主導市場。

值得一提的是,2017年Google訓練Transformer模型的成本約為9.3萬美元(GPT架構基礎),而如今訓練Gemini Ultra的成本已高達2億美元。

去年《AI指數》首次指出缺乏標準化的AI安全與責任評估指標,並分析了全球公眾對AI的態度。非西方工業化國家對AI的正面評價較高,中國83%、印尼80%、泰國77%,相比之下加拿大40%、美國39%、荷蘭36%。

最後談談地緣政治局勢。美國仍保持AI領先地位,中國緊隨其後,但兩者差距正在縮小。我並非想強調中美AI軍備競賽,而是想指出兩國在AI發展路線上的不同策略。

過去幾年,美國依賴數家專有模型供應商;而中國則大力培養人才,更重要的是建立了開源生態系統。若此趨勢持續,中國有望在模型性能上超越美國。

評論與啟示

羅素·沃爾德的分享揭示了AI技術發展的兩大核心挑戰:一是當AI表現超越人類,傳統的性能評測標準已不敷使用,急需建立更全面、多維度的評估體系,尤其是安全性和倫理責任方面;二是AI研發的資源集中於大型企業,學術界和小型團隊面臨巨大壓力,可能影響創新生態的多元性。

此外,中美在AI競賽中的態勢微妙。中國通過開源策略和人才培養,快速縮小與美國的差距,這不僅是技術層面的較量,更是開放與封閉、協作與壟斷的博弈。這提醒我們,發展AI不僅要看技術本身,更要關注政策環境和生態系統建設。

對香港和整個亞洲地區而言,這種全球AI發展趨勢意味著本地企業和研究機構要加強國際合作與開放創新,避免被邊緣化。同時,政府應該積極制定合理的AI監管政策,平衡技術發展與社會責任,確保AI能真正惠及大眾,而非只服務於少數巨頭。

最後,隨着AI能力日益強大,公眾對AI的態度也呈現地域差異,這顯示文化背景和社會價值觀對AI接受度有深遠影響。未來AI推廣與教育工作需要更具文化敏感性,促進全球範圍內的公平與包容。

總結來說,AI的快速演進帶來前所未有的機遇與挑戰,唯有多方協作、跨界思考,才能在這場技術革命中找到最合適的發展之路。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
An intense, close-up portrait set in a smoky, underground jazz club or speakeasy. The subject is the 'Boss' of an information network, hiding in plain sight. The scene is dark, defined by heavy shadows and cigarette smoke swirling in the air. A single spotlight hits the subject from the side, creating a classic 'Rembrandt triangle' on the cheek of [exactly face uploaded image 100%]. He wears a sharp, pinstripe suit with a silk tie, loosened at the collar. He holds a glass of amber whiskey, the condensation rendered in 8K detail. The camera uses a macro 100mm lens, focusing entirely on the eyes and the texture of the skin, blurring out the background patrons into abstract shapes. The mood is conspiratorial, sophisticated, and deeply atmospheric. Use the original face exactly as it is, without changing a details. A stunning, very fit female model with a sun-kissed, glowing tan (hyper-realistic, high-sheen skin texture).
• Attire: A strapless, high-waisted one-piece swimsuit (or very closely cut two-piece) in a dark navy or black color with prominent white polka dots. The suit has a cutout design around the midriff and a knotted/bow detail at the bust.
• Accessories:
• An oversized straw sun hat with a wide brim, featuring a colorful striped ribbon band.
• Large, chunky yellow or gold hoop earrings with a woven/textured design.
• Hair & Makeup: Classic glamour style. Bright, bold red lipstick. Hair is pulled back or tucked under the hat.
Setting & Composition
• Background: A solid, seamless, rich mustard yellow or deep ochre/orange-yellow color, providing a warm, high-contrast backdrop.
• Prop: The model is leaning on an antique or elaborate wooden armchair or chaise lounge with ornate carvings and textured, light gold/yellow upholstery (e.g., damask or brocade).
• Pose: Confident, classic, slightly leaning into the prop, looking directly at the camera with a bright, genuine smile. Three-quarter body shot.
Style & Lighting
• Lighting: Dramatic, high-key, professional studio lighting with a strong single light source to create deep shadows and extreme highlights, especially catching the sheen on the model's skin. The lighting emphasizes a sultry, glamorous mood.
• Aesthetic: High-fashion editorial, Pin-up, Retro 1950s Glamour, Vintage Summer.
• Keywords/Details: Hyper-detailed, photorealistic, cinematic lighting, rich texture, high contrast, high sheen. Edit the uploaded photo (face based on the reference photo). Ensure the face remains consistent with the person in the uploaded image, without changing facial structure, skin tone . Create a Create an 8K ultra-realistic image of woman dancing joyfully in the rain at night, wearing a white sleeveless dress that flares out as she twirls. She has a bright, happy expression on her face. The background features softly glowing streetlights reflecting on a wet surface, creating a warm, shimmering ambiance. The rain is falling steadily, adding a dynamic and lively atmosphere to the scene.Using a Canon EOS R camera with a 50mm f/1.8 lens, f/2.2 aperture, shutter speed 1/200s, ISO 100 and natural light, Full Body, Hyper Realistic Photography, Cinematic, Cinema, Hyper detail, Ultra hd, Color Correction, ultra hd, hdr , color grading, 8k.
滴滴出行優惠 👉 新用戶香港 Call 車首程免費(最高減 HK$88)— 按此領取優惠!