生成式AI仍有信賴問題,未來發展需改進

Ai




大型語言模型的局限性:為何生成式人工智慧仍需長足進步,研究人員指出

儘管生成式人工智慧(GenAI)看似非常出色,但哈佛大學、麻省理工學院、芝加哥大學和康奈爾大學的研究人員得出結論,這些大型語言模型(LLMs)並不如我們所想的那樣可靠。即使是像任天堂這樣的大公司也不願意與其遊戲開發相聯繫。

儘管這些人工智慧系統經歷了巨大的增長,但在不可預測的現實條件下,它們仍然存在不一致和不準確的問題。

為什麼生成式人工智慧模型尚未完全可靠

雖然大型語言模型在生成文本、編寫代碼及其他應用上表現出色,但當任務或環境發生變化時,它們的表現卻會大打折扣。這一缺陷使人們對這些模型在現實應用中的可信度產生疑問,因為在這些情況下,適應性和可靠性至關重要。最近的報導指出,生成式人工智慧模型在面對動態任務時,缺乏對其處理數據的內在「理解」。

檢視人工智慧在現實場景下的表現

在一項實驗中,研究人員試圖評估一個非常流行的LLM在紐約市提供方向指引的表現。在正常情況下,該人工智慧模型提供的指引幾乎是完美的,看起來非常能幹。然而,當研究人員引入路障和繞行時,模型的準確性卻大幅下降。

它無法適應新的街道佈局,甚至無法正確導航,暴露出其對城市地理的「理解」存在嚴重缺陷。這意味著,儘管LLMs可能會「學習」到現實世界的情況,但它們並未形成像人類或其他複雜系統那樣的穩固、靈活的知識結構。

大型語言模型的結構性弱點

像GPT-4這樣流行的生成式人工智慧模型是基於一種稱為變壓器(transformer)的人工智慧架構構建的。這些變壓器在巨大的語言數據集上進行訓練,以預測單詞或序列,從而給出類似人類的回應。然而,研究人員發現,這些模型雖然在預測方面表現優異,但並不意味著它們真正了解所描述的世界。

例如,一個變壓器模型可能在連接四(Connect 4)這個棋盤遊戲中非常有效地做出有效的移動,但它仍然無法理解遊戲的真正運作方式。為了解決這一問題,研究人員提出了兩個新指標,以檢查這些人工智慧模型是否能學習到連貫的「世界模型」——這種結構化的知識使它們能夠在多種情境下適當運作。他們將這些指標應用於兩個任務:在紐約市導航和玩奧賽(Othello)這個棋盤遊戲。

隨機模型的表現超越預測性人工智慧

有趣的是,研究人員發現,隨機決策的變壓器模型往往能比那些預測準確度更高的模型生成更準確的世界模型。這本身就暗示,僅僅訓練去預測序列的人工智慧模型可能並未學會理解其工作的本質。

當研究人員關閉了紐約市地圖上僅1%的街道時,人工智慧模型的準確性從接近100%降至僅67%,顯示出其在適應性方面的深層失敗。在奧賽遊戲的任務中,一個模型成功創建了一個連貫的「世界模型」,適用於奧賽的移動,但沒有一個模型真正成功地為紐約市導航形成了一個健全的模型。

對未來人工智慧發展的啟示

這些結果顯示,當前在LLM構建和評估上的方法對於開發可靠的「現實世界」人工智慧系統是不足夠的。「我們經常看到這些模型做出令人印象深刻的事情,認為它們一定對世界有所理解。我希望我們能說服人們,這是一個需要仔細思考的問題,我們不必依賴自己的直覺來回答。」一位研究人員強調,如果希望構建真正理解其部署上下文的模型,則需要發展無法簡化為預測準確度的新方法。

科學家們希望將他們的新指標應用於科學和現實問題,以尋找使LLMs更具適應性和可靠性的方法。專注於人工智慧工程中的最終洞見,可以更好地為現實應用構建系統,同時為人工智慧的改進奠定更堅實的基礎。

在這個快速發展的科技時代,對於生成式人工智慧的理解不僅僅是技術上的挑戰,更是對其在社會中角色的重新思考。未來的發展需要更多的跨學科合作,以建立更具人性化的人工智慧系統,這樣才能真正發揮其潛力,並在多樣的現實環境中有效應用。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放

立即升級 🔗

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
電影感、外景特寫人物肖像,16:9比例,4K超高解析度:

場景設定於溫暖柔和的秋日下午,陽光灑落在海邊蜿蜒小徑上,光線溫柔金黃。一位年輕亞洲女性作為主角,擁有甜美明亮的微笑,肌膚細膩、面容生動自然,眼中蘊含溫暖的神采。她穿著一件質感細膩、寬鬆舒適且露肩的米白色短版毛衣,下身搭配貼身黑色牛仔褲,整體造型時尚休閒、比肩電影主角。

她輕鬆自然地斜倚在一道鮮豔、復古感十足的藍色木製欄杆之上,姿態優雅隨性。畫面使用85mm焦段F1.4大光圈鏡頭,中景3/4身構圖,主體人物清晰細緻、膚質呈現柔和光澤感。前景有一層淡淡、模糊的蘆葦或芒草,透過淺景深帶來層次感與夢幻氛圍。背景遠處則是晃動的模糊海岸線與蔚藍晴空,景色朦朧詩意。

整體色調以溫暖自然、略帶金色餘暉為主,黑柔濾鏡效果減低對比,尤其在高光處展現細膩的光暈與膚質柔化,氛圍極具電影感和藝術氛圍。畫面細節豐富,請強調人物情感表達與場景的詩意氛圍。 Create a hyper-realistic 8K close-up body portrait of a female model, using the uploaded photo as the exact facial reference. Maintain 100% accuracy of the facial features — do not alter or modify any aspect of the face. Render the skin texture, lighting, and overall composition with photo-realistic detail, ensuring lifelike color tones and natural depth of field. A man with his original hair is sitting casually on a white cube, smiling warmly at the camera. He is wearing a cream-colored cable-knit sweater, blue jeans, and brown loafers. His legs are crossed, with one hand resting on his knee.
The background reveals a cozy and festive living room. A large, beautifully decorated Christmas tree with numerous warm lights and gold ornaments stands prominently behind him. Several wrapped gift boxes are visible at the base of the tree. To his left, another smaller decorated Christmas tree and a wreath on the wall further enhance the holiday atmosphere. The lighting is soft and inviting, creating a warm and welcoming scene. Add lotso and hamm