
奇怪的人工智能幻覺世界
當人工智能編造出不存在的事物時
撰文:安娜·崔(Anna Choi)和梅小瑩(Katelyn Xiaoying Mei) 2025年3月28日
在日常生活中,人們經常將看見不存在的事物稱為幻覺。幻覺發生在感官知覺與外部刺激不相符的情況下。依賴人工智能的技術同樣可能出現幻覺。
當一個算法系統生成的信息看似合理,但實際上卻是不準確或具誤導性的,計算機科學家稱之為人工智能幻覺。
編輯注:
客座作者安娜·崔和梅小瑩是信息科學的博士生。安娜的研究涉及人工智能倫理與語音識別的交叉點,而梅小瑩的研究則關注心理學和人機互動。本文經過《對話》重新發表,遵循創用CC授權。
研究人員和用戶在各類人工智能系統中發現了這些行為,從聊天機器人如ChatGPT到圖像生成器如Dall-E,再到自動駕駛汽車。我們是研究人工智能語音識別系統幻覺的信息科學研究者。
無論人工智能系統在日常生活中的應用如何,這些幻覺都可能帶來風險。有些可能是輕微的——當聊天機器人對一個簡單問題給出錯誤答案時,用戶可能會得到錯誤的信息。
但在其他情況下,風險則要高得多。
在人工智能發展的早期階段,問題不僅在於機器的回答,還在於人們傾向於接受這些回答為事實,即使它們並不正確,只因為聽起來合理。
我們已經見過在法庭上,人工智能軟件被用來做出量刑決策,甚至健康保險公司使用算法來決定病人的保險資格,人工智能幻覺可能會帶來改變人生的後果,甚至是危及生命的風險:自動駕駛汽車使用人工智能來探測障礙物,包括其他車輛和行人。
編造事物
幻覺及其影響取決於人工智能系統的類型。對於大型語言模型來說,幻覺是聽起來有說服力但實際上不正確、編造或無關的資訊。
例如,聊天機器人可能會創造一篇不存在的科學文章的參考,或提供一個簡單錯誤的歷史事實,但卻讓人聽起來很可信。
在2023年的一宗法院案件中,一名紐約律師提交了一份他借助ChatGPT撰寫的法律簡報。後來一位敏銳的法官注意到,簡報中引用了一個ChatGPT編造的案件。如果人類無法察覺這段幻覺的信息,可能會導致法庭的不同判決結果。
對於能夠識別圖像中物體的人工智能工具,當人工智能生成的標題與提供的圖像不一致時,就會發生幻覺。
想像一下,當你要求一個系統列出一幅僅包含一位胸部以上的女性在講電話的圖像中的物體,而得到的回應卻是「一位坐在長椅上講電話的女性」。這種不準確的信息在需要準確性的情況下可能會導致不同的後果。
幻覺的成因
工程師通過收集大量數據並將其輸入計算系統來構建人工智能系統,該系統可以檢測數據中的模式。系統根據這些模式發展出回答問題或執行任務的方法。
如果給一個人工智能系統提供1,000張不同品種狗的照片並標註,那麼系統將很快學會區分貴賓犬和金毛尋回犬。但如果給它一張藍莓鬆餅的照片,正如機器學習研究人員所示,它可能會告訴你這是一隻吉娃娃。
物體識別人工智能在區分吉娃娃和藍莓鬆餅、以及牧羊犬和拖把方面可能會遇到困難。
當系統無法理解問題或所呈現的信息時,就可能會出現幻覺。幻覺通常發生在模型根據其訓練數據中的類似上下文填補空白時,或者當它是基於有偏見或不完整的訓練數據構建時。這導致錯誤的猜測,就像對藍莓鬆餅的錯誤標記一樣。
需要區分人工智能幻覺與故意創造性的人工智能輸出。當人工智能系統被要求創造時——例如寫故事或生成藝術圖像——其新穎的輸出是預期和受歡迎的。
然而,當人工智能系統被要求提供事實信息或執行特定任務時,幻覺則是當它生成不正確或誤導性的內容卻將其呈現為準確的情況。
關鍵的區別在於上下文和目的:創造性適合藝術任務,而當需要準確性和可靠性時,幻覺則是問題所在。為了解決這些問題,公司已經提出使用高質量的訓練數據,並限制人工智能的回應遵循某些指導方針。然而,這些問題在流行的人工智能工具中仍可能持續存在。
風險何在
將藍莓鬆餅稱為吉娃娃的影響似乎微不足道,但考慮到使用圖像識別系統的不同技術:一輛無法識別物體的自動駕駛汽車可能導致致命的交通事故;一架自動軍事無人機誤認目標可能會危及平民的生命。
對於提供自動語音識別的人工智能工具,幻覺是人工智能的轉錄中包含實際上從未說過的單詞或短語。在嘈雜的環境中更容易發生這種情況,人工智能系統可能會在試圖解讀背景噪音(如經過的卡車或哭泣的嬰兒)時添加新的或無關的詞彙。
隨著這些系統越來越多地被融入醫療、社會服務和法律環境中,自動語音識別中的幻覺可能會導致不準確的臨床或法律結果,從而危害病人、犯罪被告或需要社會支持的家庭。
檢查人工智能的工作——不要盲信,要驗證人工智能
無論人工智能公司如何努力減少幻覺,用戶應保持警惕,質疑人工智能的輸出,特別是在需要精確和準確的上下文中。
將人工智能生成的信息與可信來源進行雙重檢查,在必要時諮詢專家,並認識到這些工具的局限性,都是減少風險的重要步驟。
在當前的科技環境中,使用人工智能帶來的便利固然重要,但對於其潛在的錯誤和危險,我們必須保持警覺。隨著這些工具的普及,對於它們的理解和批判性思考將成為每個用戶的必要技能。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。