AI 如何辨識物件中的「面孔」?

Ai




人工智能中的幻覺:機器能否在無生命物體中發現面孔?

麻省理工學院計算機科學與人工智能實驗室(CSAIL)的一項新研究深入探討了幻覺現象,並引入了一個涵蓋5,000個幻覺圖像的人類標記數據集,遠遠超過以往的收集。研究團隊利用這個數據集發現了人類與機器感知之間的若干驚人差異,以及在麵包片上看到面孔的能力如何可能曾經拯救了我們遠古祖先的生命。

研究揭示了什麼?

研究發現,人工智能模型似乎無法像人類一樣識別幻覺面孔。出乎意料的是,團隊發現只有當訓練算法去識別動物面孔時,它們在檢測幻覺面孔方面才有顯著提升。這一意外的聯繫暗示了我們識別動物面孔的能力——對生存至關重要——與我們在無生命物體中看到面孔的傾向之間可能存在進化上的聯繫。

幻覺的「金髮區」

另一個有趣的發現是研究人員所謂的幻覺「金髮區」——即幻覺最有可能發生的一類圖像。「有一個特定的視覺複雜度範圍,在這個範圍內,人類和機器最有可能在非面孔物體中察覺到面孔,」麻省理工學院電氣工程和計算機科學教授William T. Freeman說。「過於簡單,無法形成面孔;過於複雜,則成為視覺噪音。」

為了揭示這一點,研究團隊開發了一個模型,用來模擬人類和算法如何檢測幻覺面孔。分析該模型時,他們發現了一個清晰的「幻覺峰值」,即看到面孔的可能性最高,對應於圖像的複雜程度恰到好處的那些。這個預測的「金髮區」在對真實人類受試者和AI面孔檢測系統的測試中得到了驗證。

數據集的應用

這個新的「物中面孔」數據集遠遠超過了以往研究中通常只使用20-30個刺激物的規模。這一規模讓研究人員能夠探討先進的面孔檢測算法在對幻覺面孔進行微調後的行為,顯示出這些算法不僅可以被編輯以檢測這些面孔,還可以作為我們大腦的硅基替代品,讓團隊能夠提出和回答一些無法在人類中提問的問題。

這項研究還可能應用於改善面孔檢測系統,減少誤報,這可能對自動駕駛汽車、人機交互和機器人等領域具有影響。數據集和模型還可以幫助產品設計領域,通過理解和控制幻覺來創造更好的產品。

研究的未來方向

研究人員正準備與科學界分享他們的數據集,同時也展望未來。未來的工作可能涉及訓練視覺-語言模型來理解和描述幻覺面孔,可能會導致AI系統以更人性化的方式與視覺刺激互動。

這項研究不僅令人著迷,還啟發人們思考。它提出了一個引人入勝的問題:為什麼我們會在事物中看到面孔?這一問題的思考可能會教會我們一些重要的視覺系統如何超越其通過生活中所接受訓練的知識進行概括。

編者評論:

這項研究不僅揭示了人類和機器在面孔識別上的根本差異,還讓我們思考人類感知的進化根源。這種幻覺現象是否僅僅出於社會行為,還是更深層次的生存本能?這些問題不僅對心理學和計算機科學有啟示意義,還可能在未來的技術應用中提供新的視角。特別是在人工智能不斷進步的今天,理解這種人機差異有助於我們設計出更智能、更人性化的技術。這項研究也提醒我們,科技發展不僅需要技術上的突破,還需要從人性和心理學的角度去理解和應用。

以上文章由特價GPT API KEY所翻譯。而圖片則由FLUX根據內容自動生成。

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
攝影主題:暖陽下的清新隨興肖像
人物與神態: 一位擁有烏黑長髮的年輕女性,左手輕扶髮絲,髮絲隨風輕拂臉龐。她展現燦爛自信的笑容,露出潔白牙齒,眼神明亮,散發青春活力的感染力,動作俏皮可愛。
服裝細節: 
上衣: 米白色寬鬆針織毛衣,材質柔軟。右肩自然滑落(露肩設計),展現優美的鎖骨線條;短版剪裁露出平坦腹部與肚臍。
下裝: 復古洗色藍色牛仔褲,細節可見鈕扣與部分拉鍊。
配飾: 左肩背著米色帆布環保袋,袋面上印有「Made in Kowloon」等深色文藝感字樣。
場景與構圖: 戶外環境(如公園或林蔭道),背景呈現柔焦效果,可見模糊的綠意樹葉與遠處人影。主體居中,背景的虛化使人物極致突出。
光線與氛圍: 採用自然光攝影,陽光從右上方灑落,於頭髮、肩膀與衣物纖維上形成鮮明的光影對比。整體呈現溫暖的米、藍、綠色調,畫質達 4K 寫實等級,光影層次豐富,營造出輕鬆愉悅的高級攝影感 ultra-sharp close-up portrait of a woman [image uploaded] with soft, fair, luminous skin, natural rosy blush across her cheeks and nose. she has large, expressive brown eyes with subtle warm eyeshadow, soft eyeliner, and long defined lashes. her lips are glossy with a natural pink tint. her dark brown hair is styled in a voluminous messy updo with loose, wispy tendrils framing her face, creating a soft, youthful look. lighting is bright, warm, and natural, coming from the side window, casting gentle highlights on her skin and hair. she wears a red sleeveless top, layered delicate pearl necklaces, and a single visible red earring with gold detailing. background features a softly lit indoor space with curtains and a window showing blue sky, creating a fresh, airy mood. overall aesthetic is modern beauty photography with clean color tones, perfect skin texture, and high-end editorial styling. negative prompt: distorted face, unnatural freckles, incorrect hair texture, uneven lighting, heavy makeup, washed-out colors, low resolution, cluttered background, incorrect accessories, over-retouching, harsh shadows. Ultra-detailed cinematic portrait of a futuristic armored man in side profile, human face seamlessly fused with exposed mechanical components, intricate cybernetic implants embedded into the skull and jaw, visible wires, micro-circuits, pistons and servo motors, red and gold metallic armor plating partially broken revealing internal machinery, realistic skin texture with stubble and sharp facial features, intense focused expression, hyper-realistic photorealism, sci-fi concept art, mechanical complexity, clean white background with technical sketch lines and blueprint elements, dramatic lighting, sharp focus, 8K resolution, ultra-high detail, cinematic depth, concept art style, futuristic technology, realism + illustration blend

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

滴滴出行優惠 👉 新用戶香港 Call 車首程免費(最高減 HK$88)— 按此領取優惠!