新方法破解深fake威脅!

Ai




NYU 研究人員開發新即時深偽檢測方法

深偽技術,利用人工智能創造出超逼真的視頻和音頻,在不法分子手中變得非常強大。紐約大學坦登工程學院的研究人員正在開發新技術,以應對深偽威脅。

深偽是利用人工智能創造出來的超逼真視頻和音頻,這在現今數碼世界中構成了越來越大的威脅。通過操縱或偽造內容,使其看似真實,深偽可用於欺騙觀眾、散播虛假信息和破壞名譽。其濫用範圍包括政治宣傳、社會操控、身份盜竊和網絡犯罪。

隨著深偽技術的進步和廣泛應用,社會危害的風險也在增加。研究深偽對於開發檢測方法、提高意識以及建立法律框架以減輕其對個人、專業和全球領域的損害至關重要。理解深偽相關的風險及其潛在影響對於維護媒體和數碼通信的信任是必要的。

這就是紐約大學坦登工程學院的計算機科學與工程及電氣和計算機工程副教授Chinmay Hegde的研究重點所在。

Chinmay Hegde 的研究

Chinmay Hegde專注於開發用於檢測音頻和視頻深偽的挑戰-響應系統。他表示:「廣義上,我對所有形式的AI安全感興趣。當像AI這樣的技術迅速發展並迅速成熟時,這是一個容易被不法分子利用的領域。」

來自印度的Hegde曾在全球多地生活,包括在德克薩斯州休斯敦的萊斯大學學習、在麻省理工學院的計算理論小組進行博士後研究,以及在愛荷華州立大學擔任電氣和計算機工程系的教授。

Hegde的專業領域是數據處理和機器學習,他的研究重點是在圖像和計算機視覺、交通運輸和材料設計等應用中開發快速、穩健且可驗證的算法。在坦登工程學院,他與計算機科學與工程教授Nasir Memon合作,激發了他對深偽的興趣。

「即使在六年前,生成式AI技術還非常初級。當時,我的一位學生展示了一個模型如何在黑色背景上創建一個白色圓圈,我們都對此印象深刻。如今,你可以看到高解析度的泰勒·斯威夫特、巴拉克·奧巴馬和教宗的假冒影像,這項技術的進步令人驚訝。我認為這可能會繼續改善。」他說。

Hegde帶領紐約大學坦登工程學院的研究團隊開發了一種新方法,以應對即時深偽(RTDFs)——這是一種能夠在即時視頻和語音通話中逼真模仿實際人物的高級人工智能生成的假冒音頻和視頻。

深偽欺詐的高調事件已經發生,包括最近一起使用假視頻進行的2500萬美元詐騙,顯示出有效對策的緊迫性。

在兩篇不同的論文中,研究團隊展示了如何利用「挑戰-響應」技術來利用當前RTDF生成流程的內在限制,從而降低模仿質量,揭示其欺騙性。

挑戰-響應技術

在名為「GOTCHA:通過挑戰-響應進行即時視頻深偽檢測」的論文中,研究人員開發了一套八個視覺挑戰,旨在向用戶發出信號,讓他們知道自己並未與真實人物互動。

Hegde表示:「大多數人都熟悉CAPTCHA,這是一種在線挑戰-響應技術,用於驗證他們是實際的人。我們的方法與這一技術類似,基本上是提出問題或發出請求,而RTDF無法適當響應。」

視頻研究團隊創建了一個包含47名參與者的56,247個視頻的數據集,評估了例如頭部運動和故意遮擋或覆蓋部分臉部等挑戰。人類評估者在檢測深偽時達到約89%的曲線下面積(AUC)得分(超過80%被視為非常好),而機器學習模型達到了約73%。

「像快速在臉前移動手、做出戲劇性的面部表情或突然改變光線這樣的挑戰,對於真人來說很容易做到,但當要求當前的深偽系統在即時情況下進行令人信服的模仿時,這些挑戰是非常困難的。」Hegde說。

音頻挑戰

在另一篇名為「利用挑戰-響應進行深偽音頻通話的AI輔助標記」的論文中,研究人員創建了一個涵蓋各種類別的22個音頻挑戰的分類法。其中一些最有效的挑戰包括耳語、用「杯狀」手說話、高音說話、發音外國詞語以及在背景音樂或語音中說話。

Hegde表示:「即使是最先進的語音克隆系統,在被要求即時執行這些不尋常的聲音任務時,也難以保持質量。例如,耳語或以異常高音說話會顯著降低音頻深偽的質量。」

音頻研究涉及100名參與者和超過160萬個深偽音頻樣本。它採用了三種檢測場景:僅人類、僅AI,以及人類與AI的協作方法。人類評估者在檢測假冒時達到約72%的準確率,而僅AI的表現更好,達到85%的準確率。

協作方法中,人類進行初步判斷,然後在看到AI預測後可以修正其決定,達到約83%的準確率。這種協作系統還允許AI在不確定的情況下做出最終判斷。

「關鍵在於,這些任務對於真人來說簡單而快速,但對於AI來說卻很難即時偽造。」——CHINMAY HEGDE,紐約大學坦登工程學院

研究人員強調,他們的技術旨在實際應用,大多數挑戰只需幾秒鐘即可完成。典型的視頻挑戰可能涉及快速的手勢或面部表情,而音頻挑戰可能只需耳語一句簡短的句子。

Hegde說:「關鍵在於,這些任務對於真人來說簡單而快速,但對於AI來說卻很難即時偽造。我們還可以隨機化挑戰並結合多個任務以增加安全性。」

隨著深偽技術的進一步發展,研究人員計劃完善其挑戰集,並探索使檢測更加穩健的方法。他們特別感興趣於開發「複合」挑戰,即同時結合多個任務。

Hegde表示:「我們的目標是為人們提供可靠的工具來驗證他們在網上真正與誰交談,而不會干擾正常對話。隨著AI在製造假冒方面變得越來越好,我們需要在檢測方面做得更好。這些挑戰-響應系統是朝這個方向邁出的有希望的一步。」

評論與見解

這篇文章揭示了在面對深偽技術迅速發展的背景下,學術界如何試圖應對這一威脅。深偽技術的應用範圍和潛在危害使得這一領域的研究顯得尤為重要。Hegde的挑戰-響應方法提供了一個創新的解決方案,通過設計簡單而有效的挑戰來識別深偽,這不僅是技術上的突破,也在倫理和法律層面提出了新的思考。

然而,這也引發了一些問題。例如,這些檢測方法是否會對普通用戶的隱私或使用體驗產生影響?隨著深偽技術的進一步發展,這些方法是否能持續有效?此外,這些技術的應用是否會引發新的法律和道德爭議,如在隱私和自由之間的平衡?

這些問題需要進一步的討論和研究,以確保在技術創新與社會責任之間達到最佳平衡。隨著技術的進步,社會必須不斷適應和應對潛在的威脅,同時確保技術的使用符合倫理和法律標準。

以上文章由特價GPT API KEY所翻譯

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
In a brightly lit indoor setting, likely a press conference room, two uniformed police officers flank a man in a plain brown t-shirt. The officers, wearing blue shirts with epaulets and badges, have a firm but neutral grip on the man's shoulders, directing him towards the cameras. The man [image uploaded] with short dark hair, is smiling subtly and maintaining eye contact with the lens.

Stretching across the foreground is a white-draped table, upon which a diverse collection of women's underwear is meticulously displayed. There are dozens of pairs in various colors, patterns, and styles, including solid hues of red, blue, pink, and black, as well as leopard print and other designs. Several microphones with news station logos are placed among the undergarments, pointing towards the man and officers.

Behind the table, a throng of journalists and photographers are actively documenting the event. Many are holding professional video cameras with large lenses and attached lights, while others are using DSLR cameras with flash attachments, and some are capturing footage with their smartphones. The room is illuminated by rectangular fluorescent light panels on the ceiling, casting an even glow. The overall atmosphere suggests a formal public presentation, possibly a police press briefing or an arrest announcement. A young person with short blonde hair squatting confidently in front of a white sports car on a wet city street at night. Captured with a wide-angle fisheye lens for dramatic distortion. Neon signs, Japanese billboards, and glowing city lights reflect on the wet pavement. Moody, cyberpunk-inspired atmosphere with light rain and soft reflections. Casual streetwear—oversized dark sweatshirt, loose grey pants, worn sneakers. Background filled with vibrant nightlife, blurred car headlights, and bustling urban energy. High contrast, teal-orange tones, cinematic depth, film grain, atmospheric haze, shallow depth of field, 35mm film look, poster-style composition, ultra-realistic lighting. [Subject]: Young Asian female with "Imada Mio-inspired" doll-like aesthetic (精緻洋娃娃臉). She has large round expressive eyes, a small V-line face, and rosy cheeks. Her expression is innocent, energetic, and slightly flirty. [Hair]: Messy morning hair (剛睡醒的凌亂感), long dark brown hair, slightly tousled, natural volume. [Outfit]: Wearing an oversized translucent white button-down shirt (男友風白襯衫), unbuttoned at the top to reveal collarbones, creating a "bottomless" look (下衣失蹤風格). [Style]: Japanese Gravure Photobook style (寫真集風格), Pure & Sexy vibe, bright high-key lighting, soft skin texture, Fujifilm PRO 400H color tone.

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

📣 即刻用 Google Workspace|唔使vpn都能享用 Google AI Pro

即使你只係一個人,都可以透過 Google Workspace 使用 官方Gemini AI Pro(原價 HK$160), 而在 Google Workspace 只要 HK$131 / 月

🔓 14 天免費試用
🔖 用呢條連結申請再有 額外 9 折
🇭🇰 香港可直接付款(香港信用卡)
🛡️ 不用 VPN,立即開用
🤖 可用 最新最紅Gemini 3 Pro & Nano Banana Pro
👉 立即登記 14 天免費試用 + 額外 9 折