
深偽技術的進步令人震驚
TikTok的母公司字節跳動的研究人員展示了一個名為OmniHuman-1的全新AI系統,該系統能生成或許是目前最逼真的深偽視頻。
深偽技術已經成為一種商品,市面上不乏能夠將某人插入照片或使人看起來說出未曾說過的話的應用程式。然而,大多數深偽技術,尤其是視頻深偽,往往無法跨越“恐怖谷”這一障礙,總有一些明顯的跡象顯示出AI的參與。
不過,OmniHuman-1的表現卻不然——至少從字節跳動釋出的精選樣本來看。
這裡有一段虛構的泰勒·斯威夫特表演:
這裡有一場從未發生過的TED演講:
還有一段深偽的愛因斯坦講座:
根據字節跳動的研究人員,OmniHuman-1只需一張參考圖像和一段音頻(如語音或歌唱)便可生成任意長度的視頻片段。輸出視頻的長寬比可以調整,主體的“身體比例”也可以自定義——即在假視頻中顯示多少身體部分。
該系統訓練於19,000小時的視頻內容,來源未公開。OmniHuman-1還可以編輯現有視頻,甚至修改人物肢體的動作。最令人驚訝的是,結果的逼真程度讓人難以置信。
當然,OmniHuman-1並不完美。字節跳動團隊表示,“低質量”的參考圖像不會產生最佳視頻,且系統在某些姿勢上似乎會遇到困難。注意這段視頻中,持酒杯的奇怪手勢:
儘管如此,OmniHuman-1的技術水平無疑超越了以往的深偽技術,並可能預示著未來的趨勢。儘管字節跳動尚未推出該系統,但AI社群通常不會花太多時間對這些模型進行逆向工程。
深偽技術的潛在影響令人擔憂
去年,政治深偽在全球迅速蔓延。在台灣的選舉日,一個與中國共產黨有關的團體發布了AI生成的誤導性音頻,聲稱一名政治家支持一位親中的候選人。在摩爾多瓦,深偽視頻顯示該國總統瑪雅·桑杜辭職。而在南非,一段深偽的艾米納姆支持南非反對黨的視頻在選舉前廣泛流傳。
深偽技術也越來越多地被用於金融犯罪。消費者受到名人深偽的欺騙,虛假投資機會層出不窮,而企業則因深偽冒充者而損失數百萬。根據德勤的報告,2023年AI生成的內容導致的詐騙損失超過120億美元,預計到2027年美國的損失將達到400億美元。
去年二月,數百名AI社群成員簽署了一封公開信,呼籲對深偽技術進行嚴格的監管。在美國聯邦層面尚未立法禁止深偽的情況下,已有超過10個州制定了針對AI輔助冒充的法規。加州的法案——目前停滯不前——將成為第一部授權法官命令深偽發布者刪除內容或面臨金錢罰款的法律。
不幸的是,深偽技術的檢測難度極高。儘管一些社交網絡和搜索引擎已採取措施限制其傳播,網上深偽內容的數量仍在以驚人的速度增長。
根據身份驗證公司Jumio於2024年5月進行的調查,60%的人表示在過去一年中遇到過深偽。72%的受訪者表示他們擔心每天會被深偽所欺騙,而大多數人支持立法來應對AI生成虛假內容的增長。
這些現象顯示出深偽技術的快速進步及其潛在的負面影響,社會必須更加警覺,並在技術發展的同時,尋求有效的監管和防範措施,以保障公眾的安全和信任。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。