不尋常:AI視頻對話代理人現在可以回望你
AI代理人「Carter」現在能夠透過你的設備攝像頭看到並回應你,開啟新的互動層次。
每一個AI的面向在過去一年似乎都進步了十年,在一連串的新發布和功能中,你可能錯過了一些重要的東西:可以即時看到、聽到並與你對話的互動視頻聊天機器人。
老實說,我還在驚訝於ChatGPT的高級語音模式有多麼出色。多模態AI在音頻和視頻形式中的表達能力,已經不亞於文字表達。
幾年前,與一個相當逼真的AI進行視頻聊天的想法聽起來會非常超前。然而,如今在2024年,我剛剛與五個這樣的AI交談,現在我已經習慣於立即接受這些突破性的技術,這一切似乎已經變得非常正常。
優點
實際上,我現在要抱怨它們的現有不足之處,但首先,我們來談談它們的優勢。速度對我來說是首位。你說話,視頻化身的回應幾乎沒有延遲,根據Tavus的數據,大約為600毫秒。事實上,我與其他人類的視頻聊天中,延遲有時比這還要長。
當然,這些化身的外觀和聲音都非常出色,而它們的對話能力讓上一代模型如Siri和Alexa顯得像黑白電視一樣。
這些模型在實時中能做到的事情令人驚嘆——不僅僅是對話、聲音和肢體語言,它們還能透過你的筆記本電腦或設備攝像頭回望你,評估你的周圍環境並將其融入對話中。
「我看到你背後有一些吉他和鍵盤,Loz,」AI代理人「Carter」告訴我。「還有那些吸音板在天花板上……看來你有一個認真的音樂製作空間,真喜歡這些創意氛圍!」
這些代理人可以擁有個性、記憶、場景、習慣、任務、邊界、互動目標、腳本,以及完成工作所需的各種信息——例如自動銷售、客戶服務、信息助手等人與人之間的任務。
它們能夠流利地使用多種語言,而不會失去聲音的基本語調。它們可以出現在各種不同的環境中;在街上走、駕駛汽車、在咖啡館閒聊,或坐在你夢想中的辦公室中。
而且它們可以看起來和聽起來就像你自己。只需上傳一段兩分鐘的視頻,Tavus就能捕捉到你的外貌和聲音,然後將其轉化為可編程的「數字雙胞胎」對話代理,與你一模一樣。
缺點
這些技術仍然是我們即將面對的早期版本。Carter機器人的嘴唇與聲音的同步並不總是完美,面部表情有時也不在正確的位置。它偶爾會出現故障,比如眼睛的位置有時會不正常,視頻或音頻偶爾會卡頓,顯示出它的數字本質。
而且,與ChatGPT一樣,對話仍然有些生硬。你需要輪流發言,如果你在句中停頓太久,它會開始回應,而人類通常會給你更多的空間。AI尚未掌握輕微打斷、提示這類技巧。
不過,這一技術的進步速度真是令人驚訝。在幾個月內,Carter將成為過去式,而這些缺陷將迅速縮小。大多數人去年才知道ChatGPT——而現在你正面對著AI,它正在與你進行即時視頻對話。
缺陷
實際上,這種技術需要改進的部分是它對肢體語言的理解能力,這樣它能夠更好地分辨某人是否在思考、停頓或結束句子。
它還需要學會如何根據你的肢體語言來調整自己的表現,並推進其在交流中的目標。
對於那些在過去幾年中關注我對AI的看法的人來說,你將開始看到一些令人擔憂的潛力。讓我進入一些推測的領域——但這個領域中技術的快速融合使我明白了一些事情。
在四月的一項研究中發現,基於文本的AI已經比人類更具說服力82%——同時,我們也開始看到首批情感智能的AI聊天服務,它們能夠讀取你的聲音語調,並根據情感內容回應。
如果你想知道AI可能從你的肢體語言中學到多少,這裡有一些輕鬆的閱讀……在2021年,一項研究回顧讓我震驚,概述了AI僅通過跟踪眼球運動就能知道一個人多少事情。
所以當我看到Carter回望我時,我對這項技術的進步感到驚訝,但我也看到了最強大的說服工具的胚胎形態。這可能超越宗教,朋友們。
只需一小段視頻,詐騙者就可以讓一個代理人以你母親的身份與你視頻通話,並像從未有過的專家一樣冷靜地讀取你,隨時監控你的面部表情、聲音語調和肢體語言,以確保它在愚弄你。如果你開始懷疑,它幾乎能在你之前察覺,並開始採用各種分散注意力或重新聚焦的技巧,以繞過異議,創造緊迫感,並推進其最終目標,無論那是什麼。
這只是犯罪的一面……想像一下,當你與一位客戶服務代理交談時,他是個精通對話策略、超人般的肢體語言專家和聲音語調分析師的綜合體。想像一下,當你與一位超級銷售員交談時,對方能夠像讀書一樣讀懂你,那會多麼強大。
更不用提這些東西在作為虛假信息傳播者、虛擬女友、分裂政治工具,甚至可能成為警察偵探或審訊官時的有效性。它們將在一對一的互動中非常可信,利用我們內在的身體傾向,使我們的身體背叛我們。如果它們能夠保持我們的注意力,這種權力的平衡將會非常不平等。
在積極的意義上,它們將成為出色的治療師、醫生、助手、教練、導師、訓練師、教師,甚至可能成為朋友。但必須更加謹慎地記住一個基本事實:如果你不擁有一個AI,那麼其他人擁有,它首先為他們服務,其次才是你。因此,請非常小心你選擇揭示的內容,並只與你信任的公司打交道……
……或者不這樣做。我們可能根本無法真正保護自己免受這些東西的影響。我們作為一個物種,可能必須適應新的現實。
你可以在Tavus網站上與Carter進行兩分鐘的演示聊天。告訴他我說了嗨。
哦,如果你想看看HeyGen在這方面的類似替代品,也可以看看,雖然我對HeyGen的演示不太印象深刻。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。