
這間公司透過AI幫人改美國口音
Krisp推出的新AI工具旨在即時將說話者的口音轉換為美國英語,最初支援印度英語口音。這款工具與Krisp現有的桌面應用程式捆綁在一起,作為虛擬麥克風使用,能夠在Zoom、Microsoft Teams、Google Meet和Webex等視頻會議應用中修改聲音。
Krisp表示,AI口音轉換的延遲時間為200毫秒,這被稱為「對話中的不可察覺延遲」,同時保留說話者的自然語音。在公司分享的演示中,這項工具似乎能有效地讓某人聽起來像美國人,但語音聽起來有點機械化。
目前,該工具支援17種以上的印度方言,Krisp還計劃未來增加其他英語口音,例如菲律賓口音。
Krisp最初將此工具推廣至呼叫中心機構,然後才進行更廣泛的發布。Krisp的聯合創辦人兼總裁Arto Minasyan在新聞稿中表示:「作為一個有口音的人,我經常注意到即使我的英語流利,人們仍然難以理解我。這不是偏見,而是溝通的現實。在快節奏的會議中,即使是小誤解也會拖慢決策,造成重複,並降低整體效率。」
AI口音轉換目前處於測試階段,免費用戶每天可以使用最多60分鐘。還有一個每月15美元的商業計劃,提供無限使用。
Krisp並不是唯一一家試圖通過AI改變口音的公司。根據彭博社報導,呼叫中心公司Teleperformance SE已經開始推出一款AI驅動的工具,旨在「柔化」印度員工的口音。然而,AI在處理種族和民族問題上存在不明確的記錄,而AI語音生成本身也存在風險。
評論
Krisp的AI口音轉換工具引發了關於語言、身份和科技倫理的討論。雖然這項技術旨在幫助用戶克服口音帶來的溝通障礙,但它是否會在無意中強化對某些口音的偏見?這不僅是技術的挑戰,更是社會文化的考驗。當我們嘗試讓語言更「普遍」時,我們是否也在消減多樣性和文化特徵?這些問題值得我們深入思考。
此外,Krisp的工具雖然在技術上有所突破,但使用者在實際交流中可能會感到不自然,這也可能會影響他們的自信心。AI的發展不應僅僅著眼於技術優勢,更應關注其對人們情感和社交互動的影響。未來,如何平衡科技進步和文化尊重,將成為我們必須面對的重大課題。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。