
Krisp利用AI幫助印度人在通話中聽起來像美國人
音頻初創公司Krisp於週三宣布推出一項新功能,利用AI技術在通話中改變用戶的口音。該公司最初推出的功能支持將印度英語口音轉換為美國英語口音。
這項口音轉換過程旨在保留說話者的聲音,僅僅改變音素以匹配美國口音。據悉,這項功能已在企業環境中進行過測試,目前測試版已在Krisp桌面應用程序中推出。用戶可以在通話前或通話中隨時啟用此功能。
該公司的聯合創始人Arto Minasyan表示,這項功能的靈感源於他在交流中遇到的問題。“很多人即使我講得很好英語,還是聽不懂我的口音。我們認為改變口音可能會幫助人們更好地理解彼此。我們在兩年前開始著手解決這個問題,現在我們推出了測試版,”Minasyan說。
然而,當本記者測試這項功能時,處理過的聲音聽起來並不自然,有時甚至漏掉了一些詞。公司將這些問題歸因於目前仍處於測試階段,並表示模型會隨著時間的推移而改善。
Krisp聲稱,在與企業進行測試時,銷售轉換率上升了26.1%,每本書的收入增加了14.8%。
該公司表示,之所以首先專注於印度口音,是因為該國在STEM領域的全球勞動力中佔據了很大一部分。未來還計劃增加對其他口音的支持,包括菲律賓口音。
其他初創公司,如獲得GV支持的Sanas,已在呼叫中心大規模部署類似技術。
該公司表示,它在數千個語音樣本上訓練了模型,涵蓋了不同的口音和方言,並在獲得用戶同意後使用了會議助手的數據。
Minasyan指出,這項功能的另一個優勢是,它不需要對用戶的聲音進行任何預先訓練,因為它可以即時為說話者創建一個個人資料。
Krisp在2021年最後一次籌集資金,計劃今年推出iOS和Android應用程序,以支持面對面會議。此外,還在開發一個新的Chrome擴展,以更好地與Google Meet集成。
—
這項技術的推出無疑在通訊領域引起了巨大的關注。對於那些因口音而在國際交流中遇到困難的人來說,這樣的工具能夠提供實質性的幫助,促進理解和合作。儘管目前仍處於測試階段,Krisp已經展現了其在商業應用中的潛力。未來,隨著技術的進一步完善,這類工具可能會成為跨文化交流的重要橋樑。
然而,我們也需要保持警惕,關注這項技術可能帶來的倫理問題,例如是否會影響到人們對自身文化身份的認同。技術的進步應該伴隨著對多樣性的尊重與包容,讓各種口音和文化都能得到應有的重視。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。