Nvidia推出全球最靈活的音效生成AI工具Fugatto
Nvidia最近宣布了一款名為Fugatto的生成式AI音頻工具,並稱其為「全球最靈活的聲音機器」,能夠創造各種音樂、語音和其他音效,甚至是前所未聞的獨特聲音。
Fugatto是Foundational Generative Audio Transformer Opus 1的縮寫,能夠處理文本提示和音頻樣本。用戶只需描述他們想聽到的聲音,或者讓AI模型修改或結合現有的音頻片段。
例如,用戶可以讓火車的聲音轉變成豐富的管弦樂編排,或將班卓琴旋律與雨聲混合。只需輸入提示,便能聽到薩克斯風的吠叫聲或長笛的喵叫聲。
Fugatto還可以從音軌中提取人聲,改變聲音的表達風格,並且能夠從零開始生成語音。用戶只需輸入現有的旋律,就可以讓它在任何樂器上演奏,並以任意風格呈現。
不幸的是,該工具尚未推出
那麼,如何體驗這項令人印象深刻的新AI技術呢?目前無法,使用者只能欣賞Nvidia的宣傳視頻和樣本網站,尚未有關於Fugatto何時會對公眾測試的消息。
Nvidia發佈的一些樣本包括女性聲音的吠叫聲、工廠機器的尖叫聲、打字機的低語聲,以及大提琴的憤怒吼叫聲,展現了各種可能的音效效果。
Nvidia還演示了該AI引擎如何生成口語片段,這些片段可以用不同情感(從憤怒到快樂)來表達,甚至可以應用不同的口音。
Nvidia的Fugatto團隊成員Rafael Valle表示:「我們希望創造一個能夠理解和生成聲音的模型,就像人類一樣。Fugatto是通往未來音頻合成和轉換無監督多任務學習的第一步。」
這項技術的推出無疑將為音頻創作領域帶來革命性的變化。隨著AI在音樂和聲音生成方面的進步,未來的藝術創作將不再僅僅依賴人類的創意,還將利用AI的強大能力來探索全新的音效和音樂風格。這不僅會改變音樂創作的方式,也可能會影響整個音樂產業的生態,讓更多創作者能夠輕鬆地實現他們的音樂夢想,並打破傳統的音樂創作界限。
然而,這種技術也引發了一些倫理和法律的討論,比如如何保護創作者的原創性,以及AI生成的內容是否會影響音樂的價值和品質。隨著技術的發展,這些問題需要在未來的討論中得到充分的重視和解決。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。