Nvidia的Fugatto AI音效模型宣稱能改變音頻製作
這個模型可以創造前所未聞的聲音
作者:Shawn Knight,今日12:04 PM
為科技愛好者服務超過25年。
TechSpot意味著值得信賴的科技分析和建議。
前瞻性思考:來自全球的研究團隊與Nvidia合作,開發出一款被形容為音效的瑞士軍刀的AI模型——Fugatto,這是一個能夠生成或改變幾乎任何音樂混合的模型,使用任何組合的音頻文件或文本提示。
這個新模型被稱為Fugatto,簡稱為Foundational Generative Audio Transformer Opus 1。根據Nvidia的說法,其能力無與倫比。例如,Fugatto可以僅根據文本創作旋律,改變歌手的情感表達或口音,甚至能從現有歌曲中添加或去除樂器。
Fugatto可能會徹底改變音樂創作的過程。透過這個工具,製作人可以快速原型化新歌曲的概念,並配上自定義的聲音風格和樂器,或調整現有曲目的效果。
多白金製作人及詞曲創作人Ido Zmishlany認為,AI及像Fugatto這樣的工具將幫助書寫音樂的新篇章。不過,這個模型並不僅限於音樂製作。
Nvidia強調了幾個替代用途,例如廣告公司可以利用它來修改廣告中的聲音,以適應不同的地區、情境或語言。這個模型也可以幫助增強語言學習工具,讓用戶自定義說話者的聲音,例如讓其聽起來像朋友或家人。
視頻遊戲開發者可以利用這個工具根據玩家的輸入即時創建新資產,或修改預錄的資產,以最佳方式契合當前畫面上的行動。
研究者的願景:參與該項目的研究者Rafael Valle表示,他們希望創建一個能夠像人類一樣理解和生成聲音的模型。
超過一年的時間用於打造Fugatto的完整版本,該模型使用了25億個參數。Nvidia表示,該模型是在一組DGX系統上進行訓練,這些系統配備32個Nvidia H100 Tensor Core GPU。不幸的是,尚未透露Fugatto何時會向公眾發布的時間表。
—
從這篇報導中,我們可以看到AI技術在音頻製作領域的潛力,Fugatto不僅能提升音樂創作的效率,還可能對廣告、語言學習及遊戲開發等多個行業產生深遠影響。值得注意的是,雖然AI的進步為創意工作帶來了便利,但同時也引發了對創作原創性和人類藝術家角色的思考。未來,如何平衡AI技術的使用與保護人類創意的價值,將是一個重要的議題。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。