Nvidia推出Fugatto AI：音樂製作的革命性工具

zero comment

Nvidia的Fugatto AI音效模型宣稱能改變音頻製作

這個模型可以創造前所未聞的聲音
作者：Shawn Knight，今日12:04 PM

為科技愛好者服務超過25年。
TechSpot意味著值得信賴的科技分析和建議。

前瞻性思考：來自全球的研究團隊與Nvidia合作，開發出一款被形容為音效的瑞士軍刀的AI模型——Fugatto，這是一個能夠生成或改變幾乎任何音樂混合的模型，使用任何組合的音頻文件或文本提示。

這個新模型被稱為Fugatto，簡稱為Foundational Generative Audio Transformer Opus 1。根據Nvidia的說法，其能力無與倫比。例如，Fugatto可以僅根據文本創作旋律，改變歌手的情感表達或口音，甚至能從現有歌曲中添加或去除樂器。

Fugatto可能會徹底改變音樂創作的過程。透過這個工具，製作人可以快速原型化新歌曲的概念，並配上自定義的聲音風格和樂器，或調整現有曲目的效果。

多白金製作人及詞曲創作人Ido Zmishlany認為，AI及像Fugatto這樣的工具將幫助書寫音樂的新篇章。不過，這個模型並不僅限於音樂製作。

Nvidia強調了幾個替代用途，例如廣告公司可以利用它來修改廣告中的聲音，以適應不同的地區、情境或語言。這個模型也可以幫助增強語言學習工具，讓用戶自定義說話者的聲音，例如讓其聽起來像朋友或家人。

視頻遊戲開發者可以利用這個工具根據玩家的輸入即時創建新資產，或修改預錄的資產，以最佳方式契合當前畫面上的行動。

研究者的願景：參與該項目的研究者Rafael Valle表示，他們希望創建一個能夠像人類一樣理解和生成聲音的模型。

超過一年的時間用於打造Fugatto的完整版本，該模型使用了25億個參數。Nvidia表示，該模型是在一組DGX系統上進行訓練，這些系統配備32個Nvidia H100 Tensor Core GPU。不幸的是，尚未透露Fugatto何時會向公眾發布的時間表。

—

從這篇報導中，我們可以看到AI技術在音頻製作領域的潛力，Fugatto不僅能提升音樂創作的效率，還可能對廣告、語言學習及遊戲開發等多個行業產生深遠影響。值得注意的是，雖然AI的進步為創意工作帶來了便利，但同時也引發了對創作原創性和人類藝術家角色的思考。未來，如何平衡AI技術的使用與保護人類創意的價值，將是一個重要的議題。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。