Nvidia推出新AI技術:音樂和聲音的革命!

Nvidia展示可修改聲音及生成新聲音的AI模型

(路透社)- Nvidia(NASDAQ:NVDA)於週一展示了一款新的人工智能模型,該模型可用於生成音樂和音頻,並能修改聲音和生成新聲音,這項技術主要針對音樂、電影和視頻遊戲的製作人。

Nvidia是全球最大的芯片和軟件供應商,專注於創建AI系統。該公司表示,尚未有公開發布這項技術的計劃,這項技術被稱為Fugatto,意為“基礎生成音頻變壓器Opus 1”。

這項技術與其他初創公司如Runway以及大型企業如Meta Platforms(NASDAQ:META)展示的技術相似,這些技術均可根據文本提示生成音頻或視頻。

總部位於加利福尼亞州聖克拉拉的Nvidia版本能根據文本描述生成音效和音樂,包括創造新聲音,例如讓小號像狗一樣吠叫。

這項技術與其他AI技術的不同之處在於它能夠接收和修改現有音頻,例如將鋼琴演奏的旋律轉換為人聲演唱的旋律,或改變已錄製的口語記錄中的口音及情感。

Nvidia應用深度學習研究副總裁Bryan Catanzaro表示:“如果我們回顧過去50年合成音頻的發展,音樂因為電腦和合成器而變得不同。我相信生成性AI將為音樂、視頻遊戲以及普通創作者帶來新的能力。”

儘管像OpenAI這樣的公司正在與好萊塢工作室協商AI在娛樂行業中的使用方式,但科技與好萊塢之間的關係已變得緊張,特別是在好萊塢明星斯嘉麗·約翰遜指控OpenAI模仿她的聲音之後。

Nvidia的新模型是基於開源數據進行訓練的,該公司表示,仍在討論是否以及如何公開發布這項技術。

Catanzaro指出:“任何生成技術都帶有一定風險,因為人們可能會利用它生成我們不希望看到的內容。我們需要小心這一點,這也是為什麼我們沒有立即發布的計劃。”

生成性AI模型的創作者尚未確定如何防止技術的濫用,例如用戶生成虛假信息或侵犯版權的角色。

OpenAI和Meta同樣尚未公布何時計劃將生成音頻或視頻的模型釋放給公眾。

這項技術的展示不僅展示了Nvidia在AI領域的持續創新,也反映了科技與創意產業之間日益緊張的關係。隨著AI進一步進入音樂和娛樂行業,如何平衡創新與版權保護將成為未來的挑戰。值得注意的是,這種技術可能會引發許多倫理和法律問題,尤其是在聲音模仿和版權方面,這需要業界和監管機構共同努力制定相應的規範。這也提醒了我們,科技的發展必須考慮到其社會影響,才能真正造福於人類。

以上文章由特價GPT API根據網上資料所翻譯及撰寫,過程中沒有任何人類參與 🙂

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *