Nvidia推出新AI技術：音樂和聲音的革命！

zero comment

Finance

Nvidia展示可修改聲音及生成新聲音的AI模型

（路透社）- Nvidia（NASDAQ:NVDA）於週一展示了一款新的人工智能模型，該模型可用於生成音樂和音頻，並能修改聲音和生成新聲音，這項技術主要針對音樂、電影和視頻遊戲的製作人。

Nvidia是全球最大的芯片和軟件供應商，專注於創建AI系統。該公司表示，尚未有公開發布這項技術的計劃，這項技術被稱為Fugatto，意為“基礎生成音頻變壓器Opus 1”。

這項技術與其他初創公司如Runway以及大型企業如Meta Platforms（NASDAQ:META）展示的技術相似，這些技術均可根據文本提示生成音頻或視頻。

總部位於加利福尼亞州聖克拉拉的Nvidia版本能根據文本描述生成音效和音樂，包括創造新聲音，例如讓小號像狗一樣吠叫。

這項技術與其他AI技術的不同之處在於它能夠接收和修改現有音頻，例如將鋼琴演奏的旋律轉換為人聲演唱的旋律，或改變已錄製的口語記錄中的口音及情感。

Nvidia應用深度學習研究副總裁Bryan Catanzaro表示：“如果我們回顧過去50年合成音頻的發展，音樂因為電腦和合成器而變得不同。我相信生成性AI將為音樂、視頻遊戲以及普通創作者帶來新的能力。”

儘管像OpenAI這樣的公司正在與好萊塢工作室協商AI在娛樂行業中的使用方式，但科技與好萊塢之間的關係已變得緊張，特別是在好萊塢明星斯嘉麗·約翰遜指控OpenAI模仿她的聲音之後。

Nvidia的新模型是基於開源數據進行訓練的，該公司表示，仍在討論是否以及如何公開發布這項技術。

Catanzaro指出：“任何生成技術都帶有一定風險，因為人們可能會利用它生成我們不希望看到的內容。我們需要小心這一點，這也是為什麼我們沒有立即發布的計劃。”

生成性AI模型的創作者尚未確定如何防止技術的濫用，例如用戶生成虛假信息或侵犯版權的角色。

OpenAI和Meta同樣尚未公布何時計劃將生成音頻或視頻的模型釋放給公眾。

—

這項技術的展示不僅展示了Nvidia在AI領域的持續創新，也反映了科技與創意產業之間日益緊張的關係。隨著AI進一步進入音樂和娛樂行業，如何平衡創新與版權保護將成為未來的挑戰。值得注意的是，這種技術可能會引發許多倫理和法律問題，尤其是在聲音模仿和版權方面，這需要業界和監管機構共同努力制定相應的規範。這也提醒了我們，科技的發展必須考慮到其社會影響，才能真正造福於人類。

以上文章由特價GPT API根據網上資料所翻譯及撰寫，過程中沒有任何人類參與 🙂