我利用這個免費的AI音樂創作工具製作音樂——質素竟然意外地好
AI音樂生成領域在過去兩年中一直是AI革命其中一個相對穩定的部分。兩個主導公司,Suno和Udio,已經在這個小眾市場上建立了值得信賴的聲譽和粉絲基礎。
不過,這種安穩的現狀可能即將發生劇變。一個名為YuE的新音樂生成平台剛剛推出,並且是免費的、開源的,所生成的音樂質量令人驚訝。
YuE在中文中意指「音樂」和「快樂」,其實是一組協同工作的模型,旨在提供完整的音樂作品。這些模型涵蓋了歌詞創作、樂器和音樂類型。與許多新的中國AI模型一樣,YuE的開放性鼓勵了大量自製開發,主要是為了減少計算需求,讓更多人能夠利用這個工具。
最初的項目需要至少24GB的視頻RAM,而官方建議要創作完整歌曲仍然最低需要80GB。顯然,這對普通家庭用戶來說是遙不可及的,主要是針對專業人士、商業和學術界。
好消息是,許多努力已經投入到為大眾創建更小的包裝中,其中包括受歡迎的Pinokio平台的工作,這讓任何人都能快速輕鬆地在Windows上運行開源AI項目。
取捨之道
這些小型VRAM版本的交換是音質確實有所下降,生成時間可能極為緩慢。即使使用Pinokio,基本的VRAM需求仍然需要12GB,這對於大多數計算機來說都是不現實的。然而,最近一位有創意的用戶推出了一個超低內存版本,讓我能夠在我的僅有8GB RTX GPU系統上進行實驗。
這是我創作的作品:
第一印象是非常熟練的Gradio用戶界面。螢幕左側是提示框,下面是用來輸入歌詞的框,然後是你想生成的曲目數量。還可以設置你想使用的RAM量,這與歌曲的長度和段落數量有關。
按下生成按鈕,然後坐等平台生成音軌。
開發者聲稱,使用16GB VRAM的GPU,一分鐘的音軌只需四分鐘來創作。不幸的是,這似乎並不會隨著內存的降低而相應縮短,因為在我的8GB系統上,生成兩首40秒和50秒的曲目分別需要2到2.5小時。
開發者聲稱,使用16GB VRAM的GPU,一分鐘的音軌只需四分鐘來創作。
但無論如何,這些曲目都非常驚人。雖然它們較短,音質也不是頂級,但音樂性卻令人驚艷。
上次我在計算機上測試AI音樂生成時,聽起來就像90年代的髒街機。這次的音樂是真正的音樂,準確遵循提示,出色的聲音和商業AI服務應有的樂器編排。
你可以在這裡的SoundCloud上聽到更多成果:
結語
這個項目仍然非常粗糙,所需的計算資源也非常驚人。即使你有一台不錯的計算機,你也會花很多時間等待音軌的生成。但是——這是個大「但是」——儘管有這些缺點,這仍然是這個領域開放產品的一次驚人初試。
如果開源AI音樂生成現在能產生這種質量,那麼商業服務如Udio和Suno將很快感受到來自DIY社區的真實壓力。
這篇文章讓我反思了開源技術的潛力和對商業市場的影響。YuE的出現不僅是對音樂創作的一次革新,也是對商業模式的一次挑戰。隨著越來越多的開源項目涌現,未來的音樂創作可能不再需要依賴昂貴的商業軟件,這將使創作變得更加民主化。這樣的發展不僅有助於音樂創作者的多元化,也可能改變整個音樂產業的生態系統。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。
🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年!
不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放