Nvidia推出新AI技術:音樂和聲音的革命!




Nvidia展示可修改聲音及生成新聲音的AI模型

(路透社)- Nvidia(NASDAQ:NVDA)於週一展示了一款新的人工智能模型,該模型可用於生成音樂和音頻,並能修改聲音和生成新聲音,這項技術主要針對音樂、電影和視頻遊戲的製作人。

Nvidia是全球最大的芯片和軟件供應商,專注於創建AI系統。該公司表示,尚未有公開發布這項技術的計劃,這項技術被稱為Fugatto,意為“基礎生成音頻變壓器Opus 1”。

這項技術與其他初創公司如Runway以及大型企業如Meta Platforms(NASDAQ:META)展示的技術相似,這些技術均可根據文本提示生成音頻或視頻。

總部位於加利福尼亞州聖克拉拉的Nvidia版本能根據文本描述生成音效和音樂,包括創造新聲音,例如讓小號像狗一樣吠叫。

這項技術與其他AI技術的不同之處在於它能夠接收和修改現有音頻,例如將鋼琴演奏的旋律轉換為人聲演唱的旋律,或改變已錄製的口語記錄中的口音及情感。

Nvidia應用深度學習研究副總裁Bryan Catanzaro表示:“如果我們回顧過去50年合成音頻的發展,音樂因為電腦和合成器而變得不同。我相信生成性AI將為音樂、視頻遊戲以及普通創作者帶來新的能力。”

儘管像OpenAI這樣的公司正在與好萊塢工作室協商AI在娛樂行業中的使用方式,但科技與好萊塢之間的關係已變得緊張,特別是在好萊塢明星斯嘉麗·約翰遜指控OpenAI模仿她的聲音之後。

Nvidia的新模型是基於開源數據進行訓練的,該公司表示,仍在討論是否以及如何公開發布這項技術。

Catanzaro指出:“任何生成技術都帶有一定風險,因為人們可能會利用它生成我們不希望看到的內容。我們需要小心這一點,這也是為什麼我們沒有立即發布的計劃。”

生成性AI模型的創作者尚未確定如何防止技術的濫用,例如用戶生成虛假信息或侵犯版權的角色。

OpenAI和Meta同樣尚未公布何時計劃將生成音頻或視頻的模型釋放給公眾。

這項技術的展示不僅展示了Nvidia在AI領域的持續創新,也反映了科技與創意產業之間日益緊張的關係。隨著AI進一步進入音樂和娛樂行業,如何平衡創新與版權保護將成為未來的挑戰。值得注意的是,這種技術可能會引發許多倫理和法律問題,尤其是在聲音模仿和版權方面,這需要業界和監管機構共同努力制定相應的規範。這也提醒了我們,科技的發展必須考慮到其社會影響,才能真正造福於人類。

以上文章由特價GPT API根據網上資料所翻譯及撰寫,過程中沒有任何人類參與 🙂

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放

立即升級 🔗

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
Use the original face exactly as it is, without changing a details. A female model with sharp features, defined cheekbones, and intense, direct eye contact (though eyes are slightly in shadow from the hat).
• Aesthetic: Vintage fashion, Pin-up, 1950s/1960s style, high-glamour, summer resort wear.
• Lighting: Bright, harsh sunlight creating high contrast and crisp shadows. The light should perfectly illuminate the skin and the vibrant colors of the dress.
• Color Palette: Dominated by vibrant yellow, crisp white, and bold red, accented by deep black.
Specific Outfit & Details:
• Dress: A bright yellow halter-neck sundress with a classic white polka-dot pattern. It has a fitted, sweetheart neckline or bustier-style top that enhances the silhouette.
• Accessories:
• A very large, wide-brimmed sun hat in crisp white (or light straw/fabric) that casts a shadow over the upper face.
• A matching yellow polka-dot scarf tied closely around the neck (like an ascot or choker-style).
• Large, striking black statement earrings (circular, drop, or bead style).
• Bold red lipstick is a key feature, contrasting sharply with the yellow and white.
Technical/Camera Details:
• Shot: Close-up or medium-close-up portrait, focusing on the torso, neckline, face, and hat.
• Depth of Field: Shallow (low f-stop), with the model in sharp focus and the background slightly blurred (bokeh).
• Background: Out-of-focus, suggesting a bright outdoor location, with abstract shapes of boats/yachts (white and red accents visible) in a marina setting. A low-angle, wide-lens street shot in a bustling cityscape (similar to Shibuya, Tokyo). A young woman crouches confidently beside a modified, glossy purple sports car with a Japanese license plate. She wears a black graphic tee, cargo pants, white sneakers, and silver jewelry. The background features tall glass skyscrapers, colorful billboards, neon signage, and warm late-afternoon lighting. Strong perspective distortion emphasizes the height of the buildings and the car’s aggressive stance. The mood is stylish, bold, and modern, capturing urban automotive culture with a cinematic, hyper-real aesthetic. High detail, high contrast, crisp reflections, editorial fashion vibe, dynamic street energy. 一張年輕東方女性站在戶外木棧道上的全身人像照片。
人物與穿著:
這位女性擁有修長的身材和淺棕色的長直髮,留著齊劉海。
她面帶微笑,表情甜美。頭上戴著一對動物耳朵的髮飾。
上半身穿著一件白色的短版 T 恤/緊身衣(Crop Top),領口較低。
下半身是一條淺藍色的牛仔短裙,裙襬帶有蕾絲邊緣。繫著一條淺棕色的皮帶
腳上穿著一雙露趾的裸色高跟涼鞋。
背景與環境:
她站在一條戶外的深色木質棧道上,左手輕輕扶著旁邊的深色木質欄杆。
背景呈現柔和的散景(景深很淺),可以看到綠色的植物和一些被處理成偏冷藍色調的樹枝或樹葉,營造出一種清新且夢幻的氛圍。
總體而言,這張照片風格清新、甜美,光線柔和,突出了人物的時尚穿搭和外貌。