Lightricks 推出 13 億參數 LTXV 模型 AI 影片生成技術再升級
AI 視覺內容技術先驅 Lightricks,最近針對 OpenAI、Meta、Google 等大型科技企業在 AI 影片生成領域的突破,發布了一款全新升級的開源模型 LTXV-13B,為高效、高清影片生成樹立新標準。
LTXV-13B 是 Lightricks 原有高效影片生成器 LTX Video 的後繼型號。過去,LTX Video 已經可以在一般消費級硬件上,以極快速度製作高質素影片。今次 LTXV-13B 進一步提升,參數量由原本的 20 億大幅升級到 130 億,帶來更高層次的細緻度和智能。新版本還引入了多重尺度渲染(multiscale rendering)技術,進一步降低延遲,同時讓用戶更容易微調影片細節。
Lightricks 行政總裁 Zeev Farbman 表示:「用戶現在可以創作更穩定、更高質、更可控的內容。新一代 LTX Video 依然可以在消費級硬件上運行,並延續我們一貫的產品特點——速度、創造力和易用性。」
堅持開源 推動 AI 創新
Lightricks 推出 LTXV-13B,明確表達對開源模式的堅持,認為這是推動 AI 產業創新的最佳方法。從第一代 LTXV 開始,公司就希望讓模型盡量開放,鼓勵 AI 愛好者和學術界人士自由實驗和改良。
Lightricks 管理層認為,AI 行業的突破往往來自初創企業、獨立開發者甚至業餘玩家,只有開放最先進的模型,才能真正釋放生態系統的潛力。相比之下,OpenAI 的 Sora、Adobe 的 Firefly 等頂尖影片生成模型,全部被封鎖在收費 API 之後,對新入行者造成高門檻,也無法在這些專有模型上進行二次開發。
Farbman 曾接受媒體訪問時直言:「現時市面上最好的模型都是封閉的,這不只涉及成本問題。例如遊戲公司想用 AI 生成簡單圖像,再試驗不同視覺風格,但封閉模型根本不容許這種彈性。」
LTXV-13B 同樣以開源形式發佈,任何人都可在 Hugging Face 和 GitHub 下載,對年收入少於 1,000 萬美元的企業更是免費授權。用戶可自由調整、微調、增設新功能或強化訓練數據,Lightricks 亦樂見社群帶來更多創新和改進。
Farbman 補充:「我們選擇開放模型,讓學術界和業界都可參與改良,加入新功能,這將令我們更具競爭力。」
社群貢獻與「道德」訓練數據
LTXV-13B 的發展亦大量受惠於開源社群。社群協助提升模型的創意適應力、動作一致性和場景連貫性,令影片質素再上一層樓。新版本還加入影片編輯的升頻控制(upsampling controls),方便用戶細緻調整畫格和消除雜訊。另一重點技術是 VACE 推理(VACE model inference),簡化影片對影片、參考圖對影片及遮罩影片編輯等操作。
此外,社群亦協助模型優化推理效率,即使 LTXV-13B 體積遠大於前作,仍可透過 Q8 kernels 配合 diffusers,在一般硬件上順暢運行。
值得一提的是,LTXV-13B 的訓練數據完全來自 Getty Images 和 Shutterstock 等正版庫,與 OpenAI 等科技巨頭被指「爬蟲」網絡內容、涉嫌侵權的做法形成強烈對比。Lightricks 強調,這不但確保道德合規,更因高質素的圖像資源而大幅提升模型的影片生成水平。
多重尺度渲染技術亦令 LTXV-13B 在細節控制和速度上領先同類產品,渲染速度甚至比同級模型快 30 倍。
AI 影片生成競賽白熱化
LTXV-13B 的推出,正值 AI 影片生成技術競賽進入白熱化。事實上,距離 Lightricks 發布 LTXV 0.9.6 重大升級僅僅三星期。當時新版本已因速度大增、指令理解力更高、畫面連貫性更好而獲用戶好評,預設輸出解像度提升至 1216×704 像素、30 格每秒,令影片更流暢。Lightricks 亦有「精煉版」模型,專為低階硬件而設。
AI 社群勢必關注 LTXV-13B 能否超越業界其他競爭對手。近月來,Runway 推出 Gen-4 模型,在角色、場景、物件生成的一致性上取得突破。OpenAI、Google、Adobe 最新的 Sora、Veo 2、Firefly 等專有模型持續引發關注,阿里雲亦於 2 月開源 14B 和 1.3B 參數的 Wan 2.1 系列。
「道德 AI」亦成新戰場。初創公司 Moonvalley 今年三月推出的 Marey 影片生成模型,強調只用自家或完全授權的數據訓練,與 Lightricks 走相似路線。
LTXV-13B 另一優勢是與 Lightricks 的 LTX Studio 平台無縫整合。雖然模型可自行下載,但透過網頁應用更方便,無需昂貴拍攝器材,專業及業餘創作者都可輕鬆製作精美影片。LTX Studio 還提供鏡頭運動控制、關鍵幀編輯、多鏡頭剪接等進階功能,並支援 Veo 2、Flux 等第三方模型,方便用戶多方實驗。
編輯評論:開源 x 合規 x 創新——Lightricks 的三重賭注
Lightricks 今次的策略非常值得香港科技圈深思。首先,開源不單是技術共享,更是破壞現有「大台壟斷」的利器。OpenAI、Google 等巨頭的專有模型雖然強大,但始終設有高牆,限制了創新和普及。Lightricks 這種「開放即競爭」的哲學,或許正是推動 AI 生態多元化的關鍵。
其次,Lightricks 堅持用「乾淨」授權數據訓練模型,正面回應了全球對 AI 版權和倫理的憂慮。這種做法,既減低法律風險,也提升用戶對 AI 創作的信任感。對比那些「爬蟲式」訓練模型,這種合規路線或許會成為未來主流。
最後,Lightricks 將社群貢獻和平台化結合,令技術不再局限於專業人士,普通創作者也能參與 AI 影片革命。這種「去中心化」的創新模式,對香港的初創和內容產業來說,是一種全新啟發——只要你有創意,AI 工具隨手可得,人人都可以是導演、動畫師。
AI 影片生成的競賽,已經不只是技術之爭,更是開放、合規、創意的三重角力。Lightricks 今次的 LTXV-13B,無疑為這場賽事增添了新變數。香港的創業者、內容創作者,準備好迎接這場 AI 革命了嗎?