阿里巴巴推出開源AI影片製作及編輯模型Wan2.1-VACE 革新創作流程
阿里巴巴近日公布最新開源AI影片創作及編輯模型——Wan2.1-VACE(Video All-in-one Creation and Editing),為影片製作帶來嶄新突破。這個創新工具將多種影片處理功能集於一身,大大簡化影片創作流程,提升效率和生產力。
多功能一體化 行業首創開源方案
作為阿里巴巴Wan2.1系列大型影片生成模型的一員,VACE是業界首個開源、能統一處理多種影片生成及編輯任務的模型。Wan2.1-VACE支援多模態輸入,包括文字、圖片及影片,並為創作者提供全面的影片編輯能力。這些功能包括參考圖片或畫格、影片重繪、局部修改及時空擴展等,讓不同任務靈活組合,激發創意潛能。
透過這個先進工具,用戶可以根據圖片樣本生成包含特定互動主體的影片,亦可為靜態圖片加入自然動態效果,令畫面「活」起來。此外,模型提供高階影片重繪功能,例如姿勢轉換、動作控制、深度控制及重新上色。
模型亦支援對影片特定區域進行增刪改動而不影響其他部分,還可智能擴展影片邊界並自動填充內容,豐富視覺體驗。
作為一體化AI模型,Wan2.1-VACE具備極高靈活性,用戶可無縫結合多種功能,釋放創新潛力。你可以將靜態圖片變成影片,並按指定路徑控制物件移動;亦可用參考素材無縫替換角色或物件、動畫化參考角色、控制姿勢,甚至將直幅圖片橫向擴展成橫幅影片並加入新元素。
技術創新 統一處理多模態輸入
Wan2.1-VACE採用多項創新技術,設計時充分考慮不同影片編輯任務的需求。其統一介面「影片條件單元(VCU)」可處理文字、圖片、影片及遮罩等多種輸入。
模型採用Context Adapter結構,將各種任務概念以時空維度的形式化表達注入模型,令其能靈活應對不同影片合成任務。
憑藉架構創新,Wan2.1-VACE廣泛適用於社交媒體短片快速製作、廣告及市場推廣內容創作、影視後期及特效處理、教育培訓影片生成等場景。
大型影片基礎模型訓練需耗費大量算力和高質素數據。開源可降低AI應用門檻,讓更多企業以低成本快速製作出符合自身需求的高質視覺內容。
阿里巴巴將Wan2.1-VACE分為140億參數及13億參數兩個版本,已於Hugging Face、GitHub及阿里雲ModelScope社群免費開放下載。
作為全球最早開源自研大模型的科技企業之一,阿里巴巴早於2025年2月已開源四個Wan2.1模型,上月又推出支援起止畫格影片生成的模型。至今,這些模型於Hugging Face及ModelScope累計下載量超過330萬次。
阿里巴巴集團簡介
阿里巴巴集團以「讓天下沒有難做的生意」為使命,致力構建未來商業基礎設施。公司願景是讓客戶在阿里巴巴會面、工作和生活,成為一家可持續發展102年的好公司。
編輯評論:開源AI影片時代的來臨 創作門檻與內容監管的雙重考驗
阿里巴巴今次開源Wan2.1-VACE,標誌著AI影片製作進入新紀元。這個模型不僅技術先進,將多種影片生成及編輯工具整合,為內容創作者、行銷人員甚至教育界打開極大想像空間。更重要的是,開源策略將AI民主化,令中小型創作者和企業都可以輕鬆取得高階影片生成功能,徹底顛覆傳統「資本壟斷內容生產」的格局。
然而,這種「人人都可AI製片」的時代,也帶來內容真偽、版權、甚至深度偽造(deepfake)等新挑戰。當AI模型越來越容易取得,假新聞、虛假宣傳、網絡欺詐等風險亦會增加,社會必須同步加強內容監管和數碼素養教育。
從商業角度,Wan2.1-VACE的多模態、可編程特性,預示未來「個人化影片」將成為主流——你可以用一張自拍和幾句描述,AI就能自動生成屬於你的專屬短片。這對廣告、社交媒體、甚至個人品牌經營都會產生巨大影響。
但我們也不能忽視技術門檻下降後,市場將充斥大量「同質化」或「低質素」內容,如何突圍、如何保持創意和審美,將成為新時代創作者的最大挑戰。
總結而言,阿里巴巴Wan2.1-VACE的開源,不僅是技術層面的突破,更是內容產業生態、社會監管與文化創意的多重考驗。香港及全球創作者,必須積極擁抱AI工具,同時思考如何在新一輪內容革命中,守住創意和價值的底線。
🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年!
不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放