阿里巴巴開源AI一站式影片創作神器




阿里巴巴推出開源AI影片製作及編輯模型Wan2.1-VACE 革新創作流程

阿里巴巴近日公布最新開源AI影片創作及編輯模型——Wan2.1-VACE(Video All-in-one Creation and Editing),為影片製作帶來嶄新突破。這個創新工具將多種影片處理功能集於一身,大大簡化影片創作流程,提升效率和生產力。

多功能一體化 行業首創開源方案

作為阿里巴巴Wan2.1系列大型影片生成模型的一員,VACE是業界首個開源、能統一處理多種影片生成及編輯任務的模型。Wan2.1-VACE支援多模態輸入,包括文字、圖片及影片,並為創作者提供全面的影片編輯能力。這些功能包括參考圖片或畫格、影片重繪、局部修改及時空擴展等,讓不同任務靈活組合,激發創意潛能。

透過這個先進工具,用戶可以根據圖片樣本生成包含特定互動主體的影片,亦可為靜態圖片加入自然動態效果,令畫面「活」起來。此外,模型提供高階影片重繪功能,例如姿勢轉換、動作控制、深度控制及重新上色。

模型亦支援對影片特定區域進行增刪改動而不影響其他部分,還可智能擴展影片邊界並自動填充內容,豐富視覺體驗。

作為一體化AI模型,Wan2.1-VACE具備極高靈活性,用戶可無縫結合多種功能,釋放創新潛力。你可以將靜態圖片變成影片,並按指定路徑控制物件移動;亦可用參考素材無縫替換角色或物件、動畫化參考角色、控制姿勢,甚至將直幅圖片橫向擴展成橫幅影片並加入新元素。

技術創新 統一處理多模態輸入

Wan2.1-VACE採用多項創新技術,設計時充分考慮不同影片編輯任務的需求。其統一介面「影片條件單元(VCU)」可處理文字、圖片、影片及遮罩等多種輸入。

模型採用Context Adapter結構,將各種任務概念以時空維度的形式化表達注入模型,令其能靈活應對不同影片合成任務。

憑藉架構創新,Wan2.1-VACE廣泛適用於社交媒體短片快速製作、廣告及市場推廣內容創作、影視後期及特效處理、教育培訓影片生成等場景。

大型影片基礎模型訓練需耗費大量算力和高質素數據。開源可降低AI應用門檻,讓更多企業以低成本快速製作出符合自身需求的高質視覺內容。

阿里巴巴將Wan2.1-VACE分為140億參數及13億參數兩個版本,已於Hugging Face、GitHub及阿里雲ModelScope社群免費開放下載。

作為全球最早開源自研大模型的科技企業之一,阿里巴巴早於2025年2月已開源四個Wan2.1模型,上月又推出支援起止畫格影片生成的模型。至今,這些模型於Hugging Face及ModelScope累計下載量超過330萬次。

阿里巴巴集團簡介

阿里巴巴集團以「讓天下沒有難做的生意」為使命,致力構建未來商業基礎設施。公司願景是讓客戶在阿里巴巴會面、工作和生活,成為一家可持續發展102年的好公司。

編輯評論:開源AI影片時代的來臨 創作門檻與內容監管的雙重考驗

阿里巴巴今次開源Wan2.1-VACE,標誌著AI影片製作進入新紀元。這個模型不僅技術先進,將多種影片生成及編輯工具整合,為內容創作者、行銷人員甚至教育界打開極大想像空間。更重要的是,開源策略將AI民主化,令中小型創作者和企業都可以輕鬆取得高階影片生成功能,徹底顛覆傳統「資本壟斷內容生產」的格局。

然而,這種「人人都可AI製片」的時代,也帶來內容真偽、版權、甚至深度偽造(deepfake)等新挑戰。當AI模型越來越容易取得,假新聞、虛假宣傳、網絡欺詐等風險亦會增加,社會必須同步加強內容監管和數碼素養教育。

從商業角度,Wan2.1-VACE的多模態、可編程特性,預示未來「個人化影片」將成為主流——你可以用一張自拍和幾句描述,AI就能自動生成屬於你的專屬短片。這對廣告、社交媒體、甚至個人品牌經營都會產生巨大影響。

但我們也不能忽視技術門檻下降後,市場將充斥大量「同質化」或「低質素」內容,如何突圍、如何保持創意和審美,將成為新時代創作者的最大挑戰。

總結而言,阿里巴巴Wan2.1-VACE的開源,不僅是技術層面的突破,更是內容產業生態、社會監管與文化創意的多重考驗。香港及全球創作者,必須積極擁抱AI工具,同時思考如何在新一輪內容革命中,守住創意和價值的底線。

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放

立即升級 🔗

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
Stylised portrait in emerald green and charcoal black palette. Grayscale realism for subject, upward gaze. Sunglasses with muted emerald reflective lenses. Jacket with ornate baroque/filigree black designs, emerald hood underneath. Textured emerald-green fabric draped below. Background: dense, overlapping hand-inked patterns in emerald, charcoal, and subtle silver — radiating lines, geometric shapes, spirals, parallel contour textures, crosshatching, organic waves, dots. Bold contrast, deep blacks, glowing emerald accents. Mixed-media pop realism. Negative prompt: no cartoon, no art style, no painting, no drawings. A low-angle, wide-lens street shot in a bustling cityscape (similar to Shibuya, Tokyo). A young woman crouches confidently beside a modified, glossy purple sports car with a Japanese license plate. She wears a black graphic tee, cargo pants, white sneakers, and silver jewelry. The background features tall glass skyscrapers, colorful billboards, neon signage, and warm late-afternoon lighting. Strong perspective distortion emphasizes the height of the buildings and the car’s aggressive stance. The mood is stylish, bold, and modern, capturing urban automotive culture with a cinematic, hyper-real aesthetic. High detail, high contrast, crisp reflections, editorial fashion vibe, dynamic street energy. Create a hyper-realistic cinematic scene inside a traditional Wing Chun training hall. The man from the uploaded reference image is training at a wooden dummy with Ip Man standing beside him, personally correcting his technique. Keep both faces accurate to the reference image: exact skin tone, hairstyle, age, expression, and natural sweat on their skin.
Both wear classic black Wing Chun uniforms with white cuffs. Show Ip Man’s calm, focused guidance as he places his hands near the student’s arms on the wooden dummy. Capture the wooden dummy with polished texture and rich warm tones.
Include authentic Chinese decor: calligraphy scrolls, carved wooden frames, soft lantern light, and other students blurred in the background. Use shallow depth of field, warm natural lighting from the windows, and crisp detail on clothing and skin. The scene should feel like a still frame from an Ip Man movie, grounded, disciplined, and cinematic.