阿里巴巴開源AI一站式影片創作神器

zero comment

Ai Finance Tech

阿里巴巴推出開源AI影片製作及編輯模型Wan2.1-VACE　革新創作流程

阿里巴巴近日公布最新開源AI影片創作及編輯模型——Wan2.1-VACE（Video All-in-one Creation and Editing），為影片製作帶來嶄新突破。這個創新工具將多種影片處理功能集於一身，大大簡化影片創作流程，提升效率和生產力。

多功能一體化　行業首創開源方案

作為阿里巴巴Wan2.1系列大型影片生成模型的一員，VACE是業界首個開源、能統一處理多種影片生成及編輯任務的模型。Wan2.1-VACE支援多模態輸入，包括文字、圖片及影片，並為創作者提供全面的影片編輯能力。這些功能包括參考圖片或畫格、影片重繪、局部修改及時空擴展等，讓不同任務靈活組合，激發創意潛能。

透過這個先進工具，用戶可以根據圖片樣本生成包含特定互動主體的影片，亦可為靜態圖片加入自然動態效果，令畫面「活」起來。此外，模型提供高階影片重繪功能，例如姿勢轉換、動作控制、深度控制及重新上色。

模型亦支援對影片特定區域進行增刪改動而不影響其他部分，還可智能擴展影片邊界並自動填充內容，豐富視覺體驗。

作為一體化AI模型，Wan2.1-VACE具備極高靈活性，用戶可無縫結合多種功能，釋放創新潛力。你可以將靜態圖片變成影片，並按指定路徑控制物件移動；亦可用參考素材無縫替換角色或物件、動畫化參考角色、控制姿勢，甚至將直幅圖片橫向擴展成橫幅影片並加入新元素。

技術創新　統一處理多模態輸入

Wan2.1-VACE採用多項創新技術，設計時充分考慮不同影片編輯任務的需求。其統一介面「影片條件單元（VCU）」可處理文字、圖片、影片及遮罩等多種輸入。

模型採用Context Adapter結構，將各種任務概念以時空維度的形式化表達注入模型，令其能靈活應對不同影片合成任務。

憑藉架構創新，Wan2.1-VACE廣泛適用於社交媒體短片快速製作、廣告及市場推廣內容創作、影視後期及特效處理、教育培訓影片生成等場景。

大型影片基礎模型訓練需耗費大量算力和高質素數據。開源可降低AI應用門檻，讓更多企業以低成本快速製作出符合自身需求的高質視覺內容。

阿里巴巴將Wan2.1-VACE分為140億參數及13億參數兩個版本，已於Hugging Face、GitHub及阿里雲ModelScope社群免費開放下載。

作為全球最早開源自研大模型的科技企業之一，阿里巴巴早於2025年2月已開源四個Wan2.1模型，上月又推出支援起止畫格影片生成的模型。至今，這些模型於Hugging Face及ModelScope累計下載量超過330萬次。

阿里巴巴集團簡介

阿里巴巴集團以「讓天下沒有難做的生意」為使命，致力構建未來商業基礎設施。公司願景是讓客戶在阿里巴巴會面、工作和生活，成為一家可持續發展102年的好公司。

編輯評論：開源AI影片時代的來臨　創作門檻與內容監管的雙重考驗

阿里巴巴今次開源Wan2.1-VACE，標誌著AI影片製作進入新紀元。這個模型不僅技術先進，將多種影片生成及編輯工具整合，為內容創作者、行銷人員甚至教育界打開極大想像空間。更重要的是，開源策略將AI民主化，令中小型創作者和企業都可以輕鬆取得高階影片生成功能，徹底顛覆傳統「資本壟斷內容生產」的格局。

然而，這種「人人都可AI製片」的時代，也帶來內容真偽、版權、甚至深度偽造（deepfake）等新挑戰。當AI模型越來越容易取得，假新聞、虛假宣傳、網絡欺詐等風險亦會增加，社會必須同步加強內容監管和數碼素養教育。

從商業角度，Wan2.1-VACE的多模態、可編程特性，預示未來「個人化影片」將成為主流——你可以用一張自拍和幾句描述，AI就能自動生成屬於你的專屬短片。這對廣告、社交媒體、甚至個人品牌經營都會產生巨大影響。

但我們也不能忽視技術門檻下降後，市場將充斥大量「同質化」或「低質素」內容，如何突圍、如何保持創意和審美，將成為新時代創作者的最大挑戰。

總結而言，阿里巴巴Wan2.1-VACE的開源，不僅是技術層面的突破，更是內容產業生態、社會監管與文化創意的多重考驗。香港及全球創作者，必須積極擁抱AI工具，同時思考如何在新一輪內容革命中，守住創意和價值的底線。

Download TXT

alibaba alicloud

阿里巴巴開源AI一站式影片創作神器

chatgpt

🔥 CHATGPT PLUS 帳戶出租

阿里巴巴開源AI一站式影片創作神器

chatgpt

Related Articles

中國限購Nvidia AI晶片只准特定用途

荷蘭股市創新高 AEX收市升0.37%

意大利股市收市微跌0.42% 行業表現分化

🔥 CHATGPT PLUS 帳戶出租