OpenAI Sora:文字轉影片AI新突破,影片編輯功能全面睇

Ai

認識Sora:OpenAI的文本轉視頻AI

隨著生成式AI的迅速發展,AI生成的圖像已達到照片真實的水平,並且生成式AI工具已經整合到緊湊的Android手機中。然而,AI生成的視頻在質量上卻落後於AI生成的圖像。OpenAI的Sora旨在填補這一差距,為AI生成視頻設立新的基準。本文提供Sora及其主要特點的概述。

Sora的故事與靈感

Sora於2024年2月由OpenAI首次介紹,並於2024年12月公開推出。這是一個從文本描述生成視頻的AI模型,僅對ChatGPT Plus和Pro用戶開放。Sora這個名字(源自日語,意為「天空」)體現了其無限的創造潛力。

開發團隊包括研究人員Tim Brooks和Bill Peebles,他們選擇這個名字以代表模型的願景。OpenAI將Sora視為朝著創造能理解、模擬並與物理世界互動的AI系統邁出的一步。

解析Sora的混合建模過程

Sora採用混合方法,結合了擴散建模和變壓器網絡。該過程始於隨機噪音,類似於電視上的靜態,然後逐漸精煉成詳細的視頻幀。變壓器網絡處理空間和時間的複雜性,例如不同的視頻時長和解析度。

這種混合設計利用變壓器進行佈局和構圖,而擴散模型則添加質感和細節。基於DALL·E和GPT的進展,Sora還使用了一種重新標註技術,生成詳細的標題以便於視覺訓練數據,提高其根據用戶指令創建視頻的能力。

Sora的視頻編輯工具

Sora提供一系列工具,旨在促進視頻編輯和故事講述。以下是Sora的一些功能概述:

– **Remix**:修改現有視頻的元素,同時保留核心敘事。調整顏色、替換背景,並根據主題或創意目標調整視覺效果。

– **Recut**:修剪或延長視頻片段,以達到精確的節奏和流暢度。選擇關鍵時刻,Sora將生成無縫的附加畫面以填補空白。

– **Loop**:創建重複的視頻片段以進行連續播放。調整開始和結束幀,Sora將確保平滑的過渡,必要時添加額外的幀。

– **Storyboard**:使用時間線和動作序列工具計劃每個視頻細節。標題卡作為敘事工作空間,時間線顯示事件序列。正確的標題卡間距至關重要。卡片放得太近可能會導致突兀的剪接,而間距過大則會增加不必要的細節。

– **Blend**:將兩個視頻合併為一個組合,結合視覺元素、顏色或風格。使用曲線工具控制剪輯隨時間對最終結果的影響。

OpenAI對Sora安全管理的方式

Sora引入了倫理、安全和社會挑戰。其從文本提示生成高度真實視頻的能力引發了對深度偽造的擔憂。這些視頻助長了錯誤信息的傳播,損害了對數字內容的信任。此外,未經授權描繪個人的倫理問題也引發了隱私風險和心理傷害。

為了解決這些問題,OpenAI實施了多項安全措施。根據其系統卡,Sora受到嚴格的內容限制。它會阻止包含極端暴力、露骨材料、仇恨圖像以及未經授權使用知識產權或名人肖像的視頻。它還限制對真實人物的描繪,以減少模仿的風險。透明度措施包括生成視頻的可見和不可見水印(C2PA元數據)。

儘管OpenAI已採取預防措施,Sora在英國、瑞士和歐洲經濟區仍然不可用,原因是法律障礙。OpenAI正在積極努力解決這些問題。

Sora的局限性

Sora提供Pro和Plus訂閱計劃。Pro計劃的價格為每月200美元,提供10,000個信用點,可生成最多500個視頻,視頻最大時長為20秒,解析度最高可達1080p。Plus計劃的月費為20美元,提供1,000個信用點,可生成最多50個視頻,視頻時長限制為5秒,解析度最高為720p。根據用戶反饋,實際使用往往低於廣告的限制,並取決於視頻編輯參數。

從技術角度來看,Sora在準確的物理和運動方面存在困難。它在基本動作(如走路)方面表現良好,但對於複雜動作(如舞蹈或體操)則無法很好執行。物體互動有時會不一致,主題也可能不自然地移動或消失。像圖像模型一樣,實現最佳效果需要反覆調整提示。

探索Sora的多樣應用

儘管Sora仍在開發中,但它擁有巨大的潛力。它將簡化各種用途的視頻創建,讓用戶能夠在不需要技術專業知識或昂貴設備的情況下製作專業品質的視頻。

電影製作人和設計師可以利用Sora迅速實現概念,開發故事板,加快工作流程,並降低成本。在研究和開發中,Sora生成合成數據以支持AI和機器學習模型的訓練,並提供可視化複雜科學概念的工具。

Sora還可以模擬醫療、航空等行業的真實緊急情況,從而降低傳統實體模擬的相關費用。

Sora在文本轉視頻AI中的競爭對手

Sora面臨來自Runway、Google Veo和Luma AI等平台的競爭,每個平台在新興的文本轉視頻領域都提供獨特的功能。Runway的Gen-3 Alpha訂閱費用為每年144美元,而其Gen-2版本則免費。Google Veo 2預計即將推出,並獲得用戶和創作者的早期讚譽,包括Donald Glover。Luma AI的Dream Machine每天允許最多20次免費生成,並提供399.99美元的高級計劃以獲得更高的使用量和優先訪問。

對於Sora的推出,無疑是AI技術的一次重要進步,尤其是在視頻創作領域。這不僅為創作者提供了強大的工具,也可能改變我們對視頻內容創作的理解和方式。然而,隨著這項技術的發展,如何平衡創造力與倫理問題將成為未來的一大挑戰。OpenAI需要持續關注如何應對偽造和隱私問題,以確保這些新技術不會被濫用。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon