我終於獲得了OpenAI的Sora訪問權限,但我對它的學習曲線感到掙扎
在每個月只有有限數量的視頻生成次數時,你必須明智地使用它們。
使用Sora的初步體驗
經過數月的等待,終於來了——OpenAI推出了它的視頻生成器Sora。或者說,至少它開放了這個工具的訪問權限,結果整個互聯網都同時湧入,迫使OpenAI暫停了賬號創建。憑藉一點耐心和堅持,我終於通過了候補名單,現在我可以生成幾乎任何我能想到的東西——在一些明確的限制之內。
然而,隨著這種強大的能力和責任而來的是另一種挑戰:一個巨大的學習曲線。儘管我很享受使用Sora,也對它的功能感到驚訝,但我卻在確定完美的提示方面遇到了困難。相信這只是熟能生巧的問題,但這是我使用Sora的頭幾天的經歷。
Sora的運作方式
首先,讓我們來談談Sora的運作方式——或者至少如何訪問這個強大的視頻生成工具。雖然它來自OpenAI,而你需要成為ChatGPT Plus或Pro會員才能開始創建,但你不能通過主要的ChatGPT界面訪問Sora。相反,你必須直接前往Sora的網站(sora.com),那裡有一個展示的剪輯庫,將標準設置得非常高。
至少在我自己的腦海中,它們的標準非常高。我瀏覽了一些視頻,查看了它們的提示,觀看了它們的流暢運行,心想我也可以做到。畢竟,我的提示會通過與他們相同的DALL-E 3版本來運行,所以它們應該看起來一樣好,對吧?其實並不是那麼簡單。當然,輸入提示是相對簡單的,但確定Sora最能響應的內容卻有點困難。
視頻創建的限制
在我們談論挑戰之前,我應該先澄清一下Sora目前的一些限制。與Google的Pixel Studio或其他基本圖像生成器不同,你不能隨心所欲地運行Sora——至少作為每月20美元的ChatGPT Plus會員,你是無法這樣做的。
相反,你會獲得1,000個積分,可以根據需要在視頻生成上使用。你在提示中更改的每一項內容,從畫幅比例到時長再到解析度,將消耗一定數量的積分,直到本月用完為止。全新視頻的成本從20個積分到2,000個積分不等,這裡有一個有用的費用表——我希望我在花了260個積分僅用20分鐘之前就能找到它。作為Plus會員,你還只能一次生成一個視頻,最高解析度為720p。
如果你選擇了ChatGPT Pro會員,限制就會鬆動得多,但價格也高得多,每月200美元。你將獲得10,000個積分以優先生成視頻,之後可以無限生成視頻;只不過它們會花費更長的時間——OpenAI稱這些為“放鬆視頻”。Pro會員還可以同時生成五個視頻,將解析度提升到1080p,並允許視頻長達20秒。
不幸的是,無論你支付哪個級別的ChatGPT會員費,Sora生成的視頻都沒有音頻,因此你需要下載剪輯並在確定視覺效果後同步音樂或音效。OpenAI已經表示,將來Sora會支持音頻,只是目前還沒有。
使用過程中的挑戰
在這些基本介紹結束後,使用Sora生成視頻的其餘部分應該很簡單,對吧?其實是的,但也不是。雖然輸入提示、從底部菜單中選擇設置並等待視頻生成確實很簡單,但想出值得在Sora的動態展示中出現的內容卻要難得多。
為了分享我本月有限的積分,當我獲得Sora的使用權後,我馬上聯繫了我的同事Mitja。我們一直在討論我們何時能夠快速訪問這個平台,因此我想他可能會有一些好的生成想法。結果,他的第一個想法是我根本想不到的:在悉尼歌劇院前,十隻穿著西裝的斑馬在跳舞,背景音樂是邁克爾·傑克遜的歌曲,同時還在吃香蒜青醬意大利餃子。這可能聽起來是一個奇怪的視頻,但如果Sora能處理這麼多細節,那它肯定是真正的實力。
當我笑完這個主意後,我把它輸入Sora並等待結果。從技術上講,最終產品大部分都正確。它在悉尼歌劇院前放了一群穿著西裝的斑馬,並且它們手中拿著綠色的盤子。然而,數量在八隻到十二隻之間變化,沒有顯示出是邁克爾·傑克遜的歌曲,香蒜青醬意大利餃子也只是個綠盤子——接近,但還不完全正確。更令人擔憂的是,由於我希望十秒的剪輯能展示更多的舞蹈,這個視頻的成本提升到了100個積分,但結果並沒有實現。
然而,我隨後了解到,Sora的故事板工具對於涉及複雜運動的任何內容都是必不可少的。它允許你在五秒或十秒的時間線上拖放剪輯,幫助Sora打破動作並從一個方向流向另一個方向。因此,為了讓我的斑馬朋友多一點動作,我進入了故事板,將跳舞和吃意大利餃子分成兩個不同的動作,然後使用ChatGPT增強我的描述——這又是一個故事板的內置功能。
再一次…… 有點有效,但又不完全有效。是的,我得到了斑馬,它們在悉尼歌劇院前,但它們已經放棄了跳舞,當我要求它們吃一些意大利餃子時,它們突然長出了人類的手來拿叉子。抱歉,動態展示,但我覺得我還有很長的路要走。
我還嘗試了更自然的提示,比如麵條企鵝從冰山滑入海洋,還有更奇幻的提示,比如一片有著皮克斯風格臉孔的烤麵包跳出烤麵包機,結果大致相同。Sora在處理每個提示的某些部分時非常出色,但你必須以正確的細節描述你的場景。細節過多,Sora會開始合併不同的元素;細節過少,則會得到一個相對乏味的成品。
儘管如此,Sora的功能還有更多,特別是在編輯方面。這個視頻生成器還具備重新剪輯、混音和融合剪輯的能力,可以擴展一個想法、將一個視頻與另一個視頻連接,或者剪去那些不合適的元素。但我仍然希望能夠在第一次就製作出看起來不錯的視頻。
對未來的期待
總的來說,我使用Sora的頭幾天可以說是褒貶不一。這個視頻生成器完美嗎?不過,我不能完全責怪OpenAI。這是我第一次基於文本生成視頻,因此我不驚訝自己在確定正確細節方面遇到了困難。到目前為止,我給Sora提供了過多的信息,或是過少的信息,這意味著找到正確的提示應該就在不遠處。
更重要的是,我對Sora所承諾的功能印象深刻。作為ChatGPT Plus會員,我可以在幾秒鐘內創建的視頻,我想隨著模型的持續訓練,它們會變得更快。我不太確定我是否會立即使用Sora生成的快速剪輯——其中許多仍然存在奇怪的瑕疵,比如斑馬身上出現人類的手臂——但那些進入Sora的動態展示的剪輯讓我充滿希望,這只是學會如何要求正確元素的問題。
我對Sora印象深刻,但我還有很多學習要做。
此外,我不會驚訝如果OpenAI對提示和創作的處理方式也會隨之改變。目前,當你作為ChatGPT Plus會員用完1,000個積分後,就是這樣——在你的計費周期重新開始之前,沒有辦法再購買幾個額外的積分。同樣,沒有辦法將未使用的積分從一個月轉到下一個月,因此你必須找到支出和節省的平衡,以便度過整個月。
如果由我來決定,我會想要重新獲得一些我花掉的較為奇怪的積分,但這不是一個選項。相反,我將其視為學習的代價,我只能花更多時間來微調我的提示,然後再將它們發送給Sora。也許有一天,我會想出一些值得展示的內容。
編輯評論
這篇文章清楚地揭示了新技術在實際應用中的挑戰與潛力。Sora的推出無疑是視頻生成技術的一個重要進步,但作者的經歷也讓我們看到,創作過程中不僅僅是技術的挑戰,更是用戶如何有效地與工具互動的挑戰。隨著AI技術的進步,未來的用戶在創作時可能會面臨更高的期望和更大的創作自由度。這也提醒我們,在追求創造力的同時,對細節的把握和對工具的熟悉程度是至關重要的。隨著時間的推移,這些工具可能會變得更為成熟和易用,讓更多的創作者能夠輕鬆實現自己的想法。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。