AI影片神器Sora實測:超勁功能vs難搞門檻

Ai




我終於獲得了OpenAI的Sora訪問權限,但我對它的學習曲線感到掙扎

在每個月只有有限數量的視頻生成次數時,你必須明智地使用它們。

使用Sora的初步體驗

經過數月的等待,終於來了——OpenAI推出了它的視頻生成器Sora。或者說,至少它開放了這個工具的訪問權限,結果整個互聯網都同時湧入,迫使OpenAI暫停了賬號創建。憑藉一點耐心和堅持,我終於通過了候補名單,現在我可以生成幾乎任何我能想到的東西——在一些明確的限制之內。

然而,隨著這種強大的能力和責任而來的是另一種挑戰:一個巨大的學習曲線。儘管我很享受使用Sora,也對它的功能感到驚訝,但我卻在確定完美的提示方面遇到了困難。相信這只是熟能生巧的問題,但這是我使用Sora的頭幾天的經歷。

Sora的運作方式

首先,讓我們來談談Sora的運作方式——或者至少如何訪問這個強大的視頻生成工具。雖然它來自OpenAI,而你需要成為ChatGPT Plus或Pro會員才能開始創建,但你不能通過主要的ChatGPT界面訪問Sora。相反,你必須直接前往Sora的網站(sora.com),那裡有一個展示的剪輯庫,將標準設置得非常高。

至少在我自己的腦海中,它們的標準非常高。我瀏覽了一些視頻,查看了它們的提示,觀看了它們的流暢運行,心想我也可以做到。畢竟,我的提示會通過與他們相同的DALL-E 3版本來運行,所以它們應該看起來一樣好,對吧?其實並不是那麼簡單。當然,輸入提示是相對簡單的,但確定Sora最能響應的內容卻有點困難。

視頻創建的限制

在我們談論挑戰之前,我應該先澄清一下Sora目前的一些限制。與Google的Pixel Studio或其他基本圖像生成器不同,你不能隨心所欲地運行Sora——至少作為每月20美元的ChatGPT Plus會員,你是無法這樣做的。

相反,你會獲得1,000個積分,可以根據需要在視頻生成上使用。你在提示中更改的每一項內容,從畫幅比例到時長再到解析度,將消耗一定數量的積分,直到本月用完為止。全新視頻的成本從20個積分到2,000個積分不等,這裡有一個有用的費用表——我希望我在花了260個積分僅用20分鐘之前就能找到它。作為Plus會員,你還只能一次生成一個視頻,最高解析度為720p。

如果你選擇了ChatGPT Pro會員,限制就會鬆動得多,但價格也高得多,每月200美元。你將獲得10,000個積分以優先生成視頻,之後可以無限生成視頻;只不過它們會花費更長的時間——OpenAI稱這些為“放鬆視頻”。Pro會員還可以同時生成五個視頻,將解析度提升到1080p,並允許視頻長達20秒。

不幸的是,無論你支付哪個級別的ChatGPT會員費,Sora生成的視頻都沒有音頻,因此你需要下載剪輯並在確定視覺效果後同步音樂或音效。OpenAI已經表示,將來Sora會支持音頻,只是目前還沒有。

使用過程中的挑戰

在這些基本介紹結束後,使用Sora生成視頻的其餘部分應該很簡單,對吧?其實是的,但也不是。雖然輸入提示、從底部菜單中選擇設置並等待視頻生成確實很簡單,但想出值得在Sora的動態展示中出現的內容卻要難得多。

為了分享我本月有限的積分,當我獲得Sora的使用權後,我馬上聯繫了我的同事Mitja。我們一直在討論我們何時能夠快速訪問這個平台,因此我想他可能會有一些好的生成想法。結果,他的第一個想法是我根本想不到的:在悉尼歌劇院前,十隻穿著西裝的斑馬在跳舞,背景音樂是邁克爾·傑克遜的歌曲,同時還在吃香蒜青醬意大利餃子。這可能聽起來是一個奇怪的視頻,但如果Sora能處理這麼多細節,那它肯定是真正的實力。

當我笑完這個主意後,我把它輸入Sora並等待結果。從技術上講,最終產品大部分都正確。它在悉尼歌劇院前放了一群穿著西裝的斑馬,並且它們手中拿著綠色的盤子。然而,數量在八隻到十二隻之間變化,沒有顯示出是邁克爾·傑克遜的歌曲,香蒜青醬意大利餃子也只是個綠盤子——接近,但還不完全正確。更令人擔憂的是,由於我希望十秒的剪輯能展示更多的舞蹈,這個視頻的成本提升到了100個積分,但結果並沒有實現。

然而,我隨後了解到,Sora的故事板工具對於涉及複雜運動的任何內容都是必不可少的。它允許你在五秒或十秒的時間線上拖放剪輯,幫助Sora打破動作並從一個方向流向另一個方向。因此,為了讓我的斑馬朋友多一點動作,我進入了故事板,將跳舞和吃意大利餃子分成兩個不同的動作,然後使用ChatGPT增強我的描述——這又是一個故事板的內置功能。

再一次…… 有點有效,但又不完全有效。是的,我得到了斑馬,它們在悉尼歌劇院前,但它們已經放棄了跳舞,當我要求它們吃一些意大利餃子時,它們突然長出了人類的手來拿叉子。抱歉,動態展示,但我覺得我還有很長的路要走。

我還嘗試了更自然的提示,比如麵條企鵝從冰山滑入海洋,還有更奇幻的提示,比如一片有著皮克斯風格臉孔的烤麵包跳出烤麵包機,結果大致相同。Sora在處理每個提示的某些部分時非常出色,但你必須以正確的細節描述你的場景。細節過多,Sora會開始合併不同的元素;細節過少,則會得到一個相對乏味的成品。

儘管如此,Sora的功能還有更多,特別是在編輯方面。這個視頻生成器還具備重新剪輯、混音和融合剪輯的能力,可以擴展一個想法、將一個視頻與另一個視頻連接,或者剪去那些不合適的元素。但我仍然希望能夠在第一次就製作出看起來不錯的視頻。

對未來的期待

總的來說,我使用Sora的頭幾天可以說是褒貶不一。這個視頻生成器完美嗎?不過,我不能完全責怪OpenAI。這是我第一次基於文本生成視頻,因此我不驚訝自己在確定正確細節方面遇到了困難。到目前為止,我給Sora提供了過多的信息,或是過少的信息,這意味著找到正確的提示應該就在不遠處。

更重要的是,我對Sora所承諾的功能印象深刻。作為ChatGPT Plus會員,我可以在幾秒鐘內創建的視頻,我想隨著模型的持續訓練,它們會變得更快。我不太確定我是否會立即使用Sora生成的快速剪輯——其中許多仍然存在奇怪的瑕疵,比如斑馬身上出現人類的手臂——但那些進入Sora的動態展示的剪輯讓我充滿希望,這只是學會如何要求正確元素的問題。

我對Sora印象深刻,但我還有很多學習要做。

此外,我不會驚訝如果OpenAI對提示和創作的處理方式也會隨之改變。目前,當你作為ChatGPT Plus會員用完1,000個積分後,就是這樣——在你的計費周期重新開始之前,沒有辦法再購買幾個額外的積分。同樣,沒有辦法將未使用的積分從一個月轉到下一個月,因此你必須找到支出和節省的平衡,以便度過整個月。

如果由我來決定,我會想要重新獲得一些我花掉的較為奇怪的積分,但這不是一個選項。相反,我將其視為學習的代價,我只能花更多時間來微調我的提示,然後再將它們發送給Sora。也許有一天,我會想出一些值得展示的內容。

編輯評論

這篇文章清楚地揭示了新技術在實際應用中的挑戰與潛力。Sora的推出無疑是視頻生成技術的一個重要進步,但作者的經歷也讓我們看到,創作過程中不僅僅是技術的挑戰,更是用戶如何有效地與工具互動的挑戰。隨著AI技術的進步,未來的用戶在創作時可能會面臨更高的期望和更大的創作自由度。這也提醒我們,在追求創造力的同時,對細節的把握和對工具的熟悉程度是至關重要的。隨著時間的推移,這些工具可能會變得更為成熟和易用,讓更多的創作者能夠輕鬆實現自己的想法。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
Use the original face exactly as it is, without changing a details. A hyper-realistic, highly detailed portrait of a beautiful woman in a 1950s/Pin-Up style, evoking the essence of a classic Hollywood starlet on a glamorous vacation.
• Subject: A stunning young woman with a classic Pin-Up aesthetic (think 1950s movie star).
• Facial Features: Striking blue/green eyes, perfectly arched eyebrows, and classic makeup featuring bright red lipstick. Her expression is captivating and seductive.
• Hair & Hat: Long, voluminous, deep brown hair styled in soft, glamorous waves/curls. She is wearing a very large, wide-brimmed straw hat that casts a soft shadow on her face.
• Attire: A chic, form-fitting black dress with white polka dots. The dress has an off-the-shoulder, sweetheart neckline bodice that cinches at the waist with a thin black belt. She is also wearing a black scarf with white polka dots tied around her neck like an ascot.
• Setting & Context: The background suggests a sunny, coastal location with a deep blue ocean/sea visible behind her. She is leaning seductively against the tan/brown, polished hood or door of a classic vintage convertible car.
• Style/Vibe: Vintage glamour, 1950s Hollywood, high-fashion editorial. Create a sticker set maintaining 100% of the woman's original facial features from the provided image. Do not alter the face, focusing on ultra-realistic details of the facial structure, eyes, eyebrows, nose, mouth, and expression. The final face must be realistic, not cartoon-like. She has long, voluminous hair.
1. Makeup:Maintain Original Face: We will preserve the structure of your face, eyes, eyebrows, nose, mouth, and expression as closely as possible to the original image to maintain naturalness and uniqueness, while adjusting the tone to be softer:

Eyes: Slightly reduce the sharpness of the Cat Eye eyeliner to a thin line close to the lash line for a softer look, while still maintaining eye definition.
Eyeshadow: Use natural tones like light brown, peach, or beige.
Eyebrows: Original shape, but brushed up to look softer and more natural.
Lips: Glossy, pink-tinted, nude-pink, or coral-toned lipstick/tint to make the lips look full and moisturized. Focus on a bright but not overly intense look.
2. Hairstyle:Natural Voluminous Long Hair: Her hair is long and flowing, but the styling will emphasize natural volume and movement. Soft, natural waves.
3. Outfit:

Attire: A white open-back bodysuit paired with distressed, faded blue denim shorts. There is a message "Kunika" on the shirt.
Shoes: Elegant, simple open-toe flat sandals.
Accessories: Styled freely and fittingly for each scene.
4. Poses & Sticker Elements:Poses: Various poses such as waving, jumping, walking playfully, reading a book, holding up a sign, cheering with both hands, stretching, or making a celebratory gesture, to create a cheerful and friendly atmosphere.Decoration: Include elements like small rainbows, sparkling stars, clear bubbles, hearts, balloons, or light-colored dots to decorate and enhance the fun of each sticker scene.Style: Thin black border around the sticker. Use a modern, rounded 'Itim' style font for the text.Text: Add short emotional phrases written in a cute, beautiful script near the sticker (no speech bubbles/text boxes):

"Hello"
"Love you"
"Submitting work"
"Great"
"Got it"
"Thanks!"
"Wait a sec"
"Ready to care"
"Fight"
"Let's do it"
"So cute"
"OK"
"Sweet dreams:
"Get well soon"
"555"
"You're welcome"
"HBD" 
"OMG" 
"Sorry"
"Got a headache" 
Guidelines: Do not include a text box. Ensure balanced composition with sufficient white space—not cluttered. Match the pose to the text.
Emphasis: Reiterate 'maintain 100% of the original face features from the provided image,' 'ultra-realistic facial detail,' and 'professional studio lighting on face (realistic face, not cartoon face).

Use Cantonese in the stickers. add lotso and hamm