Google Gemini新功能:文字生成影片,Veo 2助力




谷歌推出Gemini及Whisk平台新功能 以Veo 2技術生成高質素短片

谷歌(Google)最新推出一項嶄新功能,讓用戶能夠在Gemini及Whisk平台上利用Veo 2技術,將文字提示轉換成高解析度的八秒短片。Gemini Advanced訂閱用戶現可透過這項功能,將文字描述生成動態影片;而Google One AI Premium訂閱用戶則可透過Whisk Animate,將圖片轉製成八秒動畫短片。

由今日起,Gemini Advanced用戶能使用谷歌尖端的視頻生成模型Veo 2,快速製作及分享影片。這項功能支持用戶以文字提示在Gemini內創作動態影片。此外,谷歌實驗室(Google Labs)亦將Veo 2應用擴展至Whisk,這是一個結合文字及圖片提示創作新影像的AI實驗平台,並能將影像動畫化成影片。

Veo 2被視為視頻生成技術的重大突破,專為製作高解析度且具電影般真實感的短片而設。它能理解現實世界的物理規律及人體動作,呈現流暢的角色動態、生動場景及豐富細節,涵蓋多元主題及風格。

用戶只需在Gemini的模型下拉選單中選擇Veo 2,即可生成一段720p解析度、16:9橫向格式、長度為八秒的MP4影片。每月有生成次數限制,系統會在用戶接近上限時發出提示。

Gemini的影片創作過程簡單直接,用戶只需描述想像的場景,系統便會將想法化為影片。描述越詳細,對最終效果的控制越大,令用戶能輕鬆探索從寫實到奇幻等多種視覺風格,快速講述短篇視覺故事。

在手機端分享影片同樣方便,用戶點擊分享按鈕即可迅速將短片上傳至TikTok、YouTube Shorts等社交平台。此功能正逐步向全球Gemini Advanced訂閱者推廣,涵蓋網頁及手機端,且支持Gemini所有語言。

Whisk於去年12月推出,是谷歌實驗室的一項新嘗試,旨在幫助用戶快速以文字及圖片提示探索及視覺化新點子。現時Whisk Animate功能正式開放,讓Google One AI Premium訂閱用戶可將創作的圖片轉化為生動的八秒動畫短片,全球同步啟用。

谷歌亦注重生成影片的安全性,進行大量紅隊測試及評估,防止產生違反政策的內容。所有由Veo 2生成的影片均帶有SynthID數碼水印,嵌入於每個畫面中,清楚標示影片為AI生成。

Gemini的輸出主要依賴用戶提示,正如其他生成式AI工具,偶爾可能生成部分用戶認為不妥的內容。谷歌會持續透過用戶的點讚或點踩反饋進行改進,詳情可參閱谷歌官方網站的說明。

儘管有新功能推出,谷歌股價於週二交易時段下跌2%,原因是日本競爭監管機構對谷歌發出停止反競爭行為的命令。

個人評論與分析

谷歌這次在Gemini和Whisk中引入Veo 2視頻生成技術,標誌著AI視頻創作進入一個新階段。相比過去多數AI只專注於靜態圖像生成,這項技術不但提升了影片的真實感和細節,還帶來了更靈活的創意表達空間。用戶只需簡單的文字描述,就能得到專業水準的短片,無疑將大幅降低內容創作者的門檻,促進短視頻生態的多元發展。

此外,將生成影片加上數碼水印(SynthID)是業界少有的誠意舉措,有助於打擊假影片和濫用,提升AI內容的透明度與安全性。這對於當下社會對AI生成內容的監管和信任建設極具意義。

不過,谷歌如何處理生成內容的道德及合規問題仍是一大挑戰。AI模型的內容輸出受限於提示,容易受到用戶主觀影響,未來如何結合更智能的過濾及審核機制,避免生成有問題的影片,是谷歌必須持續優化的方向。

最後,儘管技術進步吸引眼球,但谷歌面對全球監管壓力,尤其是日本當局的反壟斷行動,短期內可能影響投資者信心。谷歌必須在創新與合規之間取得平衡,才能長遠穩健發展。

總括而言,Veo 2的推出不僅為AI視頻創作帶來實質突破,也為內容生態注入新活力,值得關注未來其在娛樂、教育、廣告等多個領域的應用潛力。

以上文章由特價GPT API KEY所翻譯及撰寫。

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
Create a photorealistic image of uploaded photo sitting at a relaxed outdoor restaurant in London on a cool Wednesday morning in March 2026. The sky is clear, the spring air is crisp, and the city feels calm as it wakes up. She is the focal point of the shot—wearing a light scarf, gently stirring her tea while gazing off to the side with a thoughtful expression. Everything behind her, from the waiter moving about to the soft morning traffic, should fall into a smooth blur, giving the picture the effortless, candid atmosphere of a moment casually snapped on a phone. Certainly! Here is your enhanced, artistic, and detailed prompt for an AI image generator:

---

A captivating portrait of a young Asian woman, inspired by Imada Mio and embodying an exquisitely delicate, doll-like (精緻洋娃娃臉) aesthetic. She has large, round, expressive eyes that radiate innocence and curiosity, subtly accented with a moist shimmer. Her petite V-line face is framed by soft, rosy cheeks, and her lips are naturally pink and slightly parted, exuding an energetic, slightly flirty, yet pure aura. Her expression is a candid blend of sweetness and playful allure.

Her long, dark brown hair is artfully tousled with a messy morning (剛睡醒的凌亂感) effect—loose strands fall gently around her face, conveying natural volume and effortless beauty. The hair has a silky texture, catching the light in places, suggesting a recent awakening.

She is dressed in an oversized, translucent white button-down shirt (男友風白襯衫) with the top buttons casually undone, delicately revealing her collarbones and a slender neckline. The shirt drapes loosely, giving a tasteful "bottomless" look (下衣失蹤風格), her bare legs just barely visible beneath the shirt's hem, enhancing the innocent-meets-sensual ambiance.

The composition is styled in the manner of a Japanese Gravure Photobook (寫真集風格), exuding a pure & sexy vibe with an airy, dreamy atmosphere. Employ bright, high-key lighting for a clean, luminous effect that highlights her velvety soft skin texture. Use Fujifilm PRO 400H film tones for subtle pastel hues, gentle contrast, and a seamless blend of natural colors, further enriching the soft, ethereal, and intimate photographic quality.

The background is minimalist and softly blurred, ensuring complete focus on the subject, and enhancing the overall sense of warmth, comfort, and inviting allure typical of high-end Japanese photobooks.

--- ใช้ใบหน้าจากภาพอ้างอิงผู้หญิงเป็นหลักเท่านั้น (female reference image only)
คงโครงหน้า ดวงตา จมูก ปาก สัดส่วนใบหน้าเหมือนต้นฉบับ 100% ห้ามเปลี่ยน
ไม่สร้างใบหน้าใหม่ ไม่ผสมใบหน้า ไม่ดัดแปลงใบหน้า

ภาพถ่ายเสมือนจริงคุณภาพสูงของหญิงสาววัยผู้ใหญ่ รูปร่างเพรียวสวย หุ่นดี ขาเรียวยาว สะโพกได้รูป ผิวขาวใสเนียนเป็นธรรมชาติ ดูสุขภาพดี

ฉาก:
ชายหาดทะเลช่วงเย็น
พื้นทรายสีอ่อนละเอียด
ทะเลสีฟ้าอมเทา คลื่นเล็ก ๆ ซัดเบา ๆ
ท้องฟ้าสีฟ้าอ่อนอมพีช มีเมฆบางกระจาย
แนวต้นไม้และชายฝั่งอยู่ด้านซ้าย
มีเกาะเล็ก ๆ อยู่ไกลลิบที่ขอบฟ้า
บรรยากาศสงบ อบอุ่น ชิลแบบวันพักผ่อน

ท่าโพส:
ยืนหันหลังให้กล้อง
ลำตัวตั้งตรง ผ่อนคลาย
ศีรษะหันเฉียงเล็กน้อย มองไปทางทะเล
มือทั้งสองข้างวางแตะบริเวณสะโพกด้านหลังอย่างเป็นธรรมชาติ
ขาทั้งสองข้างเหยียดตรง น้ำหนักลงขาข้างหนึ่ง
ท่าทางดูเผลอ ๆ ไม่ตั้งใจโพส
ถ่ายเต็มตัว ระยะกลางถึงไกล
ตัวแบบอยู่กึ่งกลางเฟรม

ชุด:
บิกินี่สีเขียวเข้ม
ท่อนบนผูกคอและผูกหลัง
ท่อนล่างทรงผูกเชือกด้านข้าง
ผ้าเรียบ ไม่มีลวดลาย

พร็อป:
หมวกแก๊ปสีเขียว โทนเดียวกับบิกินี่
รองเท้าแตะสีอ่อน
ไม่มีพร็อปในมือ
ใช้ชายหาด ทะเล และท้องฟ้าเป็นองค์ประกอบหลัก

ทรงผม:
ผมยาวถึงกลางหลังสีน้ำตาลประกายแดง
รวบผมต่ำด้านหลัง ลอนสวยเงางาม
มีปอยผมหลุดเล็กน้อย ดูเป็นธรรมชาติ
ไม่จัดทรงแข็ง

เครื่องประดับ:
เครื่องประดับชิ้นเล็ก เรียบ
เช่น สร้อยคอเส้นบาง หรือกำไลข้อมือเล็ก ๆ
ไม่เด่นเกินไป

แต่งหน้า:
แต่งหน้าสไตล์เกาหลีใส ๆ น่ารัก
ผิวฉ่ำโกลว์บางเบา
แก้มชมพูอ่อนธรรมชาติ
คิ้วฟุ้ง
ริมฝีปากสีชมพูใส

กล้อง:
กล้องโปร DSLR
เลนส์มุมกว้างเล็กน้อย
แสงธรรมชาติช่วงเย็น
แสงนุ่ม เงาไม่แข็ง
โฟกัสคมชัด รายละเอียดสูง

สไตล์ภาพ:
ภาพแฟชั่นริมทะเล
โทนสีอบอุ่น ละมุน
ภาพเสมือนจริง ultra realistic
คุณภาพสูงระดับ 4K
อัตราส่วนภาพแนวตั้ง 9:16