
谷歌推出Gemini及Whisk平台新功能 以Veo 2技術生成高質素短片
谷歌(Google)最新推出一項嶄新功能,讓用戶能夠在Gemini及Whisk平台上利用Veo 2技術,將文字提示轉換成高解析度的八秒短片。Gemini Advanced訂閱用戶現可透過這項功能,將文字描述生成動態影片;而Google One AI Premium訂閱用戶則可透過Whisk Animate,將圖片轉製成八秒動畫短片。
由今日起,Gemini Advanced用戶能使用谷歌尖端的視頻生成模型Veo 2,快速製作及分享影片。這項功能支持用戶以文字提示在Gemini內創作動態影片。此外,谷歌實驗室(Google Labs)亦將Veo 2應用擴展至Whisk,這是一個結合文字及圖片提示創作新影像的AI實驗平台,並能將影像動畫化成影片。
Veo 2被視為視頻生成技術的重大突破,專為製作高解析度且具電影般真實感的短片而設。它能理解現實世界的物理規律及人體動作,呈現流暢的角色動態、生動場景及豐富細節,涵蓋多元主題及風格。
用戶只需在Gemini的模型下拉選單中選擇Veo 2,即可生成一段720p解析度、16:9橫向格式、長度為八秒的MP4影片。每月有生成次數限制,系統會在用戶接近上限時發出提示。
Gemini的影片創作過程簡單直接,用戶只需描述想像的場景,系統便會將想法化為影片。描述越詳細,對最終效果的控制越大,令用戶能輕鬆探索從寫實到奇幻等多種視覺風格,快速講述短篇視覺故事。
在手機端分享影片同樣方便,用戶點擊分享按鈕即可迅速將短片上傳至TikTok、YouTube Shorts等社交平台。此功能正逐步向全球Gemini Advanced訂閱者推廣,涵蓋網頁及手機端,且支持Gemini所有語言。
Whisk於去年12月推出,是谷歌實驗室的一項新嘗試,旨在幫助用戶快速以文字及圖片提示探索及視覺化新點子。現時Whisk Animate功能正式開放,讓Google One AI Premium訂閱用戶可將創作的圖片轉化為生動的八秒動畫短片,全球同步啟用。
谷歌亦注重生成影片的安全性,進行大量紅隊測試及評估,防止產生違反政策的內容。所有由Veo 2生成的影片均帶有SynthID數碼水印,嵌入於每個畫面中,清楚標示影片為AI生成。
Gemini的輸出主要依賴用戶提示,正如其他生成式AI工具,偶爾可能生成部分用戶認為不妥的內容。谷歌會持續透過用戶的點讚或點踩反饋進行改進,詳情可參閱谷歌官方網站的說明。
儘管有新功能推出,谷歌股價於週二交易時段下跌2%,原因是日本競爭監管機構對谷歌發出停止反競爭行為的命令。
—
個人評論與分析
谷歌這次在Gemini和Whisk中引入Veo 2視頻生成技術,標誌著AI視頻創作進入一個新階段。相比過去多數AI只專注於靜態圖像生成,這項技術不但提升了影片的真實感和細節,還帶來了更靈活的創意表達空間。用戶只需簡單的文字描述,就能得到專業水準的短片,無疑將大幅降低內容創作者的門檻,促進短視頻生態的多元發展。
此外,將生成影片加上數碼水印(SynthID)是業界少有的誠意舉措,有助於打擊假影片和濫用,提升AI內容的透明度與安全性。這對於當下社會對AI生成內容的監管和信任建設極具意義。
不過,谷歌如何處理生成內容的道德及合規問題仍是一大挑戰。AI模型的內容輸出受限於提示,容易受到用戶主觀影響,未來如何結合更智能的過濾及審核機制,避免生成有問題的影片,是谷歌必須持續優化的方向。
最後,儘管技術進步吸引眼球,但谷歌面對全球監管壓力,尤其是日本當局的反壟斷行動,短期內可能影響投資者信心。谷歌必須在創新與合規之間取得平衡,才能長遠穩健發展。
總括而言,Veo 2的推出不僅為AI視頻創作帶來實質突破,也為內容生態注入新活力,值得關注未來其在娛樂、教育、廣告等多個領域的應用潛力。
以上文章由特價GPT API KEY所翻譯及撰寫。