Google Imagen 3 測試:AI圖像生成的優缺點

Ai

🎬 YouTube Premium 家庭 Plan成員一位 只需
HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放


立即升級 🔗

我測試了Google的高級圖像生成器,迅速發現了它的限制

儘管有其限制,Imagen 3 仍然令人印象深刻。

Imagen 3的基本介紹

Imagen 3是Google的AI圖像生成工具,於今年5月在公司的I/O開發者大會上宣布。它在8月份以有限的功能在美國推出,但上個月對免費的Gemini用戶開放。我從那時起便開始使用它來創建各種圖像,儘管這是一個整體上令人印象深刻的工具,但它確實存在幾個限制,影響了整體體驗。

Imagen 3的挑戰

首先需要注意的限制是,使用免費的Gemini帳戶無法生成人物圖像。這不僅僅是指生成名人圖像,因為大多數圖像生成工具都不允許這樣做,而是對於一般人來說也是如此。因此,像「創建兩個隨機人跳舞的圖像」這樣的提示將不會返回任何結果。作為參考,ChatGPT在其免費層級上也有這一限制。

不過,如果你升級到Gemini Advanced訂閱,你是可以創建人物圖像的——不過不包括名人。我試過這個功能,結果有好有壞。雖然它能生成的圖像非常逼真,幾乎難以分辨是否為AI生成,但有時候產出的結果卻不盡人意。看看下面的兩個例子,左邊的圖像非常真實,看起來像是專業攝影師拍攝的,而右邊的則顯得有些卡通化。即使多次提示工具讓照片更真實,所做的改變也微乎其微。

談到專業攝影師,我們來看看Imagen 3的第二個限制或問題。即使生成了一個現實的圖像,無論是人物、動物還是物體,結果看起來都過於專業,而不是隨意的。每張圖像都是完美的,經常添加散景效果以使其看起來更吸引人。Imagen 3創建的每張圖片都像是經過精心編輯的,如果你追求這種效果,那是沒有問題的,但如果能夠創建更隨意的圖像就更好了。

我認為最好的照片有時候就是那些原始的。那些在光線不完美時拍攝的未經編輯的照片,以及被拍攝的人甚至不知道你在拍照的情況下拍的。這正是Imagen 3所面臨的挑戰,值得一提的是,幾乎所有的AI圖像生成器都有這一問題。

編輯生成的圖像的挑戰

這引出了我對Imagen的第三個主要問題,即編輯已創建的圖像。如果我創建了一張搞笑的貓咪戴著帽子吃冰棒的圖像,然後想用額外的提示編輯它,Imagen 3會在Gemini中創建一個全新的圖像。因此,例如,如果我喜歡創建的圖像,但只想將帽子的顏色從黑色改為藍色,這個工具會完全生成一個新圖像,而不是僅僅改變帽子的顏色並保留其他部分不變。雖然使用正確的提示時,新圖像看起來與舊圖像相對類似,但它仍然不是完全相同的,這並不理想。這使得無法將圖片編輯到完美,尤其是當多個提示每次都會生成新圖像時。看看下面的例子,你就會明白。

另一個問題是,我無法改變圖像的長寬比。圖像默認以1:1的長寬比創建,無法修改。如果我提示工具將其改為16:9,Gemini會說它會這樣做,但隨後生成的新圖像仍然是相同的長寬比。不過,這一點似乎即將改變,因為已有能力改變長寬比的功能正在開發中。

雖然有限,但Imagen 3依然出色

我想澄清的是,我並不是想批評Google的高級AI圖像生成器。我只是想強調在測試過程中遇到的限制,以便讓你知道該期待什麼。撇開限制不談,Imagen 3實際上是一個非常令人印象深刻的工具。我也試過幾個競爭對手,雖然每個AI圖像生成器都有其優缺點,但我認為Imagen 3是最好的之一。我的同事Calvin也同意這一點。他將該工具與競爭對手進行了比較,發現它在質量方面是最好的。

AI生成內容仍在初期階段

當Imagen 3正確地運作時,生成的結果令人驚艷。動物、城市、人物以及其他任何主題的圖像都非常出色——如果你能接受經過修圖的外觀。不要只聽我的話,看看下面的畫廊,親自體驗一下。請記住,我們仍然處於AI生成內容的早期階段,因此想像一下幾年後這款軟件將能做到什麼。

其他需要注意的限制

這些是我在測試工具時遇到的限制,並且沒有預料到——除了作為免費用戶無法生成人物圖像的限制——儘管Google在其網站上明確指出了其他限制。值得列出這些限制,以便讓你知道該期待什麼。

Imagen 3不會創建其認為不適當的圖像,即使是付費計劃也不例外。這包括與暴力、騷擾、性、歧視等相關的圖片。這同樣適用於鼓勵危險活動的圖像,以及那些有害事實不準確的圖像,這些都可能對某人的安全構成風險。

這些都是合適的限制,大多數大型AI圖像生成工具都有這些限制,除了FLUX.1(Grok使用的工具)。

對於Imagen 3的評價,我認為在未來的發展中,這些限制很可能會隨著技術的進步而得到改善。AI圖像生成技術的潛力仍然巨大,隨著用戶需求的增加,這些工具將會變得越來越強大。因此,無論是對於藝術創作還是商業用途,Imagen 3都可能成為一個不可或缺的工具。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
人物:人物姿態表情動作衣著都不變,色調:富士底片日系風格,暖色調,日系輕透感,光影:維持照片中的光影邏輯,輕灑在少女身上,像是日系風格清爽,必須符合原本照片中的光影邏輯,背景:一片海洋與藍天,天空天氣非常晴朗,海與藍天在畫面中維持一半的比例,海的顏色是鮮紅色的海,海非常鮮紅、一片平靜的死海,海上有陽光帶來的一點光班,場景:少女坐在海堤防邊,面對著畫面,而少女的後方是一片遙遙無極的海與藍天,完美的呈現一半的比例,在一個清晨的光線中,陽光並沒有太刺眼,陽光像是輕灑在少女身上還有紅色的海面上,透視關係:構圖不改變,維持原本照片的構圖,平面構圖 An ultra-realistic photograph of an Asian woman in the reference image, faithfully replicating my face and maintaining it 100%. A woman with a perfectly sculpted hourglass figure stands on the sand at sunset. She wears a white string bikini, measuring,+++ accentuating her curves with a well-defined waist, hips, and toned figure. Her skin is fair, smooth, and radiant.

She stands next to a large, ornate gold-framed mirror, perched upright on the sand, fully revealing her reflection. The reflection clearly emphasizes her silhouette, curves, and body proportions.

The lighting is cinematic and stunning, creating soft highlights on her skin and sharp shadow contrasts that enhance the shape of her waist, hips, and legs.

The background features a dusk sky with sunset tones of deep blue, purple, and orange, gentle clouds, and the silhouettes of palm trees.

A natural beach atmosphere, realistic textures, sharp focus on the woman's body and reflections, high detail, Ultra HD, artistic aesthetic, warm lighting, and low angle. 一隻在香港茶餐廳喝奶茶的貓