AI 圖像生成大比拼:邊個最強?

Ai

我測試了ChatGPT、Gemini和Meta AI生成的15張圖片——結果讓我驚訝

隨着AI生成圖像在創意工作中的應用越來越廣泛,谷歌Gemini的Imagen、OpenAI的ChatGPT和Meta AI之間的競爭也越來越激烈。在個別測試後,我決定進行一次並排比較,看看哪個是目前最好的AI圖像生成器。

每個平台都有其獨特的優勢,所以我使用了一些現實和簡單的提示來測試這些不同的AI模型如何處理各種主題。我的目標是確定哪個AI能在五個基本類別中生成最令人印象深刻的結果。

以下是每個平台基於生成圖像質量的表現,最後哪個平台勝出。

創建提示

為了保持比較的公平性,我多樣化了提示,以測試每個AI生成細緻、美觀圖像的能力。每個提示都測試了AI在解釋質感、顏色和構圖方面的能力,同時保持一定的創意水平。這些類別包括:食物、家居裝飾、動物、車輛和風景,讓我可以全面探索它們的能力。

工作流程

我使用了每個平台的圖像生成功能並保持默認設置。雖然谷歌Gemini和OpenAI提供了高級服務,但我為這次比較選擇了它們的免費層。谷歌Gemini的Imagen集成在谷歌的平台內,而Meta AI通過Instagram、Facebook和WhatsApp傳遞圖像。OpenAI的ChatGPT配備了DALL-E圖像生成功能,可以在單一平台上快速生成結果。

在各個平台上生成圖像後,我根據圖像的清晰度、創意性以及AI捕捉提示意圖的能力進行了評估。

1. 食物

提示:創建一個配有松露薯條的高級漢堡

谷歌Gemini:圖像視覺上令人驚嘆,漢堡層次分明且焦點清晰。每個元素(麵包、肉餅、配料)都非常細緻,漢堡看起來幾乎過於頂重、不平衡,這常常是點餐時的現實。薯條有完美的金黃色澤,松露調味也非常明顯。

Meta AI:圖像有一種超現實的感覺,漢堡非常多肉,顏色對比強烈,融化的奶酪非常吸引人。松露調味的細節非常精細,薯條的擺放比Gemini的版本更真實。

ChatGPT:這個明顯是想通過多加一份薯條來取勝,但整體圖像更具藝術感,幾乎有繪畫的質感。松露薯條細節豐富但不如谷歌和Meta的版本真實。

反應:這是一場非常艱難的抉擇,谷歌Gemini和Meta AI都在生成多汁的高級漢堡方面表現出色,但最終我選擇Meta AI作為勝者,因為其牛肉餅極其多汁,奶酪的額外添加也讓人垂涎欲滴。Gemini和Meta AI的近乎照片般的結果都很令人印象深刻。OpenAI的圖像雖然有創意,但漢堡看起來不太真實,幾乎有點滑稽。

2. 家居裝飾

提示:創建一個有大窗戶俯瞰海洋的極簡主義客廳的圖像。

谷歌Gemini Imagen:設計簡潔,線條清晰但光線較少。海景非常真實,但看起來客廳幾乎漂浮在水中,海洋的透視過於誇張。這個客廳是在船上嗎?

Meta AI:圖像捕捉了極簡主義美學,但在質感和光線的細節上有所欠缺,這些細節本可以提升場景的真實感。水雖然很近,但似乎與客廳分開,不直接相連。

ChatGPT:圖像更符合我的期望——清晰區分客廳與海洋,顏色大膽,形狀有趣,天空視覺上也很吸引人。雖然海洋細節不足,但牆上的藝術品和獨特的咖啡桌都是受歡迎的點綴。

反應:Meta AI和ChatGPT在這裡表現出色,最終我選擇Meta AI作為勝者,因為它似乎最能捕捉提示的本質,包括一個歡迎海景的客廳,而不是ChatGPT的座位排成一排背對海景。Meta AI對真實感的關注使其在這個類別中佔據優勢,儘管OpenAI的創意呈現提供了一個更獨特的視角。

3. 動物

提示:創建一隻色彩繽紛的鸚鵡棲息在樹枝上的圖像。

谷歌Gemini Imagen:鸚鵡非常細緻,羽毛色彩鮮艷且質感真實。樹枝的細節增加了一絲自然氛圍,但背景並不多。然而,提示說的是“色彩繽紛”,而這隻鳥雖然美麗的綠色,但我期待更多的色彩。

Meta AI:這隻鸚鵡的顏色更符合我的期望。圖像構建得非常精美,從喙到爪都很細緻。場景中的葉子也增加了整體美感。

ChatGPT:鸚鵡色彩鮮艷且藝術感強,但缺乏使其栩栩如生的羽毛質感細節。它更像是超現實的,注重亮色而非細緻的細節。背景的添加很好,但就像額外的薯條一樣,並不是必需的。

反應:Gemini生成了一隻非常逼真的鳥棲息在樹枝上,而ChatGPT生成的鳥有一種故事書的質感,吸引了我喜愛迪士尼的一面。但我選擇Meta AI,因為它平衡了真實感和色彩鮮豔,符合提示的期望。

4. 車輛

提示:創建一輛在日落時分城市街道上的未來電動車的圖像

谷歌Gemini Imagen:車輛看起來時尚且現代,表面反光清晰。日落增加了溫暖,城市景觀細緻,有柔和的光效。場景中的電動充電器是一個很好的細節,強調了電動車的特性。

Meta AI:車輛設計大膽且確實有未來感。亮麗的顏色讓這張圖像更具吸引力,光影的精細捕捉了日落。城市街道的細節增加了氛圍。

ChatGPT:車輛設計未來感十足,但幾乎過於概念化,日落和城市景觀不夠清晰。光滑的道路過於完美,使圖像更像概念圖而非照片真實感。

反應:有趣的是,所有AI模型生成的電動車和未來場景都非常相似。這些圖像是目前為止在遵循提示方面最為相似的。Meta AI是明顯的勝者,因為它完美結合了未來設計和環境細節,ChatGPT提供了更概念化但不夠真實的呈現。Gemini緊隨其後,提供了大量細節和真實感。

5. 風景

提示:創建一個被松樹環繞且有薄霧籠罩的寧靜山間小屋的圖像。

谷歌Gemini:松樹和山脈細節豐富,但小屋看起來暗淡且不宜居,更像是被遺棄而非寧靜。場景看起來像肖像畫,但缺乏我希望在圖像中看到的氛圍。

Meta AI:薄霧和樹木渲染得很好,但小屋給人一種卡通感,屋頂上過多的常春藤和綠色植被。背景使這張圖像真正脫穎而出。

ChatGPT:圖像有一種飄渺的感覺,薄霧被誇張處理,營造出夢幻效果。場景有一種柔和的繪畫質感,使其感覺像是幻想插圖。

反應:我不得不反复確認,確保我沒有把Meta AI和ChatGPT的圖像搞混。我習慣於ChatGPT生成的圖像有更多的藝術感,但這次是Meta AI在過於創意的詮釋中失手。谷歌再次在真實感上表現出色,但最終的勝者是ChatGPT,因為它在這次的圖像中滿足了所有要求。

總結

在測試了這五個提示後,很明顯谷歌Gemini的Imagen和Meta AI是生成逼真圖像的首選,它們能夠高度還原現實世界的細節。Meta AI表現穩定,生成了細節豐富且連貫的圖像,但在一些細微細節上可能缺乏精緻度,而這正是Gemini的強項。另一方面,ChatGPT在創意性方面表現突出,經常提供更具藝術性或超現實的詮釋。

總體來說,Meta AI是明顯的勝者,提供了良好的中間選擇,並在真實感和對提示細節的關注上超越其他聊天機器人。

編輯評論

這篇文章對於深入理解當前AI圖像生成技術的優劣提供了寶貴的見解。雖然各平台各有千秋,但Meta AI在真實感和細節處理上的綜合表現確實令人印象深刻。這也反映出在創意領域中,AI技術不僅僅是工具,更是創作過程中的夥伴。未來,隨着技術的進一步發展,這些AI模型可能會變得更加智能化,甚至能夠理解更複雜的創意需求。這對於設計師和創作者來說無疑是個好消息,因為他們能夠有更多工具來實現他們的創意願景。

以上文章由特價GPT API KEY所翻譯

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Chat Icon