六合彩AI預測賽後檢討!邊個模型預測最叻? 每次攪珠當晚10:30更新免費睇!

ChatGPT激鬥Midjourney V7:AI圖像生成邊個勁?

Ai

我測試了ChatGPT與Midjourney V7的AI圖像生成 — 結果懸殊

兩大AI圖像生成巨頭,究竟哪一個更優越?

最近,Midjourney和ChatGPT都推出了各自的新版本AI圖像生成器。歷史上,這兩個選項一直是市場上最好的選擇之一,開創了未來的可能性。

但當這兩者對比時,究竟哪一個更好呢?Midjourney V7還是ChatGPT 4o的圖像生成?

我使用七個不同的提示將ChatGPT與Midjourney進行了測試,以觀察哪一個是最佳的AI圖像生成器。這些測試涵蓋了模型理解上下文的能力、重現複雜形狀的能力以及創造性思維生成圖像的能力。

ChatGPT與Midjourney V7的比拼規則

雖然兩個模型都能創建圖像,但由於Midjourney允許調整的設置數量較多,這使得比較變得困難。因此,我首先進行了以下步驟。

對於Midjourney,我使用了版本7。這是最新版本,但仍處於實驗階段。我還嘗試了在個性化設置開啟和關閉的情況下進行提示(該設置將你偏好的藝術風格融入圖像中)。

Midjourney每次生成四個版本的圖像,而ChatGPT則只有一次嘗試。在所有情況下,我從Midjourney中選擇最佳圖像並進行了升級(要求更高質量的版本)。

1. 照片真實感

提示:創建一幅真實感強烈的圖像,描繪一隻海雀在懸崖上空飛翔,下面是水域。背景是一座山脈。今天是個陽光明媚的日子,懸崖下有兩個人正通過望遠鏡觀察它。

ChatGPT

這幅圖幾乎滿足了所有要求。雖然圖像可能稍顯過飽和,但確實是照片真實感的表現。海雀在懸崖上空飛翔,下面有水,背景有山脈。

另外,它還包括了兩個人通過望遠鏡觀察的細節。雖然他們並沒有在看海雀,但這幅作品基本上是準確的。

Midjourney

這裡的元素非常多。我無法否認所有要求的細節都被包含了。背景有山脈、海雀、兩個使用望遠鏡的人,甚至還有水和山脈。

不過,讓我們來談談這幅圖中的一個問題(在這個例子中是海雀)。海雀的尺寸巨大,似乎隨時可以和哥斯拉對抗。這幅圖的真實感也不強,更多地像是一幅油畫。

即使撇開海雀的尺寸問題,我仍然認為ChatGPT更準確地理解了提示的含義。兩個模型都在懸崖下創建了水域,但ChatGPT更好地理解了提示的上下文。

勝者:ChatGPT在各方面都贏了這一輪。雖然我希望海雀能成為巨型神話生物,但Midjourney在此處的上下文理解實在太差。相反,ChatGPT則完美把握了要求。

2. 複雜提示

提示:一個大型市場,有一個攤位賣水果,一個賣裙子,還有一個賣陶瓷。背景是一條河,遠處是一片森林。一名男子在一個攤位前給一名女子遞錢,兩個孩子在中間奔跑。天空中有一個熱氣球。

ChatGPT

這個提示中有很多細節,AI模型很容易忽略其中某些部分。然而,所有關鍵細節都在這裡。熱氣球、兩個孩子在中間奔跑,男人在遞錢給女人。顯然,這是一個炎熱的日子,你可以看到市場上有水果、陶瓷和裙子。

儘管需要的細節很多,ChatGPT生成了一幅高品質且非常詳細的圖像。

Midjourney

雖然Midjourney同樣達成了這幅圖像,但細節的表現卻不夠到位。放大後,面孔不完整,兩個人的手融合在一起,大部分背景都是模糊的。

勝者:ChatGPT贏得了這一輪。雖然兩個圖像在表面上看起來都正確,且大部分特徵都符合要求,但Midjourney缺少了太多細節。

3. 改編真實圖像

提示:將這幅圖像轉變為文藝復興時期的肖像。

ChatGPT

在這個提示下,ChatGPT基本上將我的圖像轉換為《蒙娜麗莎》的風格。再次,我對該模型的表現沒有任何指責。它將我提供的照片轉換為文藝復興時期的風格。

它還很好地保留了所有特徵,如耳機、背景和我穿的衣服,同時保持主題。

Midjourney

是的,這是Midjourney給我的四個嘗試中最好的。我能看到模型試圖達到的效果,但卻沒有完全實現。

我甚至試著稍微改變提示,以明確表達我想要的是一幅畫風格的圖像,結果卻變得更糟。我猜測棕色邊框也是想符合主題?但很難說。

勝者:ChatGPT證明了這個新模型在將創意扭轉應用於你自己的圖像方面表現出色,這再次證明了它的能力。它完全按照我的要求進行了操作,而Midjourney似乎半途而廢。

4. 電影海報

提示:為這部電影創建一個引人注目的海報:一部設定在2250年的賽博朋克電影,背景是一個繁忙的大城市。這部電影講述了一名偵探回到過去阻止即將發生的戰爭。

ChatGPT

這可能不是最引人注目的海報,但ChatGPT確實按照要求完成了。偵探位於中央,繁忙的(相當未來感的)城市在背景中。它對文本的解讀相當字面,添加了所要求的數據和標語。

總體而言,這幅作品令人印象深刻。偵探的細節到位,背後有霓虹燈的影子,空中還有一輛飛車,儘管略顯粗糙,但有很多未來感的摩天大樓。

Midjourney

儘管Midjourney在細節上有所欠缺,但它的風格卻很出色。可以說,這裡的摩天大樓看起來更好,而且圖像中有很多值得一看的元素。

可惜,Midjourney在細節上卻落後了。地面的圖像變得模糊,汽車和摩托車出現了故障,背景中有許多奇怪的細節。

雖然它更有趣,但這裡的錯誤過多。

勝者:ChatGPT完成了我所有的要求,製作出了一個我可以放出來的海報,沒有人會對此感到奇怪(除了那個令人無聊的電影標題)。而Midjourney在此方面出現了太多問題。不過,我仍然欣賞它的創意方向。

5. 文本生成

提示:製作一張海報,海報上寫著:“AI圖像生成樂隊 – 今晚8點在這裡演出!翻唱你最愛的所有熱門歌曲”。將圖像風格化,仿佛這是為一個在熱門地點演出的樂隊的海報。

ChatGPT

ChatGPT的圖像生成中有一個主題:細節常常勝過風格。這張海報完成了我所有的要求,更重要的是,所有文字都完全正確。

幾個月前,ChatGPT在這方面可能會遇到困難,因此看到它的進步令人興奮。

雖然這張海報很無聊,但它準確地完成了任務,這對AI模型來說是一個挑戰。

Midjourney

我欣賞Midjourney將這張海報更像是放在場館外的形式。我也喜歡它在中間放置樂隊圖片的能量。

然而,除了“樂隊”這幾個字,其他所有文字都無法辨認。相比之下,ChatGPT能夠完整呈現所有文本,這讓Midjourney感覺有些失望。

勝者:ChatGPT可能不夠有趣,但它完美地完成了任務。Midjourney顯示出,AI模型處理圖像中的文本並不總是容易。

6. 手部

提示:製作一幅圖像,描繪一個人的手,左手持有一個橙子,右手則持有一杯水。

ChatGPT

AI的進步真是令人驚嘆。當AI圖像生成剛剛出現時,識別它的一個簡單方法就是查看手部。它們的手指通常會異常長,或者手指指向錯誤的位置。

如今,雖然這裡的手仍然看起來不完全像人類,但準確性確實令人印象深刻。兩隻手的手指數量正確(這是個好開始),杯子中的水正確地變形了手部的視覺效果,還可以看到靜脈和指甲。

Midjourney

Midjourney在這方面表現出色。我認為這幅圖中尤其令人印象深刻的細節在於手臂的毛發、靜脈、指關節的瘀傷和手上的妊娠紋。

雖然ChatGPT的圖像很容易被識別為AI生成,但這幅圖幾乎可以通過。唯一明顯的問題是玻璃後面的手指看起來不太對勁。橙子的握法也有點奇怪,但各人有各人的喜好。

勝者:Midjourney在AI最著名的缺陷之一中贏得了勝利。這顯示了它的進步。這並不是說ChatGPT表現不佳,只是沒有完全匹配。

7. 食物

提示:製作一幅海鮮意大利麵的圖像,這幅圖像將用於食物Instagram。

ChatGPT

這是一幅我在食譜書中看到的食物圖像,毫無疑問。儘管這道菜並不存在,但我想吃它。對於AI模型來說,這一表現無可挑剔,儘管底部隨意放置的香草有些突兀。

Midjourney

和ChatGPT一樣,Midjourney在這方面也表現出色。這看起來像是一家高檔餐廳裡的真正意大利麵碗。周圍甚至還散落了一些隨意的西紅柿和大蒜,估計是裝飾用。

勝者:ChatGPT在這裡獲勝,因為圖像質量稍微好一些,但就像手部圖像一樣,這也是一場接近的比賽。

最終判決:ChatGPT獲勝

對於Midjourney來說,這次比賽的結果顯然不容樂觀。當然,值得注意的是,Midjourney剛剛推出這個版本,仍處於實驗階段。然而,這款最新的GPT圖像生成模型僅比它早一兩周。

雖然這些模型在某些方面偶爾旗鼓相當,但ChatGPT經常在Midjourney無法做到的地方表現出色。

我希望Midjourney在版本7的測試階段中能看到改進,因為它本可能成為一個出色的AI圖像生成器。

這項測試不僅展示了兩個強大模型的能力,也讓我們看到了AI技術的發展潛力。隨著技術的進步,未來的圖像生成或許能更加完美,甚至能滿足更高的創意需求。這對於藝術創作、設計和媒體行業來說都是一個激動人心的前景。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon