ChatGPT圖像生成勁過DALL-E 3？實測比較話你知！

zero comment

我將ChatGPT的新圖像生成器與DALL-E 3進行比較，結果令人驚訝，前提是你有耐心

在AI工具的熱潮中，圖像生成器因其視覺上的趣味性而成為焦點。OpenAI最近在ChatGPT中推出了一款新的圖像創建工具，突顯了這一點。

這個新模型並不是DALL-E 3的升級，而是一項全新的技術。雖然不想在文章一開始就透露過多，但這個新圖像生成器確實能創造出令人印象深刻的藝術作品。相比DALL-E只需30秒或更少的時間，這個新工具的生成時間有時需要幾分鐘，但結果卻讓人驚訝。

實際上，這種優秀的表現也帶來了一些問題。它模仿人類藝術家的風格之程度讓人感到過於接近。儘管如此，我還是決定將這兩者進行幾個提示的比較。

照片寫實主義與文本

我首先想測試的是哪一個模型能夠克服AI的一個經典弱點：圖像中的可讀文本。因此，我請求生成一個寫著「歡迎來到未來」的紐約市街道標誌。

兩者都成功地呈現了標誌上的文字，但DALL-E的紐約場景看起來並不如ChatGPT的真實。此外，ChatGPT圖像中的其他標誌拼寫都是正確的，而DALL-E的「單行道」標誌則拼寫不正確。

物體融合

接下來，我測試了每個模型在融合兩種截然不同動物（獅子和老鷹）方面的能力。我要求生成一種結合獅子和老鷹特徵的混合生物，威嚴地栖息在山頂上。

DALL-E的景觀相當不錯，動物看起來也相當真實，但主要還是獅子加上翅膀，還有一些隨機的羽毛和奇怪的尾巴。而ChatGPT則創造了一種看起來像是來自異世界自然歷史博物館的格里芬畫作，顏色和肌肉結構的融合也讓這個生物看起來能夠成功地把翅膀折疊在背上。

藝術模仿

在經歷了Ghibli的模仿後，我決定模仿一位已故的藝術家拉斐爾，並要求生成一幅他絕不會畫的事件。我請求創作「一幅科學家揭示突破性發明的畫作，風格為拉斐爾」。

ChatGPT生成的圖像看起來像是科幻文藝復興風格的電燈泡發明場景，人物與五百年前貴族家庭的成員相似，但沒有電力。DALL-E 3則對同一概念的表現更為壯觀，雖然不確定是否完全像拉斐爾的作品，但至少是文藝復興風格，而且實際上是個更有趣的視角。

歷史再現

在藝術風格模仿之後，我決定變得非常具體和歷史性。重現萊特兄弟的首次飛行是一項不小的挑戰。我請求生成「一幅萊特兄弟在基蒂霍克首次飛行的照片，飛機在空中，觀眾在觀看」。

ChatGPT生成了一架與實際首次飛行不太相似的奇怪飛機，觀眾和景觀則顯得有些超現實。而DALL-E則成功模仿了一張照片，觀眾看起來像真實的人，第一架飛機上的乘客數量（只有一人）也正確。

哪一個更好？

值得注意的是，我這裡僅僅是關注圖像生成。你還可以對上傳到ChatGPT的照片進行令人印象深刻的圖像編輯，這是DALL-E無法做到的，但這是另一個話題。

ChatGPT的新圖像生成器在創意和跟隨用戶意圖方面非常出色，這導致了Ghibli的爭議和其他藝術倫理問題。除此之外，在所有比賽中，它都是顯然的獲勝者。然而，它的生成時間大約是DALL-E的五倍，而且一次只生成一張。

DALL-E則可以快速生成良好的圖像，而且可以同時生成兩張。它也沒有我在ChatGPT中發現的限制，在某些情況下，即使我是一名ChatGPT Plus訂閱者，還需要等待八分鐘才能重新開始生成圖像。如果我想用AI圖像創作給人留下深刻印象，那麼ChatGPT無疑是我的首選。

勝者：ChatGPT

在這個快速變化的科技時代，AI圖像生成工具的競爭越來越激烈。ChatGPT的優勢在於其創造力和對用戶指令的敏感度，這對於藝術創作和設計領域來說是極具潛力的。然而，隨著技術的進步，使用者也需要面對生成速度和效率的挑戰。未來，如何在創意和效率之間找到平衡，將是AI發展的一個重要課題。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Download TXT

🔥 CHATGPT PLUS 帳戶出租