免費!最新GPT 4o 繪圖 + 修圖! 整MEME圖、漫畫一流!

ChatGPT圖像升級勁爆!AI繪圖更真、字體更靚!

Ai

ChatGPT 剛剛獲得了一個巨大的圖像生成升級
更真實的圖像、更好的文本、改善的一致性。
David Nield
2025年3月26日

OpenAI 顯著提升了 ChatGPT 的圖像生成能力,這次升級是作為去年五月推出的 GPT-4o 模型的一部分。這個新的改進版 AI 生成器現在已經向所有 ChatGPT 用戶推出,包括付費計劃和免費用戶(不過免費用戶的使用限制較多)。

早在之前,通過 ChatGPT 界面生成圖像已經是可能的,但其背後的工作是交由 DALL-E 3 圖像模型處理。現在,所有的工作將由 GPT-4o 處理,提供更一致和原生的體驗。

這裡有很多改進,涵蓋了 AI 圖像創建工具通常面臨的一些挑戰:渲染文本、保持角色在圖片中的一致性以及繪製圖表。OpenAI 表示,現在用戶可以期待更“精確、準確和照片真實”的結果。

更真實和準確的圖像
AI 生成的圖像並不總是完美,但它們越來越接近完美。
用 AI 生成的圖像常常帶有一種人工光澤,告訴你這些圖像是由算法構思出來的,而 GPT-4o 的圖像應該能減少這種明顯的人工痕跡。OpenAI 展示的一張示範圖片顯示一位女性在白板上寫字,並且反射出窗外的景色——這一切都相當逼真,儘管底部的小標題告訴你這是 ChatGPT 嘗試八次後的最佳結果。

OpenAI 說,AI 藝術用戶創建的圖像應該會更忠實於給定的提示。因此,如果你希望特定物體位於特定位置,或者需要人們處於某些姿勢,這些指示顯然會更準確地執行。一張更令人印象深刻的示例圖片顯示了一個四格漫畫,由 ChatGPT 渲染,沒有明顯的錯誤或不一致的地方。

我嘗試讓 ChatGPT 將奧斯汀的小說變成漫畫,並生成一幅有著花園的莊園的照片真實圖像,結果相當令人驚豔——雖然還不算完美。這些圖像確實比 ChatGPT 之前生成的要好得多,儘管渲染需要的時間較長(通常是幾分鐘而不是幾秒鐘)。

文本和圖表的巨大改進
文本不再是主要問題——因此可以輕鬆製作假書封面。
讓 AI 精確渲染文本和圖表一直是個挑戰:這些工具的構建方式使它們更擅長於創造和重新混合其訓練過的圖像,而不是重現字母表的精確副本或一系列矩形和箭頭。

新的 GPT-4o 模型可以高水平和高精度地渲染文本和圖表,因此你不應該看到太多奇怪的錯誤和不一致。OpenAI 的展示視頻中包括了一個菜單、一個邀請函、一張登機牌和解釋牛頓棱鏡實驗的圖表,這些都是從一個文本提示生成的。

當我要求 ChatGPT 生成一個簡單解釋 DNA 的信息圖和一個指定標題和作者的書封面時,它幾乎完全遵循了要求——圖形簡單但準確(根據提示),而書封面看起來像是在商店中可能看到的樣子。同樣重要的是,這些圖像中沒有奇怪的瑕疵或不一致的地方。

一致性和編輯
教授,是你嗎?角色和圖像的一致性仍然需要一些改進。
我之前曾寫過關於 ChatGPT 圖像編輯的限制,而這也是另一個升級的領域。現在,在圖像之間保持角色和場景的一致性變得更容易,可以只調整圖片的部分,而讓其餘部分保持不變,並且可以構建圖像的不同層次。如果需要,還可以創建透明背景,或者使用十六進制顏色指定顏色。

其他改進包括 ChatGPT 可以接受和重新混合你自己的圖像,並整合其他信息(來自網絡和其訓練數據):因此,OpenAI 展示的一張圖片是基於提示“製作一個視覺信息圖,描述為什麼舊金山這麼霧”的,ChatGPT 確實做到了(好吧,三次中最好的一次)。

在我自己的測試中,我發現 ChatGPT 在編輯圖像方面表現得更好,並且在不同風格中重新混合圖片的能力也相當不錯。它在保持圖像之間的一致性方面仍然存在一定的困難——特別是在複雜物體和角色方面。這確實比以前要好,但在某些情況下仍然會過度編輯,使得 AI 對於微調圖像或創建需要匹配的多幅圖像的實用性下降。

版權和安全問題
圖表現在更少無意義且更準確。
與任何生成 AI 的公告一樣,關於版權、誤用和能源需求的問題再次浮現。OpenAI 已明言,這些工具不可能不在受版權保護的圖像上進行訓練,儘管它最近開始與 Shutterstock 等提供商簽署內容協議。OpenAI 首席運營官 Brad Lightcap 告訴《華爾街日報》,GPT-4o 圖像生成器將拒絕模仿任何在世藝術家的作品請求。

在安全方面,OpenAI 表示生成的圖像都帶有 C2PA 元數據,以識別它們為 AI 生成的——不過這些元數據可以通過簡單的截屏輕易移除。OpenAI 還表示,該 AI 生成器旨在拒絕任何創建“兒童性虐待材料和性深度偽造”的請求,以及其他違反其內容政策的提示。

這無疑是 AI 圖像的一次重大進步:升級的技術在某些方面真的令人驚嘆,許多 AI 的明顯跡象和技術錯誤正在消失。然而,這也引發了一些關於我們未來的重大問題,未來的世界將如此容易地製造假象,創作工作將由機器而非人類完成——而我們集體失去畫畫、寫作或編寫代碼的能力。那麼,生成 AI 將如何找到更多的訓練數據呢?

在這篇文章中,David Nield 深刻地揭示了 AI 圖像生成技術的進步,但同時也提出了對未來的擔憂。隨著技術的發展,我們不禁思考,這些工具是否會使我們的創造力逐漸退化,或是我們是否能找到一種平衡,讓人類和機器的創造力相輔相成。這不僅是技術的問題,更是文化和倫理的挑戰。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon