
明日屬於今天擁抱它的人
我試用了ChatGPT的新圖像生成器,它超乎我的預期
OpenAI可能是以其DALL-E模型開創了文本到圖像生成的潮流,但隨著時間推移,這家AI公司在圖像生成方面的產品已經被更強大的模型所超越。因此,當OpenAI推出其最新的GPT-4o圖像生成模型時,我心中充滿懷疑。然而,經過測試後,我完全改變了看法。
開始使用
當DALL-E首次推出時,它是以獨立網站的形式存在;隨後,它移至ChatGPT平台。這一轉變帶來了諸多好處,使用者可以在與AI聊天的同時請求生成圖片,省去頻繁切換上下文的麻煩。
隨著GPT-4o圖像生成的推出,OpenAI維持了這種便捷的格式,將付費用戶的默認圖像生成器從DALL-E切換為GPT-4o。因此,從我的ChatGPT Plus帳戶開始創建新圖片變得非常簡單。我只需輸入想要的提示,它就會生成相應的圖片。用戶也可以通過Sora界面訪問這一功能。
注意:如果你是免費用戶,仍然可以以類似的方式生成圖片。然而,如果你對結果不滿意,那是因為雖然在發布時宣布該模型將向所有用戶,包括免費用戶推出,但OpenAI首席執行官山姆·阿爾特曼在一天後表示,免費層的推出將“延遲一段時間”。
圖片展示
你期待的時刻來了——圖片。在你輸入提示後,AI會在不到一分鐘內輸出生成的圖片。這個過程雖然比以前稍長,但圖片的質量絕對值得等待,提供了大量的細節、質感和真實感,甚至還有文本的準確性。與其描述,我會附上幾個例子讓你自己看看。
提示:能否生成一幅逼真的變色龍特寫圖片,就像在《國家地理》上看到的一樣,比例為16:9?
提示:能否生成一幅打開的筆記本電腦放在桌子上的圖片,上面寫著:“這個模型非常出色,甚至能正確處理文本和手,這通常是AI模型的主要挑戰”,並且有雙手在鍵盤上打字,比例為16:9?
提示:能否生成一幅在時代廣場的人群中,近距離拍攝的一位女性微笑著看向鏡頭的逼真照片,質量如單反相機拍攝?
如上所示,圖像生成器在遵循提示並提供高質量、逼真的圖片方面表現出色。然而,在測試AI模型時,一個真正的性能指標就是它與市場上競爭對手的比較。為了給你提供一個良好的指標,我讓它生成了我在所有主要AI圖像生成器上測試的相同提示,包括Midjourney、Google的Imagen 3、Adobe Firefly等等。
我將GPT-4o的作品附上,你可以在這篇文章中看到它與其他AI圖像生成器的對比,包括DALL-E的作品,顯然新模型的表現遠超前者。
提示:能否生成一幅色彩鮮豔、逼真的蜂鳥栖息在樹上的圖片?
其他顯著特點
儘管圖片質量可能是這個模型最大的優勢之一,但還有其他的好處。其中最大的好處是它集成在聊天機器人的界面中,這使得用戶可以通過簡單的自然語言提示來調整生成的圖片。此外,由於聊天機器人擁有你剛剛詢問的上下文,它能夠在生成圖像時考慮這些信息。
例如,如果你正在與它聊天討論舉辦生日派對,你可以說:“現在可以創建一個包含上述信息的邀請函嗎?”而無需重新輸入。例如,我開始與ChatGPT討論舉辦一個暖房派對,當我請求它創建邀請函時,我不需要重複之前所說的信息。
你還可以上傳參考圖片,然後要求ChatGPT創建不同版本或將其作為新圖片的元素。例如,你可以輸入一張自拍,並要求它以動漫風格生成,如阿爾特曼在X上的新帖子所示。
所有這些自定義功能使其成為一個強大的工具,特別適合創意工作者,他們還可以要求以透明背景呈現,或整合品牌風格指南,如十六進制代碼或標誌。
提到阿爾特曼,我能夠生成一幅他戴著派對帽的圖片。之所以能做到,是因為新模型的安全防護措施更加寬鬆,旨在讓用戶發揮創意。公告中指出,當現實人物出現在上下文中時,模型會限制某些內容的生成,包括“對裸體和暴力內容的特別保護”。
我無法確定這一功能是否有實際用途,但這是一個我需要親自嘗試的顯著變化。當我試著創建米奇老鼠的圖片時,系統表示由於版權問題無法生成,因此並非所有公共人物都可以隨意使用。
總結
總的來說,GPT-4o圖像生成器相較於DALL-E模型是一次重大勝利,可能是我測試過的眾多模型中最好的。那麼,這個每月20美元的費用值得嗎?如果你只是對高質量的圖像生成感興趣,仍然有一些免費版本可供探索,如Adobe Firefly或Google的Imagen 3,這些都非常出色。
儘管如此,如果你是頻繁使用ChatGPT的用戶,升級到ChatGPT Plus的吸引力大大增加。通過這次升級,你將能夠訪問OpenAI最新的聊天機器人功能,以及高質量的圖像和視頻生成,所有這些只需每月20美元,這在市場上並不算貴,特別是考慮到其他服務的定價。例如,Midjourney的訂閱費從每月10美元起,只提供圖像生成服務。
在這個快速變化的AI世界中,我們需要保持敏銳的洞察力,善用這些新技術,為我們的生活和工作注入創新和靈感。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。