
ChatGPT 4o影像生成技術的影響:我們將再也無法信任iPhone渲染圖了
隨著ChatGPT新版本4o的推出,影像生成技術已經達到了一個新的高度。這項技術的優越性讓我擔心在我們這個小小的宇宙中,如何分辨渲染圖、模型和預製品洩漏的準確性,這些通常是未來Apple產品的預告,比如傳聞中的iPhone 17 Air。
對於不熟悉的人來說,iPhone 17 Air(或稱iPhone 17 Slim)是一款經常被討論但從未確認的超薄iPhone 16 Plus/iPhone 16e/SE混合體,預計將成為Apple在九月推出全新iPhone 17系列時最令人興奮的更新之一。
雖然它可能不是最強大的iPhone,但應該是最薄和最大的那款。即使是單個後置相機也可能無法阻止潛在買家的興趣。
想像它的樣子,這本來是我的工作。但在我開始使用運行最新4o模型的ChatGPT後,這項工作變得顯得不那麼重要。該模型能夠從無到有地生成影像,或者基於你上傳的照片和圖像進行創作。
這是一個稍微有些方法論的模型,生成一張圖片可能需要長達45秒,幾乎是每次一微米的水平方向像素流入。結果令人驚艷。
不僅僅是質量,ChatGPT還能保持影像在提示之間的連貫性。通常情況下,如果你在OpenAI的Dall-E或X的Grok等工具中開始生成影像,第一張圖片的質量是可以接受的。然而,當你請求變更時,原始元素往往會消失或被改變。要創建一系列看似屬於同一故事或主題的圖像則更困難,因為通常會出現太多差異。
而ChatGPT 4o的影像生成似乎有所不同,甚至可能更具能力。
ChatGPT 4o的實驗與應用
在Altman和其他OpenAI工程師宣布這個模型後不久,我便開始了測試。我發現ChatGPT 4o在開始時使用良好的來源時效果最佳。我最初用我的照片,以及本周拍攝的游隼照片進行了動漫風格的轉換。然而,我對ChatGPT的照片真實性能力特別感興趣,尤其是它與我工作的關聯。
Apple本周宣布WWDC 2025的主題演講將於6月9日舉行。這是一個科技巨頭概述平台更新(iOS、iPadOS、macOS等)的事件,這些更新會影響我們對Apple即將推出的產品系列的看法。獲得這些信息後,我們可以開始描繪預期中的iPhone 17系列的未來。想像這將如何呈現雖然很困難,但我決定讓ChatGPT最新的影像模型幫我一把。
由於iPhone 17 Air可能是iPhone家族中最新的成員(擠掉較不驚艷的iPhone 16e),我決定專注於這一點。
最初,我將一張舊的iPhone SE評測圖片交給ChatGPT,並給出這個提示:“使用這張照片來想像Apple iPhone 17 Air的樣子。請做得真實且顏色鮮艷。”
ChatGPT在保持原始照片的設置和我的手部細節方面表現得不錯,儘管我想我失去了一根手指。它成功地更新了表面效果,甚至還增加了一個第二個相機,並將其作為一個凸起的相機模組。
接下來,我給出這個提示:“這不錯。既然iPhone 17 Air應該非常薄,你能從側面展示一下嗎?”
ChatGPT失去了背景,讓這張圖片看起來像是一則iPhone 17 Air的廣告。這是一個不錯的點子,但手機看起來並不夠薄。我要求ChatGPT讓它更薄,結果它做到了。
這是一個進展,但我很快意識到我的錯誤。我沒有基於現有的iPhone 17 Air傳聞來設置提示,也許我的提示不夠具體。
隨著iPhone SE現在已經完全退役,我決定從頭開始,使用一張iPhone 16 Pro的評測圖片,最初使用了同樣的提示,這次生成了一款漂亮的藍色iPhone 16 Pro。
當我要求查看手機的薄側面時,我告訴ChatGPT:“不要改變背景。”
我很高興看到ChatGPT基本上保持了我後院的灌木,並無縫地將新手機插入其中,現在看起來像是我手的一個更吸引人的版本。
我最初的iPhone 16 Pro評測圖片在左側,ChatGPT 4o的作品在右側。
一些iPhone 17 Air的傳聞聲稱這款手機可能只有一個相機,因此我告訴ChatGPT去掉兩個相機並重新渲染。
在之前的提示中,我告訴ChatGPT“讓它更薄”,但如果我給聊天機器人一個確切的厚度呢?
“現在展示一下iPhone 17 Air的側面。它應該是5.4毫米厚,顏色保持不變。”
這幾乎是完美的。不過我注意到,並沒有明顯的相機凸起,這在一部5.4毫米厚的iPhone中似乎不太可能。即使是預期中的超薄Samsung Galaxy S25 Edge也有相機凸起。iPhone 17 Air不可能沒有。
最後,我要求渲染一下屏幕:“現在展示iPhone 17 Air的屏幕。確保顯示動態島。屏幕應該明亮,看起來像一個iPhone主屏幕,有應用程式和小部件。”
再次,ChatGPT做得很好,除了在Dock上方出現了一個“iOS IAir”的標籤。其餘的應用圖標標籤都很完美,這在考慮到大多數影像生成模型在處理文本方面的困難時,實在令人印象深刻。
ChatGPT生成的影像沒有AI水印,只有文件名告訴你這些是ChatGPT的圖片。這讓人擔憂,還有這卓越的品質。
我預計互聯網將很快充斥著來自ChatGPT的iPhone及其他消費電子硬件的渲染圖。我們將無法分辨什麼是真正的洩漏,什麼是手工製作的渲染,或是什麼是來自ChatGPT腦海中的直接創作,這取決於某位有創意的科技編輯的提示。
在這個技術快速發展的時代,這樣的情況無疑會對我們的資訊生態系統造成重大影響。我們未來可能需要重新思考如何評估和信任數字內容,因為生成的內容質量將可能超越我們的想像。這不僅是技術的進步,也是對我們判斷力的挑戰。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。