
ChatGPT 推出原生 AI 圖像生成功能
用戶現在可以在常規的 ChatGPT 窗口中輸入提示(和圖片),並獲得 AI 生成的圖像,這要歸功於 GPT-4o。這項功能目前對 Plus、Pro、Team 和免費用戶開放,但有一些限制。
OpenAI 現已將 AI 圖像生成能力添加到 ChatGPT 中。用戶現在可以選擇 GPT-4o 模型,提供提示,並在常規的 ChatGPT 窗口中獲得所需的圖像。
此前,ChatGPT 依賴於 OpenAI 的 DALL-E 模型來生成圖像。現在,它使用 4o 模型的原生多模態能力,提供“精確、準確、逼真的輸出”。
OpenAI 強調 GPT-4o 在“準確渲染文本、精確跟隨提示以及利用 4o 的內在知識庫和聊天上下文(包括轉換上傳的圖像或將其作為視覺靈感)”方面的技能。換句話說,用戶可以期待更少的奇怪結果。
這一成果是通過“在線圖像和文本的聯合分佈進行訓練而實現的,學習的不僅是圖像與語言之間的關係,還包括圖像之間的關係。”OpenAI表示。
強化物件處理能力
GPT-4o 還能處理比以往更多的圖像物件。根據 OpenAI 的說法,其他聊天機器人最多只能為一幅圖像生成八個物件,而 GPT-4o 能夠生成多達 20 個物件。
此外,它還可以編輯和改善用戶上傳的圖像。在一段演示視頻中,一名 OpenAI 研究員上傳了一個手繪的漫畫頁草圖,並由 ChatGPT 獲得了一個全彩的數字版本。
不過,OpenAI 也警告稱,“我們的模型並不完美。我們知道目前存在多個限制,我們將在初始推出後通過模型改進來解決這些問題。”
OpenAI 將為每個輸出嵌入 C2PA 元數據。這將允許 AI 圖像檢測器準確識別由 GPT-4o 生成的圖像。此外,ChatGPT 將拒絕有關兒童性虐待材料(CSAM)和性深偽的請求。“當真實人物的圖像在上下文中出現時,我們對可以創建的圖像類型有更高的限制,特別是在裸露和血腥暴力方面有特別嚴格的保障。”OpenAI表示。
在稍後的附錄中,OpenAI 表示不會阻止 GPT-4o 生成成人公共人物的圖像,但那些“希望不生成自己描繪的人物可以選擇退出。”
未來展望
在推出時,ChatGPT 的原生圖像生成功能對所有 Plus、Pro、Team 和免費用戶開放,對企業和教育客戶的支持將很快推出。該功能也可在 OpenAI 的視頻生成工具 Sora 上使用。
OpenAI 尚未宣布免費用戶的每日限制,但告訴《The Verge》將模仿 DALL-E,限制用戶每天生成三幅免費圖像。不過,這些數字“可能會根據需求隨時間而變化,”一位發言人補充道。
這一切並不意味著 DALL-E 將消失。“對於那些對 DALL-E 有特殊情感的人來說,它仍然可以通過專門的 DALL-E GPT 訪問,”OpenAI 說。
在這個快速發展的科技世界中,OpenAI 不斷推陳出新,將 AI 的應用範疇擴展至圖像生成,這無疑為創意工作者和設計師帶來了全新的工具和可能性。然而,這樣的技術也引發了對於倫理和使用規範的討論,特別是在生成涉及真實人物的圖像時。未來的挑戰將是如何在創新與責任之間找到平衡,確保技術的使用不會引發社會問題或侵犯個人隱私。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。