五大AI圖像生成器:Midjourney稱霸,Flux逼真崛起

Ai

5款你現在可以使用的AI圖像生成器

AI藝術生成已經進入了一個進化的時代,而不是革命的時代。2024年對於AI圖像生成來說是一個相對平靜的年份,至少相比於2022年和2023年所獲得的關注。視頻生成因OpenAI的Sora等高調發布而成為熱話。

“我認為很多工具都在關注AI內容創作的方向,並試圖保持更新,嘗試多樣化(進入視頻領域),”創意AI公司ZenRobot的聯合創始人Ross Symons表示。“但我發現那些堅持自己擅長領域的工具,比如Midjourney,正在主導市場。”

大多數現代AI圖像生成器仍然使用擴散模型。這種AI模型是通過教導神經網絡預測隨機噪聲,然後將其逐漸添加到圖像中來進行訓練。一旦訓練完成,這一過程可以逆轉,從隨機噪聲中創造獨特的圖像。擴散模型隨後與文本模型配對,將用戶的文本提示轉換為指導擴散模型結果的標記。

自2022年以來,擴散模型有所改進,但並未根本改變。在過去的一年裡,焦點從模型本身轉向了它們所驅動的軟件工具。目前最好的AI圖像生成器快速、易用,並提供更精細的圖像生成控制方式。

Midjourney

Midjourney顯然是專業圖像生成的首選。荷蘭阿姆斯特丹Aigency的聯合創始人Chrissie Cremers表示:“Midjourney對我們來說是一個非常重要的工具。它在藝術指導方面仍然表現優異。”Symons也表示,他“主要”使用Midjourney。

自2022年推出以來,Midjourney迅速獲得了以細緻、吸引人的圖像和強烈藝術風格而聞名的聲譽。它生成的圖像通常色彩鮮豔大膽,外觀戲劇性,能夠吸引觀眾的注意。Midjourney的擴散模型是專有的,只有訂閱其在線服務的用戶才能使用。

創意專業人士喜愛Midjourney的用戶界面,這一點有點諷刺,因為該模型最初僅通過與一個臨時用戶身份驗證系統連接的Discord聊天機器人提供。然而,這一點很快發生了變化,Midjourney現在提供了一個美觀的網頁界面,與同行相比,脫穎而出。

Flux

Flux是2024年發布的最重要的新模型,支持圖像編輯工具。儘管Midjourney在AI創意領域仍然受到青睞,但2024年出現了一個主要的擴散模型,填補了不同的角色:Flux。這一模型由黑森林實驗室創建,該公司由三位前穩定AI(Stable Diffusion背後的公司)員工創立。

Symons將Flux視為2024年最引人注目的新圖像生成模型。“在現實主義方面,它非常出色,”他表示。Cremers也同意,說“它非常適合照片真實性,比Midjourney更好。”Flux還提供強大的“內畫和外畫”工具,允許模型通過去除不需要的物體或擴展圖像來編輯圖像。

與Midjourney形成對比的是,Flux是一個開放模型,這意味著任何人都可以自由獲取、使用和微調。它可以在本地安裝,以在強大的家庭和辦公計算機上生成圖像。

Leonardo.ai

Leonardo.ai通過針對具有特定需求的創意專業人士而佔據了一個利基市場。成立於2022年的Leonardo.ai迅速建立了自己作為個人和公司尋求專業圖像生成的首選。

它主要專注於創建以新方式使用現有生成模型的工具,儘管該公司在2024年發布了其首個內部基礎模型Phoenix。Leonardo.ai還提供Flux,對於無法在自己硬件上運行Flux的人來說,它是更好的選擇之一。

“對於角色一致性,如果你生成的角色是插畫或者屬於奇幻領域,或者是3D的,我認為它不錯,”Symons說。這是通過支持低秩適應(LoRA)來實現的,這使得用戶可以調整擴散模型以滿足他們的需求。

Dall-E(通過OpenAI的ChatGPT)

Dall-E 3通過OpenAI的ChatGPT提供了一個圖像編輯工具,用於添加或去除生成圖像中的物體。OpenAI的Dall-E是最早引起新聞的圖像生成工具之一。然而,在2024年,它被OpenAI的視頻生成工具Sora的炒作所掩蓋,這款工具終於在12月發布。

儘管如此,Dall-E仍然是最突出的工具之一,尤其適合業餘使用。作為ChatGPT的一部分,Dall-E能夠快速生成可接受的圖像。2024年4月的更新還增加了圖像編輯功能,幫助用戶移除或更改Dall-E生成的圖像中的特定區域。

Google ImageFX

儘管僅僅是一個“實驗”,谷歌的ImageFX生成了具有優秀現實感的詳細圖像。谷歌實驗室是該公司“AI實驗”的家,包括一個名為ImageFX的圖像生成器。儘管沒有廣泛宣傳,且與此列表中的其他工具相比有點簡單,但ImageFX在AI創意界獲得了良好的聲譽。

Symons說:“這是一匹黑馬。沒人談論它,但它是一個不錯的工具。它是免費的,你可以一次生成四張圖像,這些圖像的質量非常好。”

ImageFX擁有簡單的界面,鼓勵用戶輸入簡短的提示。它還提供了一個關鍵詞列表,引導用戶的提示朝向模型可以輕鬆理解的文本。這種方法使得生成具有特定風格的詳細圖像變得簡單。ImageFX也是完全免費的,這對於更隨意的用戶來說是一個優勢。

其他值得關注的工具

雖然上述圖像生成器在2024年搶盡風頭,但它們並不是唯一值得關注的工具。Magnific以出色的圖像升級而聞名。Krea.ai則提供了吸引人的界面,用於第三方模型,包括Flux。

創意專業人士似乎對來自知名公司的圖像生成器不太熱衷。Getty Images、Shutterstock和Adobe都擁有生成AI服務,但這些服務缺乏Midjourney和Flux等領導者所帶來的熱度。Cremers指出,這是因為這些服務使用的圖像訓練資料。“它們往往基於大量的庫存圖像進行訓練,這反映在結果上。”

2025年似乎會重複2024年的情況。視頻生成將繼續成為焦點,因為幾家公司——尤其是谷歌——尚未發布他們備受期待的模型。儘管如此,Symons認為,隨著創意專業人士對這些工具的熟悉,他們會持續找到新的方法來使用圖像生成器。

“我希望人們能更了解AI的能力。有些事情是你可以做的,而有些事情是你不能做的,”Symons說。

在這篇文章中,我們看到了AI圖像生成器的多樣性和不斷演進的潛力。這不僅是技術的發展,還反映了創意行業對工具的需求與適應。隨著這些工具的普及,未來能否出現更多新穎的藝術表達方式,將取決於使用者如何利用這些技術的能力。不過,隨著市場競爭的加劇,這些工具的使用者也需要具備一定的創意與判斷力,以便在海量生成的圖像中找到獨特的聲音與風格。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon