AI新神器Whisk:免輸入指令,秒速圖像生成

Ai

這款新的Google AI工具讓你輕鬆從其他照片生成圖像 – 無需提示

撰文:Lance Whitney,貢獻者
2024年12月17日 上午9:52 PT

撰寫正確的提示和描述來創建AI生成的圖像往往是個挑戰。很多時候,生成的圖像未能達到預期,迫使你不斷微調提示,直到得到理想的結果。現在,Google推出了一款新工具,旨在簡化這一過程,讓用戶能夠基於其他圖像創建新圖像。

如何使用Whisk創建圖像
這款名為Whisk的工具最初在美國推出,任何擁有Google帳戶的人都可以免費使用。它由Google的Gemini AI驅動,提供多種從其他圖像創建新圖像的方法。

要開始使用Whisk,請使用你的Google帳戶登錄Whisk主頁。你可以從三個模板中選擇一個來生成圖像。你可以選擇一個貼紙,這會創建一個類似於消息應用中的平面圖像;而琺瑯針則會為圖像增添一些深度,毛絨玩具則會生成一個三維圖像。

默認情況下,Whisk會根據你選擇的模板自動選擇一個風格圖像。接下來,選擇你想用作主題的圖像。你可以從頁面提供的圖像中選擇,或上傳自己的圖像。Gemini會分析這些圖像的風格和主題,然後將它們結合生成一個新圖像。如果結果不令人滿意,你可以更換主題圖像,生成不同的結果。

這個過程聽起來很簡單,但你可以更具創意。要獲得更多控制權,選擇從頭開始的選項。在這裡,你可以選擇主題、場景和風格的圖像,無論是上傳自己的圖像還是撰寫傳統提示。如果你不確定從哪裡開始,可以請求Whisk提供靈感,它會為你生成一系列圖像。

一旦準備好,告訴Whisk根據所選的組合生成新圖像。Whisk將根據這個組合顯示多個圖像。你可以通過添加或刪除源圖像或編輯提示來細化結果。

你生成的所有圖像會自動保存到你的Whisk庫中。在那裡,你可以刪除任何不需要的圖像,並下載你喜歡的圖像。下載的文件以JPG格式保存,方便你在其他應用和服務中使用。

Google如何實現這種圖像生成?
Whisk不是通過複製源圖像來創建新圖像,而是提取一些關鍵元素。

“在幕後,Gemini模型會自動為你的圖像撰寫詳細的說明。然後將這些描述輸入到Google最新的圖像生成模型Imagen 3中,”Google產品管理總監Thomas Iljic在週一發表的博客中寫道。“這一過程捕捉了主題的本質,而不是精確複製。這樣,你就可以以新穎的方式輕鬆地重新混合你的主題、場景和風格。”

因此,生成的人物圖像可能與原始圖像在高度、體重、髮型或膚色上有所不同。如果你希望結果朝特定方向發展,Google還允許你編輯底層提示。

“在我們早期與藝術家和創意人士的測試中,人們將Whisk描述為一種新型創意工具,而不是傳統的圖像編輯器,”Iljic補充道。“我們建造它是為了快速的視覺探索,而不是像素完美的編輯。這是關於以新穎和創意的方式探索想法,讓你能夠處理數十種選擇並下載你喜歡的圖像。”

在這個數字化迅速發展的時代,Google的新工具為創意工作者提供了一個強大的平台,讓他們能夠在無需繁瑣提示的情況下,快速生成視覺內容。這不僅能提高創作效率,還能激發新的靈感,對於設計師、藝術家以及任何需要視覺素材的人來說,都是一個值得關注的好工具。隨著AI技術的進步,未來的創意工作可能會更加依賴這種智能工具,讓我們期待這些變革將如何影響藝術和設計領域的發展。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *