AI新神器Whisk：免輸入指令，秒速圖像生成

zero comment

這款新的Google AI工具讓你輕鬆從其他照片生成圖像 – 無需提示

撰文：Lance Whitney，貢獻者
2024年12月17日上午9:52 PT

撰寫正確的提示和描述來創建AI生成的圖像往往是個挑戰。很多時候，生成的圖像未能達到預期，迫使你不斷微調提示，直到得到理想的結果。現在，Google推出了一款新工具，旨在簡化這一過程，讓用戶能夠基於其他圖像創建新圖像。

如何使用Whisk創建圖像
這款名為Whisk的工具最初在美國推出，任何擁有Google帳戶的人都可以免費使用。它由Google的Gemini AI驅動，提供多種從其他圖像創建新圖像的方法。

要開始使用Whisk，請使用你的Google帳戶登錄Whisk主頁。你可以從三個模板中選擇一個來生成圖像。你可以選擇一個貼紙，這會創建一個類似於消息應用中的平面圖像；而琺瑯針則會為圖像增添一些深度，毛絨玩具則會生成一個三維圖像。

默認情況下，Whisk會根據你選擇的模板自動選擇一個風格圖像。接下來，選擇你想用作主題的圖像。你可以從頁面提供的圖像中選擇，或上傳自己的圖像。Gemini會分析這些圖像的風格和主題，然後將它們結合生成一個新圖像。如果結果不令人滿意，你可以更換主題圖像，生成不同的結果。

這個過程聽起來很簡單，但你可以更具創意。要獲得更多控制權，選擇從頭開始的選項。在這裡，你可以選擇主題、場景和風格的圖像，無論是上傳自己的圖像還是撰寫傳統提示。如果你不確定從哪裡開始，可以請求Whisk提供靈感，它會為你生成一系列圖像。

一旦準備好，告訴Whisk根據所選的組合生成新圖像。Whisk將根據這個組合顯示多個圖像。你可以通過添加或刪除源圖像或編輯提示來細化結果。

你生成的所有圖像會自動保存到你的Whisk庫中。在那裡，你可以刪除任何不需要的圖像，並下載你喜歡的圖像。下載的文件以JPG格式保存，方便你在其他應用和服務中使用。

Google如何實現這種圖像生成？
Whisk不是通過複製源圖像來創建新圖像，而是提取一些關鍵元素。

“在幕後，Gemini模型會自動為你的圖像撰寫詳細的說明。然後將這些描述輸入到Google最新的圖像生成模型Imagen 3中，”Google產品管理總監Thomas Iljic在週一發表的博客中寫道。“這一過程捕捉了主題的本質，而不是精確複製。這樣，你就可以以新穎的方式輕鬆地重新混合你的主題、場景和風格。”

因此，生成的人物圖像可能與原始圖像在高度、體重、髮型或膚色上有所不同。如果你希望結果朝特定方向發展，Google還允許你編輯底層提示。

“在我們早期與藝術家和創意人士的測試中，人們將Whisk描述為一種新型創意工具，而不是傳統的圖像編輯器，”Iljic補充道。“我們建造它是為了快速的視覺探索，而不是像素完美的編輯。這是關於以新穎和創意的方式探索想法，讓你能夠處理數十種選擇並下載你喜歡的圖像。”

在這個數字化迅速發展的時代，Google的新工具為創意工作者提供了一個強大的平台，讓他們能夠在無需繁瑣提示的情況下，快速生成視覺內容。這不僅能提高創作效率，還能激發新的靈感，對於設計師、藝術家以及任何需要視覺素材的人來說，都是一個值得關注的好工具。隨著AI技術的進步，未來的創意工作可能會更加依賴這種智能工具，讓我們期待這些變革將如何影響藝術和設計領域的發展。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。