Whisk是Google最新的AI圖像生成器,效果驚人
作者:Chris Smith
發佈日期:2024年12月17日 1:53 PM EST
如果你通過BGR的連結購買產品,我們可能會獲得聯盟佣金,幫助支持我們的專家產品實驗室。
目前,OpenAI在AI領域的影響力無疑是最大的,最近它巧妙地利用“12天”活動佔據了假期的焦點。每個工作日都有新的直播,OpenAI宣布ChatGPT的新功能或其他產品更新,幾乎讓其他AI公司無法發光發熱。然而,Google作為OpenAI最大的競爭對手,卻也找到了一些同樣巧妙的方法來吸引注意。
就在上週,Google宣布了重大的Gemini 2.0升級及其首款AI代理。如果這還不足以讓我們暫時忘記ChatGPT,Google還決定揭曉支援XR設備的Android AR平台,並展示了未命名的Gemini驅動的AR智能眼鏡。
幾天後,Google推出了另一款新AI產品。這是一個令人興奮的圖像生成器,名為Google Whisk。它與一般的AI圖像生成器不同,這或許使它成為最有趣的選擇。用戶不需要輸入提示來讓Gemini創建特定的AI圖像,而是可以上傳圖片,讓Whisk根據你的提示創建新的場景。
目前,Whisk並不是一個完整的產品,因為它目前僅作為Google Labs的演示版提供,並且僅限於美國市場。但無論如何,它看起來都非常出色。
Google擁有幾款強大的AI圖像生成器,有些已經在Google Photos中可用,有些則隨Pixel 9手機推出。我曾經批評過Google的AI照片編輯軟件,特別是那些隨Pixel 9手機推出的,因為它們允許任何人輕易地操縱現實,將其變成虛假內容。
這家公司急於展示其在AI領域的進展,以至於在未先部署安全保障的情況下推出了這些功能,這些保障後來才跟上。
Whisk的獨特性
Whisk並不是那樣的。它並不是用來創建可以用於可疑活動的逼真圖像。它是一種有趣的方式,利用你已有的照片作為靈感來快速生成AI圖像。Whisk不會要求你為AI生成的圖像寫詳細的提示。相反,它會要求你上傳三張圖片:一張用於主題,一張用於場景,還有一張用於風格。Gemini將分析這些圖片,根據它們創建自己的提示,並將其傳遞給Google的Imagen 3圖像生成工具。
Google在一篇博客中表示,這個過程“捕捉了你主題的本質,而不是精確的複製品”。
然而,你可能不會喜歡Gemini對你所提供圖像的理解。如果是這樣,你可以添加一個文本提示,讓AI能夠生成更符合你想法的新作品。
Google還指出,Whisk是一種“新型創意工具”,而不是傳統的圖像編輯器。“我們為快速的視覺探索而構建它,而不是追求像素完美的編輯。這是關於以新的創意方式探索想法,讓你能夠選擇數十個選項並下載你喜愛的作品,”Google表示。
一些在Reddit上測試這一功能的用戶發現,Whisk能夠創造出逼真的主題,比如下面的貓咪:
有用戶評論道,Whisk似乎是完美的工具,能讓你在不被告知的情況下幫助訓練AI。想想看:你正在提供你的照片,然後Gemini會檢視這些照片以了解它能學到什麼。接著,它會將三張圖片拼湊在一起,創造出一幅並不完美的圖像。你用來細化圖像的文本提示實際上是Gemini的反饋工具。
在AI公司面臨數據短缺的情況下,像Whisk這樣的實驗可以輕鬆地引發病毒式傳播,實在是相當有用。值得注意的是,Google並未說明你與Whisk的互動會發生什麼。你上傳到Whisk的照片會怎樣?你與Gemini的“聊天”又會如何處理?這些我們都不知道。
如果你身在美國,可以通過Google Labs註冊試用Whisk。這款新的AI圖像生成器尚未在國際市場上推出。以下是Whisk運行的視頻:
評論與反思
這項新技術的推出無疑是AI領域的一次創新,尤其是它在創意生成方面的潛力。Whisk不僅讓用戶能夠更自由地探索自己的創意,還提供了一個平台來重新定義我們與圖像的互動方式。這種方法不僅能夠吸引藝術創作者,也可能吸引那些對AI技術感興趣的普通用戶。
然而,這也引發了一些潛在的隱私問題。用戶在上傳個人照片時,Google如何處理這些數據,是否會用於訓練AI,這些都是值得關注的問題。隨著AI技術的不斷發展,企業需要在提供創新服務和保護用戶隱私之間取得平衡。這不僅是對用戶信任的考驗,也是對企業道德的挑戰。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。