一個新的元宇宙?
位於舊金山的初創公司World Labs最近推出了一個新的平台,專注於其所稱的「大型世界模型」(Large World Models,簡稱LWM)。該公司正在開發這些LWM,以創造可以進入和互動的3D世界,但這些世界是完全基於單一圖像構建的。
目前,這些3D世界已可在World Labs的網站上進行體驗,未來還會有更多內容推出。像Netflix這樣的公司正在探索如何利用這類AI遊戲,而Midjourney則積極尋求創建一個全息甲板系統。
World Labs的團隊由來自Meta和Google的專業人士組成,包括斯坦福大學AI開發研究的先驅之一李飛飛。通過使用「空間智能」AI來建模3D世界,該團隊希望在未來的機器人技術、AI視頻和元宇宙中成為關鍵參與者。
創建新的元宇宙
World Labs的發布正值Google DeepMind推出Genie 2的同一周。Genie 2被稱為「大規模基礎世界模型」,主要針對遊戲和自主AI應用。
這項新技術同樣基於單一圖像,能夠創建720p的全互動分辨率環境。用戶可以使用鼠標和鍵盤在這個環境中導航,並指示虛擬角色根據環境內容完成動作。
這可能是我們朝著真正沉浸式世界邁進的首個明顯跡象。眾所周知,當前元宇宙的問題在於所創建的在線世界稀疏且相對無趣。
儘管Meta不斷努力推廣VR頭盔,但這些在線世界仍然不足以吸引人們定期登錄。
如果矽谷希望讓我們長時間在線生活和購物,就必須提出更好的空間來實現這一願景。
World Labs和Google的工作展示了這種空間的可能性。事實上,越來越多的科技公司正在致力於這個問題,包括Midjourney、Luma Labs、Adobe以及Meta本身。
這並不是一個簡單的問題
不幸的是,從文本到圖像再到完整的3D互動並不是一個簡單的挑戰。這也許是為什麼對遊戲開發社群期望提高的原因。
儘管遊戲產業在AI的複雜性上有所欠缺,但其在圖像處理方面的專業知識和創造迷人有趣的互動環境的悠久歷史是其優勢。即使是小型自製項目如Halo VR也展示了這一類型未來的潛力。
世界真正需要的是將Unreal Engine 5.5的驚人圖形與像ChatGPT進階語音模式這樣的AI模型的流暢互動和最小延遲結合起來。
如果有公司能夠將這些元素組合成一個快速、美麗且有趣的包裝,那麼它很可能成為全球首個元宇宙獨角獸。現在這個領域仍然是開放的,誰將脫穎而出仍是個未知數。
—
在這篇文章中,我們看到了技術進步的潛力,尤其是在元宇宙的發展上。World Labs和Google的這些創新不僅展示了AI在3D環境中的應用,還引發了對虛擬世界未來的思考。這些新技術的出現,讓人們對沉浸式體驗的期待越來越高。同時,文章也點出了現有元宇宙的不足之處,強調了未來需要更具吸引力的內容來吸引用戶的注意。隨著技術的持續發展,我們或許能夠期待一個更加生動和互動的虛擬世界,這不僅會改變我們的娛樂方式,也可能影響到我們的生活、工作與社交方式。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。