《精靈寶可夢助 AI 探索真實世界》

Ai

寶可夢Go玩家無意中訓練了AI導航世界

Niantic表示,他們正在利用寶可夢Go玩家生成的數據來創建一個“大型地理空間模型”,該模型能夠導航現實世界並為機器人提供支持。

Niantic是非常受歡迎的擴增實境手機遊戲《寶可夢Go》和《Ingress》的開發公司,最近宣布他們正在利用數以百萬計玩家收集的數據來創建一個能夠導航物理世界的AI模型。

在上週發表的一篇博客文章中,Niantic指出,他們正在構建一個“大型地理空間模型”(LGM)。這個名稱直接參考了大型語言模型(LLMs),例如OpenAI的GPT,這些模型通過從互聯網上抓取大量文本來進行訓練,以便處理和生成自然語言。Niantic解釋說,LGM的目標是為物理世界做同樣的事情,他們表示這項技術“將使計算機不僅能夠感知和理解物理空間,還能以新的方式與之互動,成為AR眼鏡及其他領域(包括機器人技術、內容創作和自主系統)的關鍵組成部分。隨著我們從手機轉向與現實世界相連的可穿戴技術,空間智能將成為未來世界的操作系統。”

通過對來自世界各地的數百萬個地理標記圖像進行訓練,該模型將能夠以類似於LLM生成連貫和令人信服的句子的方式來預測其周圍環境,這是通過統計確定一個詞最有可能跟隨另一個詞。

Niantic表示:“大型地理空間模型將幫助計算機以一種看似同樣先進的方式感知、理解和導航物理世界。”

在Niantic的博客中,我發現以下對於LGM工作原理的解釋最為清晰:

“想像一下你站在一座教堂的後面。假設最近的本地模型只見過那座教堂的正面,因此它無法告訴你你的位置,因為這個模型從未見過那座建築的背面。但在全球範圍內,我們見過很多教堂,成千上萬座,所有這些都由其他地方的本地模型捕獲。雖然每座教堂都不相同,但許多教堂有共同特徵。LGM是一種訪問這種分散知識的方法。”

Niantic的LGM建立在其Lightship視覺定位系統(VPS)之上,該系統允許玩家將虛擬物品固定在現實世界的物理位置,精度達到“厘米級”。例如,Niantic最近在《寶可夢Go》中推出了一個實驗性功能,稱為寶可夢遊樂場,用戶可以在特定位置放置寶可夢,這些寶可夢將保持在那裡,供其他人查看和互動。Niantic解釋說,這一功能由大量數據支持,並且獨特之處在於它是從行人視角收集的,這些位置是汽車無法到達的。

“今天,我們在全球擁有1000萬個掃描位置,其中超過100萬個已啟用並可用於我們的VPS服務,”Niantic表示。“我們每週收到約100萬次新的掃描,每次掃描都包含數百張不同的圖像。”這些數據是從他們的遊戲和Scaniverse(Niantic的3D掃描應用程序)中收集的。

近幾年來,AI的黃金熱潮促使人們瘋狂尋找大型數據集以訓練生成式AI模型。我們看到公司從互聯網、YouTube字幕、YouTube視頻、書籍等抓取文本,幾乎沒有考慮到創建這些數據的人。在這種情況下,玩《寶可夢Go》的玩家在2016年下載遊戲時,根本無法預料這會成為這類AI產品的燃料。

Niantic試圖在AI領域利用其數據並不讓人驚訝。正如該公司所說,來自Google街景和各種自駕車公司的數據意味著有大量的道路數據,但Niantic的遊戲創造了大量僅限行人可進入的數據集。目前,該公司表示這些數據可以在幾個方面發揮作用,例如其他擴增實境產品,但最有趣的是這些數據可能幫助機器人導航現實世界,因為在現實世界中導航的機器人可以執行從送餐到攜帶自動步槍等多種任務。

對於Niantic是否對誰和如何利用這些數據有任何限制,該公司並未回應我們的詢問。

在這一背景下,Niantic的數據利用引發了對數據隱私和倫理的思考。儘管玩家在使用遊戲時並未明確同意其數據用於AI訓練,但這卻是現實。這不僅關乎遊戲開發者的商業模式,也關乎未來科技的發展方向。隨著AI技術的日益成熟,我們必須思考如何平衡數據利用與個人隱私之間的矛盾,確保技術的發展能夠造福社會,而不是造成新的不平等和風險。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *