AI初創公司Physical Intelligence籌得4億美元,為機器人創造「大腦」
AI初創公司Physical Intelligence今日宣布,已成功籌集4億美元的新資金,專注於開發實用的人工智能模型,旨在為機器人創造「大腦」。
根據《紐約時報》的報導,這輪融資由亞馬遜創始人兼執行主席傑夫·貝索斯(Jeff Bezos)、Thrive Capital和Lux Capital領投。參與此輪融資的還有知名AI公司OpenAI、Redpoint Ventures和Bond。這輪融資將公司的估值提高至約20億美元,此前在今年3月,該公司已完成由Thrive Capital領投的7000萬美元種子輪融資。
該公司的聯合創始人兼首席執行官卡羅爾·豪斯曼(Karol Hausman)曾在Google LLC擔任機器人科學家,並與來自加州大學伯克利分校和斯坦福大學的研究團隊合作。公司旨在建立一個通用的AI模型,使機器人能夠理解物理世界,從而完成複雜的多步驟任務。
豪斯曼在接受《紐約時報》訪問時表示:「我們所做的不僅僅是為某一特定機器人創造一個大腦,而是一個可以控制任何機器人的通用大腦。」
根據公司介紹,現今的機器人大多是專業化的,大部分工業機器人僅能完成單一任務或一系列簡化的動作。這些機器人可以在環境中進行小幅調整,但在面對極為混亂或複雜的空間(例如家庭或其他現實世界的地方)時,則很難適應。
Physical Intelligence在上週的部落格文章中指出:「AI可以改變這一點,讓機器人能夠學習並遵循用戶指令,這樣編程一種新行為就像告訴機器人你想要做什麼一樣簡單,機器人可以自己找出如何調整其行為以適應環境。」
該公司的解決方案是一個名為π0(pi-zero)的AI模型,這是一個通用的機器人基礎模型,使用戶只需像與大型語言模型對話一樣,簡單地要求機器人執行任務。與大型語言模型不同的是,這個模型需要處理來自文本、圖像、視頻和「物理智能」的各種數據,物理智能是指移動肢體、抓取物體、操控它們及執行其他行為的具體經驗。
利用π0,Physical Intelligence已經展示了調整AI模型,使機器人能夠摺衣服、煮咖啡、清理餐桌和組裝盒子。在清理餐桌的情況下,機器人需要辨別垃圾和碗碟的區別。它必須將垃圾扔進垃圾桶,並將碗碟放入清理盤中。不過,它需要先將碗碟上的垃圾清除,這可以通過學習搖晃碗碟來實現。
該公司表示,創建通用模型的最大挑戰在於目前缺乏大規模的多任務和多機器人數據。隨著這些數據集的增長,將有助於為更強大的通用模型提供基礎,從而開發出更靈活的機器人大腦。
「我們相信這僅僅是朝著開發真正通用機器人模型的一小步。」該公司表示。正如大型語言模型是語言的基礎模型,通用機器人模型則為物理智能提供了基礎AI。
目前也有類似的機器人控制基礎模型,如OpenVLA,這是一個70億參數的開源模型,常被學術研究者用於實驗,還有Octo,這是一個930億參數的模型。該公司表示,其π0在大多數複雜任務中表現優於OpenVLA和Octo。
為機器人帶來「大腦」的趨勢正在成為科技行業的長期趨勢。去年,Google的研究人員揭示了一個使用PaLM-E(一個5.62億參數的模型)的機器人,能夠理解基本的單一語音指令,比如拾取和交付物品。今年早些時候,Nvidia公司也宣布了Project GR00T,這是一個面向雙足人形機器人的通用基礎模型。
該公司表示:「到目前為止,我們的實驗表明,這類模型可以控制各種機器人,執行過去任何機器人學習系統都未能成功的任務,例如從籃子裡摺衣服或組裝紙箱。但通用機器人政策仍然處於初級階段,我們還有很長的路要走。」
為了實現這一目標,Physical Intelligence表示,不僅需要更多的數據,還需要整個機器人社區的共同努力。該公司表示,已與多家公司和機器人實驗室展開多項合作,以便改善硬件設計,並利用合作夥伴提供的數據來進行預訓練模型,朝著這一願景邁進。
這篇報導突顯了AI在機器人領域的潛力,尤其是在創造更靈活和智能的機器人方面。隨著技術的進步,未來的機器人將不再是單一任務的執行者,而是能夠理解和適應複雜環境的智能助手。這一發展不僅能夠提升工業效率,還可能改變我們日常生活中的工作方式,讓機器人成為我們生活中真正的夥伴。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。