MIT機械人感知大躍進:邁向人類級智能

Ai

擴展機器人感知能力

副教授盧卡·卡爾隆(Luca Carlone)正致力於讓機器人對其環境有更類似人類的認知能力。

盧卡·卡爾隆最近在麻省理工學院(MIT)航空與航天工程系獲得終身職位,他負責的SPARK實驗室正在填補人類與機器人之間的一個關鍵缺口:感知。這個團隊進行理論和實驗研究,旨在以接近人類感知的方式擴展機器人對其環境的認知。卡爾隆常常提到,感知不僅僅是檢測。

雖然機器人在檢測和識別周圍物體的能力上取得了長足進步,但在更高層次理解環境方面仍有很多需要學習的地方。作為人類,我們對物體的感知不僅僅是它們的形狀和標籤,還包括它們的物理性質——如何操縱和移動——以及它們之間的關係、它們與更大環境的關聯,以及它們與我們自身的關係。

卡爾隆和他的團隊希望將這種人類級別的感知能力賦予機器人,使其能夠在家庭、工作場所及其他非結構環境中安全、無縫地與人類互動。

自2017年加入麻省理工學院以來,卡爾隆帶領團隊開發並應用感知和場景理解算法,應用於各種場景,包括自主地下搜索救援車輛、能夠隨時拾取和操作物體的無人機,以及自駕車。他們的研究也可能對遵循自然語言命令的家用機器人有幫助,甚至可能根據更高層次的上下文線索預測人類的需求。

卡爾隆表示:“感知是讓機器人在現實世界中幫助我們的一個重大瓶頸。如果我們能將認知和推理的元素加入機器人的感知中,我相信它們能做很多好事。”

擴展視野

卡爾隆出生於意大利薩勒諾附近,靠近風景如畫的阿馬爾菲海岸,他是三個兄弟中的最小者。他的母親是一位退休的小學數學老師,父親則是一位退休的歷史教授和出版商,對歷史研究採取分析的方式。三兄弟可能潛移默化地接受了父母的思維方式,最終都成為了工程師——前兩位選擇了電子和機械工程,而卡爾隆則選擇了機器人技術,當時稱為機電一體化。

然而,他直到大學學業的後期才進入這個領域。卡爾隆在都靈理工大學學習,起初專注於控制理論——一個將數學應用於自動控制物理系統行為(如電網、飛機、汽車和機器人)的領域。然後在大四時,他報名參加了一門機器人課程,探討操控技術的進展以及如何編程讓機器人移動和運作。

“這是一見鍾情。使用算法和數學來開發機器人的大腦,讓它能夠移動和與環境互動,這是最充實的經歷之一,”卡爾隆說。“我立即決定這就是我想要做的事。”

他隨後在都靈理工大學和米蘭理工大學的雙學位項目中獲得了機電一體化和自動化工程的碩士學位。在這個名為Alta Scuola Politecnica的項目中,卡爾隆還學習了管理課程,與不同學術背景的學生組隊,構思、建造並為新產品設計制定市場推廣計劃。卡爾隆的團隊開發了一款無接觸的檯燈,能夠根據用戶的手勢命令進行操作。這個項目促使他從不同的角度思考工程。

“這就像要使用不同的語言,”他說。“這讓我早早意識到需要超越工程的泡沫,思考如何創造能夠影響現實世界的技術工作。”

下一代

卡爾隆留在都靈完成了機電一體化的博士學位。在那段時間,他有自由選擇論文主題,他回憶道,當時的自己有些“天真”。

“我在探索一個社區認為已經理解得很好的主題,許多研究者認為沒有更多的東西可以說。”卡爾隆說。“我低估了這個主題的成熟程度,認為我仍然可以為它做出新的貢獻,結果運氣很好,真的做到了。”

這個主題是“同時定位與地圖建立”(SLAM)——生成和更新機器人環境地圖的問題,同時追蹤機器人在該環境中的位置。卡爾隆提出了一種重新構建問題的方法,使得算法能夠生成更精確的地圖,而無需像當時大多數SLAM方法那樣從初始猜測開始。他的工作為一個大多數機器人學者認為無法超越現有算法的領域打開了新的可能。

“SLAM的核心是弄清楚物體的幾何形狀以及機器人在這些物體之間的運動。”卡爾隆說。“現在我成為了一個社區的一部分,詢問下一代SLAM的發展方向。”

為了尋找答案,他接受了喬治亞理工學院的博士後職位,深入研究編碼和計算機視覺——這個領域在回顧時可能受到了一次幾乎失明的啟發:在他完成博士學位的時候,他遭遇了一次嚴重影響視力的醫療併發症。

“有一年,我隨時可能會失去一隻眼睛,”卡爾隆說。“這讓我開始思考視覺和人工視覺的重要性。”

他得到了良好的醫療護理,病情完全好轉,得以繼續工作。在喬治亞理工學院,他的導師弗蘭克·德拉爾特教他如何在計算機視覺中編碼,並對複雜的三維問題進行優雅的數學表示。德拉爾特也是第一批開發開源SLAM庫的學者之一,名為GTSAM,卡爾隆迅速認識到這是一個無價的資源。更廣泛地說,他看到開放軟件的可用性釋放了機器人技術的巨大潛力。

“歷史上,SLAM的進展非常緩慢,因為人們將代碼保密,每個小組必須從頭開始。”卡爾隆說。“然後開源管道開始出現,這改變了遊戲規則,並在過去十年中大大推動了進步。”

空間AI

在喬治亞理工學院之後,卡爾隆於2015年來到麻省理工學院,擔任信息與決策系統實驗室(LIDS)的博士後。在那段時間,他與航空與航天工程教授塞爾塔克·卡拉曼合作,開發軟件,幫助掌中寶無人機在非常少的電量下導航。一年後,他晉升為研究科學家,然後在2017年接受了航空航天系的教職。

“我在麻省理工學院愛上的一件事是,所有的決策都是基於這樣的問題:我們的價值觀是什麼?我們的使命是什麼?這從來不是關於低層次的利益。真正的動機是如何改善社會,”卡爾隆說。“這種心態讓人耳目一新。”

如今,卡爾隆的團隊正在開發超越幾何形狀和語義特徵的方式來表示機器人的周圍環境。他正在利用深度學習和大型語言模型來開發算法,使機器人能夠從更高的層次來感知其環境。過去六年中,他的實驗室發布了超過60個開源庫,全球有數千名研究人員和從業者在使用。這項工作的主要內容符合一個新興的更大領域,稱為“空間AI”。

“空間AI就像是SLAM的加強版,”卡爾隆說。“簡而言之,就是使機器人能夠像人類一樣思考和理解世界,並以有用的方式進行應用。”

這是一項巨大的工作,可能會在家庭、工作場所、道路,以及偏遠和潛在危險的區域中,促進更直觀、互動的機器人。卡爾隆表示,為了接近人類對世界的感知,未來還有很多工作要做。

“我有兩歲的雙胞胎女兒,我看到她們能夠操縱物體,同時攜帶十個玩具,輕鬆穿越雜亂的房間,並迅速適應新環境。機器人的感知尚不能與幼兒相比,”卡爾隆說。“但我們有了新的工具。未來是光明的。”

這位副教授的研究不僅對機器人技術的發展至關重要,更是對人類未來的生活方式提出了新的思考。機器人如果能夠更好地理解和適應我們的環境,將會在家庭、醫療、救災等多個領域發揮巨大的潛力。這不僅是科技的進步,更是社會進步的一部分,未來的機器人將可能成為我們生活中不可或缺的夥伴。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon