MIT機械人幫手唔聽話?輕輕一推就搞掂!實時糾正機械人動作技術

Ai

🎬 YouTube Premium 家庭 Plan成員一位 只需
HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放


立即升級 🔗

機械助手出錯?只需輕輕引導它

新研究顯示,透過簡單的互動,一個人可以即時修正機械人的行為,這樣的反饋方式與我們對其他人所給予的反饋相似。

想像一下,一個機械人在幫你洗碗。你叫它從水槽裡拿起一個泡沫碗,但它的夾具稍微錯過了目標。透過麻省理工學院(MIT)和NVIDIA研究人員開發的新框架,你可以用簡單的互動來修正這個機械人的行為。這種方法允許你在螢幕上指向碗或描繪一條路徑,甚至只是輕輕推動機械人的手臂朝正確的方向移動。

與其他修正機械人行為的方法不同,這種技術不需要用戶收集新數據或重新訓練驅動機械人思考的機器學習模型。它使機械人能夠利用直觀的即時人類反饋,選擇出最接近滿足用戶意圖的可行行動序列。

在研究人員測試他們的框架時,其成功率比不利用人類介入的替代方法高出21%。從長遠來看,這個框架可以讓用戶更輕鬆地引導工廠訓練的機械人執行各種家庭任務,即使這個機械人從未見過他們的家或其中的物品。

“我們不能期望普通人去進行數據收集和微調神經網絡模型。消費者會期望機械人能夠直接使用,如果它無法正常工作,他們希望有一個直觀的機制來進行自定義。這就是我們在這項工作中所面對的挑戰,”電機工程與計算機科學(EECS)研究生及該方法的主要作者Felix Yanwei Wang表示。

他的一些合作者包括Lirui Wang博士、Yilun Du博士、MIT航空航天與宇航學教授Julie Shah,以及NVIDIA的Balakumar Sundaralingam、Xuning Yang、Yu-Wei Chao、Claudia Perez-D’Arpino博士和Dieter Fox。該研究將在國際機器人與自動化會議上展示。

減少錯位

最近,研究人員開始利用預訓練的生成AI模型來學習機械人完成行動的“政策”或一組規則。生成模型可以解決多個複雜任務。

在訓練過程中,模型僅看到可行的機械人動作,因此學會生成有效的路徑讓機械人遵循。儘管這些路徑是有效的,但這並不意味著它們總是與用戶在現實世界中的意圖一致。例如,機械人可能被訓練成從架子上抓取盒子而不將其撞倒,但如果架子的擺放方式與它在訓練中看到的不同,它可能無法到達某人書架上的盒子。

為了解決這些失敗,工程師通常需要收集展示新任務的數據並重新訓練生成模型,這是一個昂貴且耗時的過程,還需要機器學習的專業知識。

相反,MIT的研究人員希望讓用戶在機械人出錯時引導其行為。如果人類與機械人互動以修正其行為,這可能會無意中導致生成模型選擇無效的動作。它可能會達到用戶想要的盒子,但過程中卻撞倒了書本。

“我們希望讓用戶與機械人互動,而不引入這類錯誤,這樣我們能獲得一種更符合用戶意圖的行為,同時也是有效和可行的,”Wang表示。

他們的框架通過提供三種直觀的方式來修正機械人的行為來實現這一點,每種方式都有其優勢。

首先,用戶可以在顯示機械人相機視角的界面中指向他們希望機械人操作的物體。其次,他們可以在該界面中描繪一條軌跡,指定他們希望機械人如何到達該物體。最後,他們可以物理地將機械人的手臂向他們希望其遵循的方向移動。

“當你將環境的2D圖像映射到3D空間的行動時,一些信息會丟失。物理推動機械人是表達用戶意圖的最直接方式,而不會丟失任何信息,”Wang說。

成功的取樣

為了確保這些互動不會導致機械人選擇無效的行動,如與其他物體發生碰撞,研究人員使用了一種特定的取樣程序。這種技術使模型能夠從最接近用戶目標的有效行動集中選擇一個行動。

“我們不是僅僅強加用戶的意願,而是給機械人一個用戶意圖的概念,但讓取樣過程圍繞其自己學習的行為集進行波動,”Wang解釋道。

這種取樣方法使研究人員的框架在模擬和與玩具廚房中的真實機械手臂的實驗中,表現優於他們比較的其他方法。雖然他們的方法可能並不總是立即完成任務,但它為用戶提供了立即修正機械人的優勢,當他們看到機械人做錯事時,而不必等它完成任務後再給予新指令。

此外,當用戶輕輕推動機械人幾次,直到它拿起正確的碗時,機械人可以記錄這一修正行動並在未來的訓練中將其納入行為。然後,第二天,機械人就可以在不需要推動的情況下拿起正確的碗。

“但持續改進的關鍵在於讓用戶能夠與機械人互動,這就是我們在這裡所展示的,”Wang說。

未來,研究人員希望提高取樣程序的速度,同時保持或改善其性能。他們還希望在新環境中實驗機械人政策生成。

這項研究不僅展示了機械人與人類互動的潛力,還強調了如何利用直觀的反饋來改善機械人的行為。隨著技術的不斷進步,未來的機械人可能會更加靈活地應對各種家庭任務,而不再只是被動執行預設的程序。這不僅能提高工作效率,也能提升用戶體驗,讓機械人真正成為我們生活中的得力助手。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。