創建和驗證穩定的AI控制系統:嚴謹而靈活的方法
MIT CSAIL的研究人員設計了一種新技術,能保證由神經網絡控制的機器人的穩定性。這一發展最終可能導致更安全的自動駕駛汽車和工業機器人。
神經網絡在工程師設計機器人控制器的方式上產生了巨大的影響,促進了更具適應性和效率的機器。然而,這些類似大腦的機器學習系統是一把雙刃劍:它們的複雜性使其強大,但也使得很難保證由神經網絡驅動的機器人能夠安全地完成任務。
傳統上,驗證安全性和穩定性的方法是通過稱為Lyapunov函數的技術。如果你能找到一個Lyapunov函數,其值持續下降,那麼你就能知道與較高值相關的不安全或不穩定情況永遠不會發生。然而,對於由神經網絡控制的機器人,以前的驗證Lyapunov條件的方法無法很好地擴展到複雜的機器上。
MIT計算機科學與人工智能實驗室(CSAIL)和其他地方的研究人員現在開發了新的技術,可以嚴格地認證更複雜系統中的Lyapunov計算。他們的算法有效地搜索和驗證了一個Lyapunov函數,為系統提供了穩定性保證。這種方法可能會使機器人和自動駕駛車輛,包括飛機和太空船的部署更加安全。
為了超越以前的算法,研究人員找到了一個節儉的捷徑來進行培訓和驗證過程。他們生成了更便宜的反例—例如,來自傳感器的對抗性數據,這些數據可能會擾亂控制器—然後優化機器人系統以考慮這些數據。理解這些極端情況幫助機器學會如何應對挑戰性情況,從而使其能夠在比以往更廣泛的條件下安全操作。然後,他們開發了一種新的驗證公式,允許使用可擴展的神經網絡驗證器α,β-CROWN,提供超越反例的嚴格最壞情況保證。
“我們在AI控制的機器如人形機器人和機器狗上看到了令人印象深刻的經驗表現,但這些AI控制器缺乏對於安全關鍵系統至關重要的正式保證,”MIT電機工程和計算機科學(EECS)博士生兼CSAIL成員Lujie Yang說。她是這項新研究論文的共同第一作者,與豐田研究所的研究員Hongkai Dai SM ’12, PhD ’16共同撰寫。“我們的工作填補了神經網絡控制器的表現水平與在現實世界中部署更複雜的神經網絡控制器所需的安全保證之間的差距。”
在一個數字演示中,研究小組模擬了一個配備有激光雷達傳感器的四軸飛行器如何在二維環境中穩定。使用僅由激光雷達傳感器提供的有限環境信息,他們的算法成功地引導飛行器達到穩定的懸停位置。在另外兩個實驗中,他們的方法使兩個模擬機器人系統在更廣泛的條件下穩定運行:一個倒立擺和一個路徑跟踪車輛。這些實驗雖然謙虛,但相對於以前的神經網絡驗證社區所能做的更為複雜,尤其是因為它們包括了傳感器模型。
“與一般的機器學習問題不同,神經網絡作為Lyapunov函數的嚴格使用需要解決困難的全局優化問題,因此可擴展性是主要瓶頸,”加州大學聖地亞哥分校計算機科學與工程副教授Sicun Gao說,他並未參與此項工作。“當前的工作通過開發更好地針對神經網絡作為控制問題中的Lyapunov函數使用的算法方法,做出了重要貢獻。它在可擴展性和解決方案質量上相對現有方法取得了令人印象深刻的改進。這項工作為進一步開發神經Lyapunov方法的優化算法和在控制和機器人領域中嚴格使用深度學習開闢了令人興奮的方向。”
Yang和她的同事們的穩定性方法在需要保證安全的廣泛應用中具有潛力。它可以幫助確保自動駕駛車輛如飛機和太空船的平穩行駛。同樣,一個運送物品或繪製不同地形的無人機也可以從這樣的安全保證中受益。
這裡開發的技術非常通用,不僅僅限於機器人領域;相同的技術將來也可能幫助其他應用,如生物醫學和工業加工。
雖然技術在可擴展性方面相對於以前的工作有所升級,但研究人員正在探索它在高維系統中如何表現得更好。他們還希望考慮激光雷達讀數以外的數據,如圖像和點雲。
作為未來的研究方向,研究小組希望為處於不確定環境中並受到干擾的系統提供相同的穩定性保證。例如,如果一個無人機遇到強風,Yang和她的同事們希望確保它仍能穩定飛行並完成預期任務。
此外,他們打算將他們的方法應用於優化問題,目標是最小化機器人完成任務所需的時間和距離,同時保持穩定。他們計劃將技術擴展到人形機器人和其他現實世界的機器,這些機器需要在與周圍環境接觸時保持穩定。
Russ Tedrake,MIT EECS、航空航天與機械工程的豐田教授,TRI的機器人研究副總裁,CSAIL成員,是這項研究的資深作者。該論文還引用了加州大學洛杉磯分校的博士生Zhouxing Shi和副教授Cho-Jui Hsieh,以及伊利諾伊大學厄巴納-香檳分校的助理教授Huan Zhang。他們的工作部分得到了亞馬遜、國家科學基金會、海軍研究辦公室和Schmidt Sciences的AI2050計劃的支持。研究人員的論文將在2024年國際機器學習會議上發表。
編輯評論:
這篇文章詳細介紹了MIT CSAIL團隊在確保由神經網絡控制的機器人穩定性方面取得的突破性進展。這項技術不僅在理論上具有重要意義,還有潛在的廣泛應用價值,特別是在自動駕駛和工業自動化領域。這種技術的發展,可能會大大提高自動化系統的安全性,從而推動其更廣泛的應用。
然而,文章也指出了這項技術目前的局限性,例如在高維系統中的性能以及對更多數據類型的適用性還有待進一步研究。這些挑戰需要研究人員持續努力,以改進和擴展這項技術的應用範圍。
總體來說,這篇文章展示了MIT在AI和機器人控制領域的前沿研究,並為未來的研究方向提供了許多啟發。這種技術的成功應用,將可能改變我們對自動化系統安全性的認知,並推動相關技術的進一步發展。
以上文章由特價GPT API KEY所翻譯