
一種更快解決複雜規劃問題的方法
通過消除冗餘計算,這種新的數據驅動方法可以簡化如列車調度、配送司機路徑規劃或航空公司機組人員分配等過程。
麻省理工學院的研究人員開發了一種以機器學習為指導的技術,能比某些傳統方法更高效地解決複雜的長期規劃問題。當一些通勤列車到達終點站後,它們需要前往一個轉車台進行調頭,以便稍後從不同的站台出發。
工程師們使用稱為算法求解器的軟件程序來規劃這些運動,但在每週有數千次進出站的情況下,這個問題對傳統求解器來說變得過於複雜,無法一次性解決。
麻省理工學院的研究人員利用機器學習開發了一個改進的規劃系統,能將解決時間縮短多達50%,並產生更符合用戶目標的解決方案,例如準時列車出發。這種新方法還可以有效解決其他複雜的後勤問題,如醫院人員排班、航空公司機組人員指派或工廠機器的任務分配。
工程師們通常將這類問題分解為一系列重疊的子問題,每個子問題都可以在可行的時間內解決。但這些重疊導致許多決策需要不必要地重新計算,因此求解器花費更長時間才能達到最佳解。
這種新的人工智能增強方法學習哪些子問題的部分應保持不變,凍結這些變量以避免冗餘計算。然後,傳統算法求解器處理剩餘的變量。
“通常,一個專門的團隊可能需要幾個月甚至幾年來設計一個算法,僅僅解決這些組合問題中的一個。現代深度學習為我們提供了利用新進展來幫助簡化這些算法設計的機會。我們可以利用已知的有效方法,並使用人工智能加速它,”麻省理工學院土木與環境工程(CEE)及數據、系統與社會研究所(IDSS)副教授Cathy Wu表示。
她的研究團隊成員包括首席作者、IDSS研究生Sirui Li、CEE研究生Wenbin Ouyang和LIDS博士後Yining Ma。這項研究將在國際學習表徵會議上展示。
消除冗餘
這項研究的一個動機是由碩士生Devin Camille Wilkins在Wu的入門交通課程中提出的實際問題。該學生希望將強化學習應用於波士頓北站的一個真實列車調度問題。交通組織需要將許多列車分配到有限的站台,以便在它們到達車站之前就能良好地進行調頭。
這被證明是一個非常複雜的組合調度問題——正是Wu的實驗室在過去幾年中一直在研究的類型。
在面對涉及將有限資源(如工廠任務)分配給一組機器的長期問題時,規劃者通常將問題框架設為靈活的作業車間調度(Flexible Job Shop Scheduling)。
在靈活作業車間調度中,每個任務需要不同的完成時間,但任務可以分配給任何機器。同時,每個任務由必須按正確順序執行的操作組成。
這類問題很快就變得過於龐大且難以處理,因此用戶可以使用滾動視野優化(RHO)將問題分解為可更快解決的可管理部分。
使用RHO時,用戶在固定的規劃時間範圍內最初將幾個任務分配給機器,例如四小時的時間窗口。然後,他們執行該序列中的第一個任務,並將四小時的規劃範圍向前推進以添加下一個任務,重複這個過程,直到整個問題被解決,並生成最終的任務-機器分配計劃。
規劃範圍應該長於任何一個任務的持續時間,因為如果算法也考慮即將到來的任務,解決方案會更好。
但是當規劃範圍推進時,這會與前一個規劃範圍中的操作產生一些重疊。算法已經對這些重疊操作提出了初步解決方案。
“也許這些初步解決方案是好的,不需要再計算,但也許它們不夠好。這就是機器學習的用武之地,”Wu解釋道。
對於他們的技術,研究人員稱之為學習指導的滾動視野優化(L-RHO),研究人員訓練機器學習模型來預測在規劃範圍推進時哪些操作或變量應該重新計算。
L-RHO需要數據來訓練模型,因此研究人員使用經典的算法求解器解決一組子問題。他們選取最佳解決方案——即那些不需要重新計算的操作最多的方案——作為訓練數據。
一旦訓練完成,機器學習模型將接收一個之前未見過的新子問題,並預測哪些操作不應重新計算。剩餘的操作將被反饋給算法求解器,該求解器執行任務、重新計算這些操作並推進規劃範圍。然後這個循環重新開始。
“如果事後看來,我們不需要重新優化它們,那麼我們可以將這些變量從問題中刪除。因為這些問題的規模是指數增長的,如果我們能刪除一些變量,這將是相當有利的,”她補充道。
一種可適應的、可擴展的方法
為了測試他們的方法,研究人員將L-RHO與幾個基本算法求解器、專門求解器和僅使用機器學習的方法進行比較。結果顯示,L-RHO的表現超過了所有對手,解決時間縮短了54%,解決方案質量提高了多達21%。
此外,當他們在問題的更複雜變體上進行測試時,例如工廠機器故障或列車擁堵時,他們的方法仍然超過所有基準。甚至在研究人員創造的其他基準下,他們的求解器也表現得更好。
“我們的方法可以不經修改地應用於所有這些不同的變體,這正是我們在這一研究方向中所希望實現的,”她說。
L-RHO還可以在目標變化時自動生成新的算法來解決問題——所需的僅僅是一個新的訓練數據集。
未來,研究人員希望更好地理解模型決定凍結某些變量而不凍結其他變量的邏輯。他們還希望將他們的方法整合到其他類型的複雜優化問題中,例如庫存管理或車輛路由。
這項工作部分得到了國家科學基金會、麻省理工學院研究支持委員會、亞馬遜機器人博士獎學金和MathWorks的支持。
這項研究展示了人工智能在解決複雜問題中的潛力,尤其是在當前全球物流和運輸需求日益增長的背景下。我們正處於一個需要更高效解決方案的時代,這種技術不僅能夠提升運營效率,還能為未來的城市交通和工業生產提供更智能的解決方案。通過將這些機器學習技術應用於各種領域,未來的規劃和資源管理將變得更加靈活和高效,這無疑是科技進步的一個重要里程碑。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。