MIT新AI技術:更快解決複雜規劃問題,效率提升50%!

Ai

🎬 YouTube Premium 家庭 Plan成員一位 只需
HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放


立即升級 🔗

一種更快速解決複雜規劃問題的方法

由於消除冗餘計算,一種新的數據驅動方法能夠簡化如列車調度、送貨司機路線規劃或航空公司人員分配等過程。

麻省理工學院新聞部 | Adam Zewe
發佈日期:2025年4月16日

當某些通勤列車到達終點站時,它們需要前往一個轉軌平台進行調頭,以便稍後從不同的站台出發。工程師使用稱為算法求解器的軟件程序來規劃這些動作,但在每週有數千次到達和出發的車站,這個問題對於傳統求解器來說變得過於複雜,無法一次性解決。

利用機器學習,麻省理工學院的研究人員開發了一種改進的規劃系統,能將求解時間減少多達50%,並產生更符合用戶目標的解決方案,例如準時的列車出發。這種新方法也可以用於高效解決其他複雜的後勤問題,例如醫院人員排班、航空公司人員分配或工廠機械任務分配。

工程師通常將這類問題分解為一系列重疊的子問題,每個子問題都可以在可行的時間內解決。然而,這些重疊會導致許多決策不必要地重新計算,因此求解器需要更長的時間來達到最佳解決方案。

這種新的人工智能增強方法學習每個子問題中哪些部分應保持不變,將這些變數凍結以避免冗餘計算。然後,傳統的算法求解器處理剩餘的變數。

“通常,一個專門團隊可能需要幾個月甚至幾年來設計一個算法來解決這類組合問題。現代深度學習給我們提供了利用新進展來幫助簡化這些算法設計的機會。我們可以利用我們已知的有效方法,並用人工智能來加速它,”麻省理工學院土木與環境工程學助理教授Cathy Wu說。

她與論文的第一作者IDSS研究生Sirui Li、CEE研究生Wenbin Ouyang以及LIDS博士後Yining Ma共同參與了這項研究。該研究將在國際學習表示會議上發表。

消除冗餘

這項研究的一個動機是來自Wu教授入門級交通課程中一位碩士生Devin Camille Wilkins提出的實際問題。這位學生希望將強化學習應用於波士頓北站的真實列車調度問題。交通組織需要將許多列車分配到有限數量的站台,以便它們能在到達車站之前進行調頭。

這實際上是一個非常複雜的組合調度問題——正是Wu的實驗室這幾年來一直在研究的類型。

當面臨涉及將有限資源(如工廠任務)分配給一組機器的長期問題時,規劃者通常將問題框架為靈活工作車間調度。

在靈活工作車間調度中,每個任務需要不同的完成時間,但任務可以分配給任何機器。同時,每個任務由必須按正確順序執行的操作組成。

這類問題迅速變得對傳統求解器來說過於龐大和繁瑣,因此用戶可以採用滾動視野優化(RHO)將問題分解為可更快解決的可管理部分。

使用RHO時,用戶在固定的規劃視野內為機器分配初始少數任務,可能是一個四小時的時間窗口。然後,他們執行該序列中的第一個任務,並將四小時的規劃視野向前推進以添加下一個任務,重複此過程直到整個問題解決,最終生成任務-機器分配的排程。

規劃視野應該長於任何一個任務的持續時間,因為如果算法還考慮即將到來的任務,解決方案會更好。

但是當規劃視野推進時,這會與前一個規劃視野中的操作產生某些重疊。算法已經為這些重疊操作提出了初步解決方案。

“也許這些初步解決方案是好的,不需要再次計算,但也許它們不好。這就是機器學習發揮作用的地方,”Wu解釋道。

對於他們稱之為學習引導滾動視野優化(L-RHO)的技術,研究人員教會了一個機器學習模型預測在規劃視野推進時哪些操作或變數應該重新計算。

L-RHO需要數據來訓練模型,因此研究人員使用經典算法求解器解決一組子問題。他們選擇最佳解決方案——那些不需要重新計算的操作最多的方案——作為訓練數據。

一旦訓練完成,機器學習模型就會接收到一個它之前未見過的新子問題,並預測哪些操作不應重新計算。剩餘的操作被反饋給算法求解器,該求解器執行任務,重新計算這些操作並推進規劃視野。然後這個循環再次開始。

“如果回顧來看,我們不需要重新優化它們,那麼我們可以從問題中刪除那些變數。由於這些問題的大小呈指數增長,如果我們能夠刪除一些變數,這將是相當有利的,”她補充道。

一種可調整、可擴展的方法

為了測試他們的方法,研究人員將L-RHO與幾種基本算法求解器、專門求解器以及僅使用機器學習的方法進行了比較。結果顯示,L-RHO的表現超過了所有其他方法,求解時間減少了54%,解決方案質量提高了多達21%。

此外,在測試更複雜的問題變體(例如工廠機器故障或列車擁堵)時,他們的方法仍然超過了所有基準。甚至在研究人員創建的挑戰性基準中,L-RHO也表現出色。

“我們的方法可以不經修改地應用於所有這些不同的變體,這正是我們希望通過這項研究線路達成的目標,”她表示。

L-RHO還可以在目標變更時自動生成新的算法來解決問題——它所需的僅僅是一個新的訓練數據集。

未來,研究人員希望更深入了解模型決定凍結某些變數而不是其他變數的邏輯。他們還希望將他們的方法整合到其他類型的複雜優化問題中,例如庫存管理或車輛路由。

這項工作部分得到了國家科學基金會、麻省理工學院研究支持委員會、亞馬遜機器人博士生獎學金和MathWorks的支持。

這項研究顯示了人工智能在解決複雜問題中的巨大潛力,尤其是在當今快速變化的商業環境中。這種新方法不僅能提高效率,還能提升解決方案的質量,這對於需要精確調度和資源配置的行業如交通運輸、製造業等都是一個重大的突破。隨著這項技術的進一步發展,未來或許能夠在更多的領域中看到其應用,從而推動整個行業的進步。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

✨ Nano Banana AI 生圖免費玩!

📸 上載你嘅「Before」,AI即刻幫你整出「After」!

🪄 一鍵變身|真實人物 → 公仔風 / Cosplay / 海報風

🧍你上載的照片:

Before Image

🎨 AI生成的照片:

After Image
🚀 即刻免費玩 Nano Banana