MIT創新機械人實時繪製大型3D地圖技術

Ai




教機械人繪製大型環境地圖的新方法

麻省理工學院(MIT)開發出一種新技術,有助於搜索救援機械人在不可預測的環境中,快速生成準確的周邊地圖,提升導航能力。

當一部機械人要在部分坍塌的礦井中搜尋受困工人時,它必須迅速繪製出現場的地圖,並同時判斷自己在地圖中的位置,才能安全地穿越險峻地形。

近年來,研究人員嘗試利用機械人裝載的攝影機影像,透過強大的機器學習模型來完成這項複雜任務,但即使是最先進的模型,也只能一次處理少量影像。在災難現場,每一秒都非常寶貴,機械人需要迅速覆蓋大面積區域,處理成千上萬的影像才能完成任務。

為了突破這個限制,MIT的研究團隊結合最新的人工智能視覺模型與經典的電腦視覺技術,研發出一套能處理任意數量影像的新系統。這套系統能在短短數秒內,精確地生成如擁擠辦公走廊這類複雜場景的3D地圖。

這個人工智能驅動系統會逐步建立並對齊多個較小的子地圖,然後將它們拼接起來,重建出完整的三維場景,同時實時估算機械人的位置。

與其他方法不同,這套技術不需要預先校準的攝影機,亦無需專家調校複雜的系統設定。它結構簡單,但能快速且高質量地完成3D重建,有利於在真實場景中大規模應用。

除了協助救援機械人導航外,這種方法還可用於擴增實境(AR)或虛擬實境(VR)頭戴裝置,提升穿戴式設備的空間感知;亦能幫助工業機械人在倉庫內快速定位與搬運貨物。

「為了讓機械人完成越來越複雜的任務,我們需要更複雜的世界地圖,但同時也不想增加實作的難度。我們展示了如何用一個開箱即用的工具,在幾秒鐘內生成準確的3D重建。」MIT研究生、多米尼克·馬吉奧(Dominic Maggio)說。

馬吉奧與博士後林亨泰(Hyungtae Lim)及資深作者盧卡·卡隆(Luca Carlone)合作完成這項研究。卡隆是MIT航空航天系副教授,也是信息與決策系統實驗室(LIDS)及SPARK實驗室的負責人。該研究成果將在神經信息處理系統會議(NeurIPS)發表。

繪製地圖的挑戰與解決方案

機械人導航中一項核心技術是「同步定位與地圖構建」(SLAM),即機械人一邊探索環境,一邊建立地圖並定位自身。

傳統優化方法在複雜環境下容易失效,且需事先校準攝影機。為避免這些問題,研究人員訓練機器學習模型從數據中學習此任務。

雖然實作較簡單,但目前最優秀的模型一次只能處理約60張影像,對於需要快速穿越多變環境、處理成千影像的任務來說,仍不切實際。

MIT團隊設計出一套系統,先生成場景的多個較小子地圖,再將它們「粘合」成完整的3D重建。模型本身仍是一次處理少量影像,但透過拼接子地圖,能更快重建大範圍場景。

「這看似簡單的解決方案,起初我試過後卻發現效果不理想。」馬吉奧說。

深入研究1980至1990年代的經典電腦視覺文獻後,他發現機器學習模型處理影像時產生的誤差,使子地圖對齊變得更複雜。

傳統方法對齊子地圖時,只需旋轉和平移讓它們對齊。但新模型產生的子地圖可能會有彎曲或拉伸等變形,單純旋轉和平移無法對齊。

「我們必須確保所有子地圖的變形是一致的,才能準確對齊。」卡隆解釋。

更靈活的數學方法

研究團隊借鑒經典電腦視覺的數學方法,開發出一種能表達子地圖所有變形的靈活技術。透過對每個子地圖施加特定數學變換,系統能有效解決對齊歧義。

系統根據輸入影像輸出場景的3D重建,並估算攝影機位置,讓機械人能即時定位。

「當多米尼克想到將學習方法與傳統優化技術結合,實作就順利多了。」卡隆說,「這種簡單又高效的解決方案,未來有很多潛在應用。」

該系統的運算速度快,重建誤差低,且無需特殊攝影機或輔助工具。研究團隊用手機拍攝短片,即時生成MIT教堂內部等複雜場景的3D地圖,平均誤差低於5厘米。

未來他們計劃提升系統在極複雜場景的穩定性,並嘗試在真實機械人上應用。

「了解傳統幾何學非常重要。深入理解模型運作,才能取得更佳成果,並推動技術規模化。」卡隆強調。

這項研究部分由美國國家科學基金會、海軍研究辦公室及韓國國家研究基金會支持。卡隆目前為Amazon學者,該成果於加入Amazon前完成。

編輯評論:

MIT這項突破性的研究,成功結合了現代機器學習與經典電腦視覺技術,解決了機械人在大範圍環境中即時定位與地圖構建的難題。其核心創新在於將大環境拆分成多個小子地圖,並以更靈活的數學工具對齊拼接,克服了傳統方法無法處理的形變問題。

這種「分而治之」的策略不僅提升了處理速度,更大幅降低對硬件的依賴,讓技術更容易商業化與實地應用。尤其是在救援、工業自動化和擴增實境等領域,都有巨大潛力。

未來若能結合更多感測器數據(如雷達、深度攝影機)及強化機械人自主決策能力,將進一步提升系統的魯棒性與實用性。這也啟示我們,人工智能的發展不應孤立於數據驅動的深度學習,傳統數學和物理知識依然是不可或缺的基石。

整體而言,這項研究是人工智能融合經典理論的典範,提醒業界在追求新技術時,勿忘回顧與融合過去的智慧,才能設計出既高效又穩健的系統。這對香港乃至全球的智能機械人發展,都有重要啟示和借鑒價值。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
Edit this photo without changing her face 100% to reveal a young woman with an oval face and ideal body, not skinny.

She wears a outfit attached.

She has clear white skin with a natural blush on her cheeks.
Her skin looks healthy and glowing.
She has light grey eyes with a cat-eye style, curly and defined eyelashes (wispy/manga lashes), and neat natural eyebrows.
Focus on a natural blush to create a subtle rosy look.
Soft pink and peachy ​​lip gloss applied in the center of her lips (with a slight gradient), giving the impression of healthy, plump lips.

She wore a channel earcuff, gold watch and channel rings. She has coffin shape menicure in white gradien color.

Her shiny, ash brown with pink highlight, waist-length hair, loose curls styled with curtains bangs giving a Korean-style aesthetic.
Her head is tilted slightly to the side (head tilt), creating a chic and elegant look.

This photo exudes a feminine and sensual yet calm aura. The skin tone and outfit make the subject stand out.
The background is slightly blurred (out of focus), as if she were in her white interior car taking a selfie.
Calm and elegant pose. Staring intenstly at the camera 人物:人物姿態表情動作衣著都不變,色調:富士底片日系風格,暖色調,日系輕透感,光影:維持照片中的光影邏輯,輕灑在少女身上,像是日系風格清爽,必須符合原本照片中的光影邏輯,背景:一片海洋與藍天,天空天氣非常晴朗,海與藍天在畫面中維持一半的比例,海的顏色是鮮紅色的海,海非常鮮紅、一片平靜的死海,海上有陽光帶來的一點光班,場景:少女坐在海堤防邊,面對著畫面,而少女的後方是一片遙遙無極的海與藍天,完美的呈現一半的比例,在一個清晨的光線中,陽光並沒有太刺眼,陽光像是輕灑在少女身上還有紅色的海面上,透視關係:構圖不改變,維持原本照片的構圖,平面構圖 ใช้ใบหน้าจากภาพอ้างอิงผู้หญิงเป็นหลักเท่านั้น (female reference image only)
คงโครงหน้า ดวงตา จมูก ปาก สัดส่วนใบหน้าเหมือนต้นฉบับ 100% ห้ามเปลี่ยน
ไม่สร้างใบหน้าใหม่ ไม่ผสมใบหน้า ไม่ดัดแปลงใบหน้า

ภาพถ่ายเสมือนจริงคุณภาพสูงของหญิงสาววัยผู้ใหญ่ รูปร่างเพรียวสวย หุ่นดี ขาเรียวยาว สะโพกได้รูป ผิวขาวใสเนียนเป็นธรรมชาติ ดูสุขภาพดี

ฉาก:
ชายหาดทะเลช่วงเย็น
พื้นทรายสีอ่อนละเอียด
ทะเลสีฟ้าอมเทา คลื่นเล็ก ๆ ซัดเบา ๆ
ท้องฟ้าสีฟ้าอ่อนอมพีช มีเมฆบางกระจาย
แนวต้นไม้และชายฝั่งอยู่ด้านซ้าย
มีเกาะเล็ก ๆ อยู่ไกลลิบที่ขอบฟ้า
บรรยากาศสงบ อบอุ่น ชิลแบบวันพักผ่อน

ท่าโพส:
ยืนหันหลังให้กล้อง
ลำตัวตั้งตรง ผ่อนคลาย
ศีรษะหันเฉียงเล็กน้อย มองไปทางทะเล
มือทั้งสองข้างวางแตะบริเวณสะโพกด้านหลังอย่างเป็นธรรมชาติ
ขาทั้งสองข้างเหยียดตรง น้ำหนักลงขาข้างหนึ่ง
ท่าทางดูเผลอ ๆ ไม่ตั้งใจโพส
ถ่ายเต็มตัว ระยะกลางถึงไกล
ตัวแบบอยู่กึ่งกลางเฟรม

ชุด:
บิกินี่สีเขียวเข้ม
ท่อนบนผูกคอและผูกหลัง
ท่อนล่างทรงผูกเชือกด้านข้าง
ผ้าเรียบ ไม่มีลวดลาย

พร็อป:
หมวกแก๊ปสีเขียว โทนเดียวกับบิกินี่
รองเท้าแตะสีอ่อน
ไม่มีพร็อปในมือ
ใช้ชายหาด ทะเล และท้องฟ้าเป็นองค์ประกอบหลัก

ทรงผม:
ผมยาวถึงกลางหลังสีน้ำตาลประกายแดง
รวบผมต่ำด้านหลัง ลอนสวยเงางาม
มีปอยผมหลุดเล็กน้อย ดูเป็นธรรมชาติ
ไม่จัดทรงแข็ง

เครื่องประดับ:
เครื่องประดับชิ้นเล็ก เรียบ
เช่น สร้อยคอเส้นบาง หรือกำไลข้อมือเล็ก ๆ
ไม่เด่นเกินไป

แต่งหน้า:
แต่งหน้าสไตล์เกาหลีใส ๆ น่ารัก
ผิวฉ่ำโกลว์บางเบา
แก้มชมพูอ่อนธรรมชาติ
คิ้วฟุ้ง
ริมฝีปากสีชมพูใส

กล้อง:
กล้องโปร DSLR
เลนส์มุมกว้างเล็กน้อย
แสงธรรมชาติช่วงเย็น
แสงนุ่ม เงาไม่แข็ง
โฟกัสคมชัด รายละเอียดสูง

สไตล์ภาพ:
ภาพแฟชั่นริมทะเล
โทนสีอบอุ่น ละมุน
ภาพเสมือนจริง ultra realistic
คุณภาพสูงระดับ 4K
อัตราส่วนภาพแนวตั้ง 9:16