🎬 YouTube Premium 家庭 Plan成員一位 只需
HK$148/年!
不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放
麻省理工學院研究員利用人工智能與機械人技術「口述即成物」
麻省理工學院(MIT)的研究團隊開發出一套「語音轉實物」系統,結合3D生成式人工智能與機械人組裝技術,能夠根據口頭指令即時製造出各種物件,例如家具,最快只需五分鐘。
這套系統由安裝在桌面上的機械臂負責接收人類的語音指令,例如「我要一張簡單的凳子」,然後便會從模組化零件中組裝出對應的實體物件。迄今為止,該系統已成功製作出凳子、架子、椅子、小桌子,甚至是裝飾品如狗形雕像等。
麻省理工學院建築系與電腦科學系研究生Alexander Htet Kyaw表示:「我們將自然語言處理、3D生成式AI與機械人組裝技術結合,這些都是快速發展的研究領域,但此前還未有系統能夠僅憑簡單的語音指令就直接製作出實物。」
Kyaw在修讀Neil Gershenfeld教授的「幾乎什麼都能做」課程時,開始構思並打造了這套語音轉實物系統。後來他在麻省理工學院的Bits and Atoms中心(CBA)進一步與機械工程系的Se Hwan Jeon以及CBA的Miana Smith合作,持續完善這項技術。
系統運作流程先由語音識別將使用者口述的需求轉為文字,接著利用大型語言模型理解指令,再透過3D生成式AI創造出物件的數碼網格模型,並用體素化演算法將模型分解成可組裝的模組單元。
隨後,系統會進行幾何處理,調整組件以符合實際製造和物理限制,例如組件數量、懸空結構和連接方式,然後設計出可行的組裝順序與機械臂的自動路徑規劃,最終由機械臂執行組裝,完成實體物件。
這套系統讓沒有3D建模或機械人程式設計背景的人,也能輕鬆透過自然語言參與設計與製造。與3D打印動輒需數小時甚至數天的製作時間不同,這套系統能在幾分鐘內完成組裝。
Kyaw說:「這個項目是人類、人工智能和機械人共創世界的介面。想像一下,你說『我要一張椅子』,五分鐘後椅子便真實地出現在你眼前。」
團隊計劃改良家具的承重能力,將組件間的磁鐵連接改成更堅固的結構。同時,Smith表示他們也在開發將體素結構轉換成適合小型分散式移動機械人的組裝流程,未來有望實現任意規模的結構建造。
使用模組化組件的設計,能大幅減少製造實物的浪費,因為物件可以拆解再重新組合,例如將沙發拆開,改裝成床鋪,實現多功能且環保的家具使用方式。
Kyaw同時具備利用手勢識別和擴增實境與機械人互動的經驗,目前正致力將語音控制與手勢控制整合到語音轉實物系統中。
他憶述靈感來自《星際迷航》中的複製機和動畫電影《超能陸戰隊》中的機械人,希望讓大家能夠快速、方便又環保地製造實體物品,實現「物質隨需生成」的未來。
該團隊的研究論文《Speech to Reality: On-Demand Production using Natural Language, 3D Generative AI, and Discrete Robotic Assembly》已於2025年11月21日在MIT舉辦的計算製造協會(ACM Symposium on Computational Fabrication)發表。
—
評論與啟示
這項由MIT領導的研究突破了人機互動、人工智能與機械人製造的界限,將「語音指令即時製造實物」從科幻變成現實。它不但大幅降低了設計與製造的門檻,讓非專業人士也能輕鬆「說出」想要的物件,同時透過模組化組件和快速組裝,實現了比傳統3D打印更高效的生產方式。
香港作為一個空間有限、資源緊張的城市,這種按需製造的技術尤其有意義。不論是家具、裝飾品甚至是臨時結構,都可以利用語音快速打造,減少存貨和浪費,提升生活便利與環保效益。
然而,現階段系統仍主要限於簡單家具和裝飾品,承重和耐用度仍待加強,未來如何擴展至更複雜或功能多元的產品是挑戰之一。此外,模組化設計雖帶來靈活性,卻可能限制設計的細膩度與美感,如何平衡效率與美學是下一步的研究方向。
最令人期待的是,Kyaw提及結合手勢與語音的多模態控制,將使人機互動更自然直覺,甚至可能催生「即時定制製造」的新型零售和家居體驗。這不僅改變製造業,也可能重塑我們對物件擁有和使用的觀念──物質不再是固定不變,而是隨需變形重組的「活」資源。
面對全球資源有限及環境壓力,這類技術推動的可持續製造模式,對香港和世界都有深遠意義。未來若能結合本地製造業和智慧城市發展,或許我們每個人都能成為自己生活環境的即時設計師和製造者,實現真正的「說到做到」,迎接物質世界的革新。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。