六合彩AI預測賽後檢討!邊個模型預測最叻? 每次攪珠當晚10:30更新免費睇!

AI寫Code更準確!MIT新招搞掂編程語言,勁!

Ai

✈️ Trip.com「內地快閃」機票+酒店半價

【每週二 10 AM】 立即領取 半價優惠代碼
最高減 HK$500,CP 值極高,先到先得!


立即搶優惠 🔗

使AI生成的代碼在任何語言中更準確

一種新的技術自動引導大型語言模型(LLM)生成符合所使用的編程語言或其他格式規則的輸出。

程式設計師現在可以利用大型語言模型(LLMs)更快速地生成電腦代碼。然而,這只有在代碼遵循編程語言的規則並且不會導致計算機崩潰的情況下,才能真正方便程序員。

雖然已有一些方法確保LLMs遵循所生成文本的語言規則,但這些方法通常會扭曲模型原本的意圖,或對於複雜任務來說過於耗時。

麻省理工學院及其他機構的研究人員開發了一種新方法,自動引導LLM生成符合相關語言規則的文本,例如特定的編程語言,並且無錯誤。他們的方法使LLM能夠將精力集中在最有可能有效和準確的輸出上,同時在過程中早期剔除不具前景的輸出。這種概率方法提高了計算效率。

由於這些效率的提升,研究人員的架構使得小型LLM在多個實際用例中,包括分子生物學和機器人技術,表現超過了許多大型模型。

從長遠來看,這種新架構可能幫助非專業人士控制AI生成的內容。例如,它可以讓商業人士僅使用自然語言提示來撰寫複雜的SQL查詢,這是一種用於數據庫操作的語言。

“這項工作不僅對研究有影響,還可以改善編程助手、AI驅動的數據分析和科學發現工具,確保AI生成的輸出既有用又正確。”麻省理工學院研究生、該框架論文的共同首席作者喬昂·盧拉(João Loula)表示。

盧拉在論文中與其他共同首席作者本傑明·勒布倫(Benjamin LeBrun)、李杜(Li Du)共同合作,並與多位資深作者合作,包括麻省理工學院腦與認知科學系的首席研究科學家維卡什·曼辛卡(Vikash Mansinghka)及其他學者。這項研究將在國際學習表徵會議上展示。

強化結構與意義

控制LLMs生成的結構化文本的一種常見方法是檢查整個輸出,如一段電腦代碼,以確保其有效且無錯誤。如果不是,使用者必須重新開始,消耗計算資源。

另一方面,程序員可以在過程中停下來檢查輸出。雖然這可以確保代碼符合編程語言並且結構有效,但逐步修正代碼可能會使其偏離用戶原本的意圖,長期來看會影響準確性。

“強化結構比強化意義要容易得多。我們可以快速檢查某個東西是否符合正確的編程語言,但要檢查其意義則必須執行代碼。我們的工作也涉及處理這些不同類型的信息。”盧拉說。

研究人員的方法涉及對LLM進行知識工程,以引導其朝向最有前景的輸出。這些輸出更有可能遵循用戶定義的結構約束,並具備用戶意圖的意義。

“我們並不是試圖訓練LLM來做到這一點。相反,我們是將專家的知識與LLM的知識結合起來,這提供了一種與深度學習不同的擴展方式。”曼辛卡補充道。

他們使用一種稱為序列蒙特卡羅的方法,這使得來自LLM的並行生成彼此競爭。模型根據輸出的潛力動態分配資源到不同的計算線程。

每個輸出都被賦予一個權重,代表其結構有效性和語義準確性的可能性。在計算的每一步,模型專注於那些權重較高的輸出,並剔除其餘的。

在某種意義上,這就像LLM在每一步都有一位專家在旁指導,以確保它做出正確的選擇,同時保持專注於整體目標。用戶指定他們所需的結構和意義,以及如何檢查輸出,然後研究人員的架構引導LLM完成其餘工作。

“我們已經解決了困難的數學問題,因此,對於任何想要納入的約束,你都會得到正確的權重。最終,你會得到正確的答案。”盧拉說。

提升小型模型的能力

為了測試他們的方法,他們將該框架應用於LLMs,任務是生成四種類型的輸出:Python代碼、SQL數據庫查詢、分子結構和機器人行動計劃。

與現有方法相比,研究人員的方法在準確性上表現得更好,同時所需的計算量更少。

例如,在Python代碼生成中,研究人員的架構使得一個小型的開源模型超越了一個專門的、商業的封閉源模型,後者的規模是前者的兩倍多。

“我們非常興奮,能夠讓這些小型模型發揮超出其實力的表現。”盧拉說。

展望未來,研究人員希望利用他們的技術來控制生成文本的更大部分,而不是一次處理一小塊。他們還希望將他們的方法與學習結合起來,讓模型在控制輸出的同時學習變得更準確。

從長遠來看,這項目標可能對非技術用戶有更廣泛的應用。例如,它可以與自動數據建模系統相結合,並查詢生成的數據庫模型。

這種方法還可以使機器輔助的數據分析系統成為可能,用戶可以與準確建模數據意義和問題的軟件進行對話,曼辛卡補充道。

“語言學的一個基本問題是,如何將單詞、短語和句子的意義與現實世界的模型相結合,並考慮意義和參考中的不確定性和模糊性。LLMs通過預測可能的標記序列並未解決這個問題。我們的論文顯示,在狹窄的符號領域內,從單詞映射到基於意義的分佈在技術上是可能的。這是向認知科學、語言學和人工智能中更深層問題邁出的一小步,這些問題需要理解機器如何像我們一樣與世界交流。”奧唐奈爾(O’Donnell)說。

這項研究部分由加拿大CIFAR AI主席計劃、麻省理工學院智能探索計劃和會聚研究所資助和支持。

這項研究不僅展示了AI生成技術在編程領域的潛力,還可能改變非技術用戶與數據交互的方式。隨著技術的進步,未來的商業用戶或許可以輕鬆地使用自然語言與複雜的數據系統進行互動,這將大大降低技術門檻,讓更多人能夠利用AI的力量進行創新和發現。這不僅是技術的進步,也是對於人類如何與智能系統協作的一次深刻思考,未來我們是否能夠看到一個更為智能化的工作環境,這值得我們期待。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放

立即升級 🔗