輕量AI模型勁過GPT-4?RARE框架解鎖領域知識推理!

Ai




RARE(檢索增強推理建模):一個可擴展的AI框架,專為輕量級語言模型的領域特定推理設計

大型語言模型(LLMs)在多種任務中展現了強大的通用性能,包括數學推理和自動化。然而,在需要專業知識和細緻推理的領域特定應用中,它們的表現卻不盡如人意。這些挑戰主要源於在有限的參數預算內準確表示長尾領域知識的困難,導致模型出現幻想現象,且缺乏領域特定的推理能力。傳統的領域適應方法,如微調或持續預訓練,往往導致無法追蹤的知識和增加的訓練成本。雖然RAG方法對於補充知識有所幫助,但通常無法有效教導模型如何運用這些信息進行推理。研究的一個關鍵挑戰是如何將領域知識的學習與推理分開,使模型能在有限資源下優先發展認知技能。

從教育理論,特別是布魯姆的分類法中可以看出,建立高級推理技能需要的不僅僅是知識的記憶。分析、評估和綜合等高階認知能力,往往在模型被迫記憶大量領域事實時受到阻礙。這一觀察引發了問題:推理能力是否可以獨立於大規模知識的內化而增強。在實踐中,許多現有方法過於專注於將知識存儲在模型參數中,這使得更新變得複雜,並增加了過時或錯誤輸出的風險。即使是基於檢索的技術也將檢索到的文件視為輸入,而非學習推理過程的工具。未來的領域特定智能可能依賴於減少對內部記憶的依賴,而是使用外部知識來源作為推理技能發展的支架,使較小的模型能更有效地解決複雜任務。

來自北京大學、上海交通大學、東北大學、南開大學、高級算法研究所(上海)、OriginHub技術公司、MemTensor和上海人工智能實驗室的研究人員提出了一種名為檢索增強推理建模(RARE)的新範式。RARE受到布魯姆分類法的啟發,通過使用外部數據庫來存儲領域知識,將知識存儲與推理分開,並訓練模型專注於上下文推理。這使得模型能夠跳過記憶密集的事實學習,而優先發展認知技能。實驗顯示,經過RARE訓練的輕量模型在基準測試中超越了像GPT-4這樣的較大模型,提供了一種可擴展且高效的領域特定智能方法。

這一框架將重點從記憶領域知識轉向發展推理技能。通過將檢索到的外部知識與逐步推理相結合,模型根據理解和應用而非回憶生成回應。該框架將回應建模為一系列知識和推理代幣,優化檢索信息和上下文推理的整合。利用專家模型進行知識蒸餾,構建高質量的訓練數據,並採用自適應精煉來提高準確性。基於上下文學習等認知理論,這一方法使輕量模型通過微調和以推理為中心的訓練實現強大的領域特定性能。

研究評估了RARE框架的有效性,使用了五個需要多步推理的醫療QA數據集。輕量模型如Llama-3.1-8B、Qwen-2.5-7B和Mistral-7B與CoT、SFT和RAG基線進行了測試。結果顯示,RARE在所有任務中穩定超越這些基線,在醫學診斷和科學推理方面取得了顯著增長。與DeepSeek-R1-Distill-Llama-8B和GPT-4相比,RARE訓練的模型在某些任務上準確率提高了超過20%。這些發現強調了通過結構化的上下文學習來訓練模型進行領域特定推理,遠比僅僅增加模型大小或單靠檢索更為有效。

結論,該研究提出了RARE,一個通過將知識存儲與推理發展分開來增強LLMs領域特定推理的新框架。RARE借鑒布魯姆的分類法,在推理過程中檢索外部知識並將其整合到訓練提示中,鼓勵上下文推理。這一轉變使得輕量模型能在醫療任務中超越像GPT-4這樣的較大模型,準確率提高了20%。RARE通過將可維護的知識庫與高效的推理專注模型相結合,促進了領域特定智能的可擴展方法。未來的研究將探索強化學習、數據策劃以及在多模態和開放領域任務中的應用。

在這篇文章中,我們看到RARE框架的出現不僅是對現有技術的一次革新,更是對AI推理方式的一次深刻反思。傳統的知識內化方法已經顯示出其局限性,而RARE的成功將可能改變我們對AI學習和推理的理解。未來,隨著這種新方法的廣泛應用,我們或許能夠看到更具靈活性和適應性的AI系統,這將在許多專業領域中發揮關鍵作用。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
Ultra-detailed cinematic portrait of a futuristic armored man in side profile, human face seamlessly fused with exposed mechanical components, intricate cybernetic implants embedded into the skull and jaw, visible wires, micro-circuits, pistons and servo motors, red and gold metallic armor plating partially broken revealing internal machinery, realistic skin texture with stubble and sharp facial features, intense focused expression, hyper-realistic photorealism, sci-fi concept art, mechanical complexity, clean white background with technical sketch lines and blueprint elements, dramatic lighting, sharp focus, 8K resolution, ultra-high detail, cinematic depth, concept art style, futuristic technology, realism + illustration blend Generate an ultra-realistic, highly ultra-detailed, 8k resolution with 1080x1080 pixel portrait of me using the uploaded image for reference (preserved the likeness and the original face for reference) of a striking, high-resolution portrait of a young woman with long, flowing wavy brunette hair, seated gracefully on a simple black wooden chair in a dimly lit studio. She wears an oversized, off-white knitted sweater that drapes loosely over her frame, slipping off one shoulder to reveal smooth skin and add a subtle touch of sensuality. Her pose is elegant and contemplative: one arm rests gently on the chair’s backrest while her hand delicately supports her chin, and her gaze is directed thoughtfully toward the side, creating an intimate and introspective mood. The lighting is expertly crafted with a single soft, directional light source positioned to the side, casting gentle shadows that sculpt her form and highlight the texture of the knitwear and the natural contours of her legs and arms. This chiaroscuro effect enhances the depth and dimensionality of the image, emphasizing the softness of her skin and the intricate weave of the sweater. The background is a smooth, muted dark gray, providing a minimalist and distraction-free backdrop that contrasts beautifully with her light-colored apparel and warm skin tones. *** The composition is a full-body vertical frame that captures the model’s seated posture with perfect balance, positioning her slightly off-center to create visual interest and harmony. The overall color palette is subdued and warm, featuring neutral tones that evoke a sense of calm and understated elegance. The image is impeccably sharp, showcasing fine details such as the delicate waves of her hair, the subtle folds in the fabric, and the natural texture of her skin. The style is classic and timeless, blending modern minimalism with emotive portraiture to convey quiet strength, beauty, and introspection. ภาพถ่ายสมจริงของผู้หญิง Create a very realistic, cinematic image of a woman, with 100% of her original facial features maintained from the provided image. Do not alter the face, focusing on realistic details of the facial structure, eyes, eyebrows, nose, mouth, and expression.
Makeup: sharp Asian-style eyebrows, sharp Cat Eye eyeliner, and gradient red lipstick
​Her lips are parted slightly, revealing a hint of teeth, and are coated in a glossy, natural-toned red lipstick that catches the light, giving them a luscious appearance. The subtle lines and contours of her philtrum and cupid's bow are visible. with the subtle texture of skin visible. Wears a necklace with the text Kunika and other small matching accessories, such as earrings or a wrist bracelet.
ชุด :
ท่อนบน : รูปทรงมีโครงดันทรง (Underwire) เพื่อให้หน้าอกดูสวยและได้รูปทรงคล้ายเปลือกหอยอย่างชัดเจน ตัวบราควรมีรายละเอียดการเย็บหรือการจับจีบที่ทำให้เกิดรูปทรงโค้งมนคล้ายเปลือกหอย (Scalloped Edges)
สายบราJeweled Straps: ใช้สายบราที่ประดับด้วยคริสตัลสีม่วงอ่อนเพิ่มความหรูหราและระยิบระยับสีม่วงพลัม (Plum Purple) เนื้อผ้า : ใช้ผ้าที่มีประกายมุก (Iridescent) หรือผ้าที่มีกลิตเตอร์/ฟอยล์ละเอียด (Foil Fabric) เพื่อให้ดูมันวาวเมื่อโดนแสงอาทิตย์/น้ำ
ท่อนล่าง
กางเกงบิกินี่ : เน้นทรง High-Cut (เว้าสูง) ที่ทำให้ช่วงขาดูยาวและเอวดูเล็กลง ส่วนขอบด้านหน้าตัดเป็นรูปตัว V (V-Cut) เพื่อเน้นความเซ็กซี่สูงสุด และส่วนด้านหลังแบบCheeky ดีไซน์Lace-Up Sides:ใช้เชือกร้อยไขว้ ด้านข้างสะโพก (Lace-Up) ด้วยสายสีเขียวเข้มเพื่อเพิ่มความเย้ายวนและดูซับซ้อนสีสีเขียวมรกต (Deep Emerald Green): ใช้สีเขียวที่เข้มและลึก เนื้อผ้าScale Texture:
เครื่องประดับเข้าชุด
องค์ประกอบรายละเอียดเครื่องประดับหลัก : โซ่ไขว้บริเวณหน้าท้อง (Belly Chain) ที่มีจี้รูปเปลือกหอย หรือหอยมุกตรงกลาง เน้นการใช้สีเงิน ต่างหูยาวระย้าที่ทำจากริสตัล สีเขียวน้ำทะเล ทรงผม Wet Look + Flower: เน้นทรงผมที่ดูเปียกชื้น (Wet Look) หรือลอนคลื่นแบบยุ่งๆ (Beachy Waves) ประดับด้วย ดอกไม้สีแดง ขนาดใหญ่ที่ด้านใดด้านหนึ่งของศีรษะ
-ฉากหลังชายหาดที่มีโขดหินธรรมชาติ
• น้ำทะเลสีเขียวมรกต/เทอร์ควอยซ์ เฉดสี มีฟองคลื่นสีขาวซัดเข้าฝั่งกระทบขาเบาๆหาดทรายสีน้ำตาลทองละเอียดฉากหลังไกลๆ เป็นหน้าผาหินและโขดหินเรียงราย
แสงเแดดสาดเข้าตัวแบบทำให้ผิวขาวดูสว่างอมชมพู
-ท่าทาง นั่งชันเข่าอยู่บนโขดหินก้อนใหญ่บนหาดทราย มือข้างหนึ่งถือเปลือกหอยอันใหญ่ไว้ข้างหูเหมือนฟังเสียงคลื่นจากเปลือกหอย สีหน้าอ่อนโยน แววตาเซกซี่เย้ายวน ยิ้มสดใส