Anthropic 推出新功能 提升 AI 輸出準確度

Ai

Anthropic 將利用思維鏈推理改善提示

Anthropic 最近在其 Anthropic Console 上推出了一項新功能,讓開發者能夠改善提示,以提高輸出的質量。

“提示改進工具允許開發者利用現有的提示,並通過進階的提示工程技術,自動進行精煉,”Anthropic 在公告中表示。

更重要的是,這標誌著 Anthropic 進軍推理領域。Anthropic 提到,提示改進工具使用思維鏈推理來檢測問題並改進提示。這個工具將系統性地分解步驟,以便在回應之前進行“思考”。

此外,該工具還會檢查語法錯誤,並填充必要的信息,以提高輸出的準確性。

Anthropic 還透露,輸出準確性有了顯著提升。他們表示:“我們的測試顯示,提示改進工具在多標籤分類測試中提高了 30% 的準確性,並在摘要任務中將字數遵守率提高到 100%。”

這項測試涉及將隨機選取的句子映射到父文章,從 500 個來自維基百科的樣本中選取。

另一項測試則評估 Claude 在總結十篇維基百科文章時,能否準確遵守字數限制。在後者的測試中,Claude 獲得了 100% 的準確率。

Anthropic 還允許開發者添加輸入輸出示例,然後將其轉換為“標準化”的 XML 格式,以幫助模型以最佳清晰度處理這些示例。

如果開發者無法創建示例,Claude 也會生成合成示例來模擬它們。“Claude 可以自動創建合成示例輸入和草擬輸出,幫助您簡化這個過程,”Anthropic 說道。

此外,Anthropic 還推出了一個“提示評估器”,允許開發者在五分制上對提示進行基準測試和評分。Anthropic 也讓開發者提供反饋,以進一步改善結果。

有趣的是,Anthropic 已經與其客戶 Kapa.ai 測試了這項功能。“Anthropic 的提示改進工具簡化了我們向 Claude 3.5 Sonnet 的遷移,使我們能更快進入生產階段,”Kapa.ai 的聯合創始人 Finn Bauer 在 Anthropic 的公告中表示。

幾天前,Anthropic 的 CEO Dario Amodei 揭示了 Claude 3.5 Opus 的計劃。我們好奇今天的公告是否暗示著將推理能力整合到旗艦 Claude 模型中。

這項新功能無疑是對 AI 開發者的一大福音,因為它不僅提高了輸出的準確性,還使得開發過程更加高效。特別是思維鏈推理的引入,顯示出 Anthropic 在推理能力上的進一步探索,這對於希望在 AI 領域內實現更高級別互動的開發者來說,無疑是一項重要的工具。隨著 AI 技術的不斷進步,未來的應用場景將更為廣泛,開發者們需要密切關注這些新功能的實際效果及其對整體項目的影響。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *