AI推理新技術Reasoner,突破企業應用局限!

Ai

獨家報導:Reasoner,來自Crashlytics聯合創始人的初創公司,聲稱在使人工智能足夠可靠以應用於企業方面取得突破

連續創業家韋恩·張(Wayne Chang)推出了一款名為Reasoner的人工智能推理引擎,他聲稱這款引擎能夠提供比OpenAI的o1系列等大型語言模型更準確且可解釋的結果,且成本更低。

人工智能行業正在全力以赴地將推理能力融入技術中,部分是為了接近人類水平或超人類的人工智能聖杯,部分則是為了克服當前大型語言模型(LLMs)所面臨的不準確性。生成式人工智能所謂的“幻覺”是阻礙企業部署的一大因素,此外,無法解釋LLM如何得出結論也成為一大障礙。

Reasoner旨在通過使用神經符號人工智能來解決這些問題,這是一種將神經網絡(即支撐生成式人工智能的技術)與基於固定規則、邏輯和人類衍生的事物關係映射的傳統符號人工智能相結合的技術。

張在科技界有著悠久的歷史,2004年創辦了i2hub文件分享服務。2011年,他共同創辦了Crashlytics,這是一款無處不在的移動崩潰報告工具,後來被Twitter收購,他成為消費產品策略總監(Google在2017年收購了Crashlytics)。他隨後共同創辦了AI驅動的會計公司Digits,並於去年創立了Patented.ai——一個專注於知識產權的人工智能工具,現在看來,這也是Reasoner引擎的試點實施。

高風險的人工智能

Patented.ai提供自動搜索專利文檔和源代碼的能力,能夠識別潛在的專利侵權案件並識別可能的專利創新。考慮到專利案件的高財務風險以及判斷是否發生侵權的繁瑣性,任何能夠自動化此過程的人都將面臨明顯的機會,但如果系統出錯,則風險巨大。

在接受《財富》雜誌的獨家訪問時,張表示,Patented.ai早期僅依賴LLMs的嘗試並未成功——使用該系統的律師立即發現了其結果的缺陷並拒絕了它。公司還嘗試了其他常見技術,如檢索增強生成(RAG),這種技術利用外部數據源來增強LLM的輸出(Google在其AI搜索結果中使用RAG),但這同樣未能提供所需的可靠性。

這促使他們改變策略,最終開發出Reasoner。張表示:“我們最初並不打算建立一個推理引擎,這根本不是我們的使命。”

Reasoner確實使用LLMs來幫助解釋文本中的語言——張表示它對使用哪種模型持中立態度——但Reasoner的核心概念是自適應動態知識圖。

知識圖在科技界被廣泛使用。十多年來,Facebook的知識圖為建立人際關係提供了框架,而Google的知識圖則使搜索能夠回答基本的事實問題。這些已建立知識的儲存庫顯然對於提供正確的查詢回應非常有用——IBM贏得《危險邊緣》節目的Watson AI就是基於知識圖構建的,但它們通常需要手動更新以添加新事實或編輯已變更的關係。知識圖越複雜,所需的工作就越多。

張聲稱Reasoner消除了手動更新的需求,提供了基於輸入的非結構化文本自動構建準確知識圖的能力,並且這些知識圖能夠在信息添加或更改時自動重新配置。值得注意的是,微軟今年早些時候推出了GraphRAG,試圖利用LLM生成的知識圖來改善RAG結果。

換句話說,您可以將一堆法律文件放入Reasoner中,然後它將解釋這些文件以建立包含文件中的概念及其之間關係的知識圖——並提供“完整可追溯性”,因此人類可以輕鬆檢查這些事實是否準確反映了文件中的內容。這一概念的應用範圍遠超專利訴訟。

在向《財富》雜誌的演示中,張展示了Reasoner如何吸收數十份OpenAI的各類法律文件(從用戶和開發者協議到品牌指導和Cookie通知),並映射它們之間的相互依賴關係。在演示中,這使得能夠對用戶如何利用OpenAI的美國和歐洲服務條款之間的差異以“避免對有害AI輸出負責”提供簡潔且詳細的答案。推理過程中的每一步都得到了說明,邏輯步驟即使對非技術人員來說也能理解,Reasoner隨後還建議了關於問題影響及如何減輕影響的後續問題。

張表示,Reasoner還可以應用於藥品、先進材料、安全和情報等多個領域。因此,他聲稱它可以超越各種其他AI初創公司的產品,如Hebbia(一家文件搜索公司,於7月籌集了1.3億美元的B輪融資)和Sakana(一家獲得Nvidia支持的科學發現公司,在9月的A輪融資中籌集了2.14億美元)。

推理的成本

但就推理能力而言,目前的“大玩家”是OpenAI及其o1系列模型,這些模型對問題的處理方式截然不同。o1模型並未偏離純LLM的範疇,而是使用“思維鏈”推理結合搜索,循序漸進地通過一系列步驟來提供比OpenAI的GPT模型更深思熟慮的答案。

o1模型通常提供比其前身更準確的答案,但張聲稱Reasoner的輸出更加準確。目前市場上並沒有很多推理基準——Reasoner可能會在明年初發布自己的基準——但根據DocBench和Google最近發布的Frames基準數據集,張表示Reasoner的準確率超過90%,而o1則未能突破80%。這一結果在發佈時無法獨立驗證。

他還表示,Reasoner的這種方法使得成本大幅降低。OpenAI對每百萬個令牌(AI數據的基本單位,約等於1.5個單詞)的輸入收取15美元,對每百萬個輸出令牌收取60美元,而Reasoner每百萬個輸入令牌僅需8美分,輸出令牌則僅需30美分。“我們尚未最終確定如何定價,”張表示,並補充說Reasoner的“結構性成本優勢”將使其能夠按結果或按驗證的發現向用戶收費。

張的聲明無疑是雄心勃勃的,但Reasoner的團隊規模較小——目前約有十名員工,大多在美國。到目前為止,公司僅完成了450萬美元的前種子輪融資,該輪融資於去年進行,投資者包括Baseline Ventures創始人Steve Anderson、Y Combinator MD Ali Rowghani和Operator Collective創始人兼CEO Mallun Yen。“我在歷史上有幾次成功,所以我對資金並不太擔心,”張說。但這位企業家預計很快將招聘更多員工,因為Reasoner正在擴展。

張表示,Reasoner在今年第三季度獲得了180萬美元的訂單,並將於2025年第一季度公開發布其基準和演示,讓人們能夠上傳自己的數據集並測試公司的聲明。該公司還將發布一個軟件開發工具包,以便其他人將Reasoner引擎嵌入到他們的應用程序和AI代理中。(張表示,該引擎足夠輕便,可以在最新的iPhone和Android設備上運行,而無需連接互聯網。)

“我們希望以一種能夠立即開始建立信任和可信度的方式發布它,”張表示。

這篇文章於12月4日更新,澄清Google僅在2017年收購了Crashlytics。

這篇報導展示了Reasoner的潛力,尤其是在當今人工智能領域面臨的挑戰下,提供了改進推理的方案。張所提出的自適應動態知識圖的概念,不僅能夠提高企業對信息的準確理解,還能在法律、醫療等多個領域中發揮重要作用。這不僅是對現有技術的挑戰,也是對未來人工智能發展方向的一次探索。隨著越來越多的企業尋求提高AI的可靠性,Reasoner的出現或許能夠引領一場新的技術革命。但同時,我們也應保持警惕,對於人工智能在各個領域的應用,特別是涉及法律和道德問題的領域,必須進行全面的評估與監管。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Chat Icon