Blue J用AI顛覆稅務研究只需15秒!

Ai




Blue J首席執行官Benjamin Alarie:從傳統AI到ChatGPT,如何顛覆法律科技市場

2022年冬天,當科技界正被OpenAI的ChatGPT突然爆發的能力吸引時,Benjamin Alarie面臨一個關鍵抉擇。他創立的法律科技公司Blue J,憑藉過去一代AI技術,已為數百家律師行提供預測模型,業務穩健卻遇到增長瓶頸。

作為多倫多大學的終身稅法教授,Alarie看見大型語言模型雖然初期錯誤頻出,但卻蘊含強大潛力,決定賭上一切:將公司幾近十年的心血推倒重來,全面轉向這種尚未成熟的技術。

這場賭注大獲成功。Blue J低調完成了一輪1.22億美元的D輪融資,估值超過3億美元,成為加拿大增長最快的法律科技公司之一,收入增長約12倍,每天吸引10至15個新客戶。

現在,Blue J服務超過3,500家機構,包括全球會計巨頭KPMG英國分部和多家財富500強公司。它正解決專業服務業人才短缺的痛點——美國五年前比現在少了34萬名會計師,且75%註冊會計師預計未來十年退休,企業亟需提升現有人才的生產力。

「以往稅務專家需花15小時手動研究的問題,現在用Blue J只需約15秒。」Alarie在接受VentureBeat獨家訪問時說,「這種將工時縮短成秒的價值主張,正推動我們迅速成長。」

院長傳記錯誤事件:促使轉型的關鍵時刻

Alarie清楚記得2023年1月,法學院院長到他辦公室拜年,Alarie用ChatGPT描述院長,AI自信地生成了傳記,部分正確,但也有完全錯誤的資訊。

「她說,‘這真令人擔憂,錯誤百出,背後有深遠影響。’」Alarie說。這次明顯失誤非但沒有阻止他,反而讓他更堅定轉型決心。

Blue J最初於2015年推出,採用監督式機器學習預測司法結果,技術先進但有致命缺陷:無法回答所有稅務研究問題。客戶喜歡用於特定問題,但不適用時就放棄,收入停滯於約200萬美元。

即使ChatGPT有名的「幻覺」問題,Alarie仍說服董事會轉型:「如果不轉,我們無法解決最大限制。大型語言模型是很有前途的方向。」他給團隊6個月時間推出可用產品。

從90秒回應到300萬查詢:Blue J如何控制AI幻覺

2023年8月,Blue J新產品面世,Alarie坦言「非常粗糙」,回應時間長達90秒,約一半答案有問題,淨推薦值(NPS)只有20。

但通過三大策略,Blue J將產品打磨成今日平台:秒級回應、每700次查詢中僅1次不滿意,NPS達80多。

第一,獨家大規模內容授權。Blue J與Tax Analysts的Tax Notes及阿姆斯特丹的全球稅務權威IBFD合作,整合超過220個司法管轄區的頂尖稅務資料。「我們是全球唯一同時擁有美國Tax Notes和IBFD全球稅務資訊的平台。」

第二,深厚的人類專家團隊。由曾任IRS企業稅務首席顧問的Susan Massey領導,專家團隊持續測試AI並優化表現。

第三,前所未有的反饋機制。2025年處理超過300萬次稅務查詢,每次查詢都反饋系統持續優化。用戶活躍率達75%至85%,遠高於傳統平台的15%至25%。

Blue J與OpenAI的緊密合作

Blue J與OpenAI保持罕見密切關係,獲得模型早期使用權。「我們與OpenAI合作密切,提供大量高質量反饋,幫助他們提升模型在複雜推理上的表現。」Alarie說。

Blue J設計了「生態有效」測試題,源自真實稅務專業問題,由專家團隊確定正確答案,助OpenAI改進模型。公司亦持續評估OpenAI、Anthropic、Google Gemini及開源模型,並不執著於單一供應商。

這有助Blue J應對商業挑戰:每席位約1500美元年費不限查詢,但需自行承擔計算成本風險。「我們承諾提供優質用戶體驗和固定價格的無限查詢,承擔很大風險。」

競爭令API價格下降,Blue J保守的使用預測準確,毛收入保留率超過99%,淨收入保留率達130%,在SaaS界屬頂尖水平。

挑戰巨頭:Blue J如何以75%周活躍度脫穎而出

Blue J面對Thomson Reuters、LexisNexis及Bloomberg等老牌出版商競爭,這些公司在2023及2024年相繼推出AI功能。然而Blue J用戶從2021年的200家增至3500多家,顯示強勁成長。

日常更新是關鍵。雖然稅法改變需國會通過,但IRS規例、新裁決及判例不斷變化,50州稅法也持續調整。

「幾乎每天都在變化。」Alarie說,「我們每日更新資料,這只是美國,我們還覆蓋加拿大、英國,目標是全球。」

Alarie不只想建立成功企業,作為《法律奇點》一書作者及Vector AI研究所學者,他多年來深入思考AI對法律的長遠影響。

他在2023及2024年Tax Notes發表論文,預言生成式AI將使客戶更成熟,推動專家轉向高價值策略角色,非單純例行研究。

Blue J的1.22億美元計劃:從稅務研究走向「全球稅務認知」

最新D輪融資令累計資金超1.33億美元,將推動Blue J積極擴展地域及產品。公司已覆蓋美國、加拿大、英國,計劃透過IBFD合作涵蓋220多司法區。

未來功能可能包括自動撰寫備忘錄、稅表填寫、文件起草及多輪對話歷史記錄,將Blue J從研究工具轉變成Alarie所謂的「全球稅務認知操作層」。

儘管成功,Blue J所在領域錯誤代價高昂。幻覺問題未根除,但通過精密工程、內容篩選及人類監督已大幅減少。模型訓練成能承認無法回答問題,避免胡亂編造。

此外,若計算成本飆升或使用超預期,業務仍面臨經濟風險。更深層問題是專業判斷:AI越強大,使用者是否會過度依賴輸出,忽視批判思考?

從15小時到15秒:Blue J AI轉型給各行業的啟示

Blue J的蛻變對稅務軟件外亦具啟示。公司勇於放棄八年專有技術,重建於初期不穩定基礎,展現了勇氣與計算風險能力。

成功關鍵非因生成式AI在所有面向均優於監督學習,而是因解決了真正問題:全面性勝過狹窄領域的精準度。稅務專家不需5%問題有95%準確率,而是100%問題達到足夠準確。

淨推薦值從20提升至84反映持續迭代和海量數據支持。內容合作創造差異化,專家團隊確保可靠性。

最根本是Blue J意識到真正競爭不是其他AI初創或老牌出版商,而是傳統做法——專家手動研究15小時,知識隨退休消失。

「人們問Blue J做什麼?提供更好稅務答案。那我們就需要它。」Alarie反思。

隨著AI改變各行各業,這種清晰目標可能比技術先進更重要。未來屬於那些最有效利用AI解決真實問題的人,而非僅建造最先進AI者。

對一位從繁瑣研究中萌生挫折感的稅法教授來說,打造3億美元公司是大膽的終點;對數千名現今能在15秒解決複雜問題的專業人士而言,是職業未來,比預期更快來臨。

當ChatGPT還在胡亂編寫傳記時押上的賭注,最終證明了:有時最大的風險是不行動。

評論與啟示:

Blue J的故事是AI應用於專業服務領域的一個典範,展示了技術轉型的勇氣與智慧。Alarie的決策不僅是技術上的革新,更是對市場痛點的深刻理解:在專業知識密集且門檻極高的領域,AI的價值不在於完美無瑕,而是實現「夠用即好」的全面覆蓋。

這種戰略思維值得香港及全球的創業者借鑒。香港作為國際金融及法律中心,面對人才短缺與效率瓶頸,類似Blue J的AI轉型或能為本地專業服務業帶來突破。尤其是他們如何結合獨家內容授權與深厚人類專家審核,解決AI幻覺問題,為AI可信度建立了新標準。

此外,Blue J與OpenAI的合作模式也啟發企業在AI時代應與技術供應商建立更緊密、互惠的關係,才能快速優化產品,搶佔市場先機。

最後,Blue J並非僅靠技術炫酷取勝,而是透過不斷迭代、用戶反饋與專業知識的深度融合,實現了從研究工具向「全球稅務認知操作層」的進化。這種「技術+內容+專家」的三位一體模式,或將成為未來AI驅動專業服務的成功方程式。

對香港企業與政府來說,這提醒我們:AI應用不能僅停留在表面,而需深入理解行業痛點,結合本地優勢,才能真正釋放AI的生產力革命,推動產業升級與經濟轉型。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放

立即升級 🔗