LinkedIn推出全新AI驅動人物搜尋,3年後終於登場
LinkedIn今個星期正式推出新一代由人工智能驅動的人物搜尋功能,這個本應是生成式AI自然應有的應用,卻耗時三年才面世。自ChatGPT面世已三年,加上LinkedIn半年前才推出AI求職搜尋,這個時間線反映出一個企業界的重要教訓:要在真實企業環境中大規模部署生成式AI,尤其是面對13億用戶,絕非易事,而是一個緩慢且殘酷的務實優化過程。
全新AI搜尋如何運作?
用戶現在可以在LinkedIn搜尋欄輸入自然語言查詢,例如「誰在癌症治療方面有專業知識?」傳統基於關鍵詞的搜尋系統只會搜尋「癌症」這個字眼,若用戶想深入,就得分別搜尋「癌症」和「腫瘤學」等關鍵詞,再手動拼湊結果。
而新AI系統則能理解查詢背後的意圖,因為底層大型語言模型(LLM)能掌握語義關係。系統明白「癌症」和「腫瘤學」的關聯,甚至與「基因組學研究」等領域有間接關係,因此能呈現更相關的專家名單,即使他們的個人檔案未必直接提及「癌症」這字眼。
同時,系統會平衡「相關性」與「可用性」,不會只顯示全球頂尖腫瘤專家(可能是第三度人脈,難以接觸),而是會優先推介你身邊的第一度人脈,即使他們只是「相當相關」,也能成為通往專家的關鍵橋樑。
LinkedIn的AI「烹飪秘方」:逐步優化的多階段流程
LinkedIn工程副總裁張文靜(Wenjing Zhang)表示,最初嘗試打造一套涵蓋所有產品的統一AI系統時,因目標過大而陷入停滯。後來公司改為先專注於一個垂直領域——AI求職搜尋,並從中取得成功,該產品令沒有四年制學位的求職者被錄用機會提升10%。這成為他們打造人物搜尋的藍本。
這次人物搜尋的挑戰更大,因為LinkedIn用戶超過13億。求職搜尋只涉及數千萬職位,人物搜尋則要在龐大用戶圖譜中檢索和排名,技術難度大幅提升。
從數據蒐集到模型蒸餾:AI訓練的嚴謹過程
團隊先建立一套「黃金數據集」,包含數百至千條真實查詢與用戶檔案對應,並根據20至30頁的產品政策詳細評分。利用這個小數據集,促使大型基礎模型生成大量合成訓練數據。接著用這些數據訓練一個7億參數的「產品政策」模型,作為高精度的相關性評判標準。
不過,團隊花了6至9個月也無法訓練出同時兼顧政策遵守和用戶互動的單一模型。後來他們將7億參數模型蒸餾成1.7億參數的教師模型專注於相關性,再搭配其他教師模型分別預測用戶行為(例如職位申請、連接、關注等),形成多教師架構,最終學生模型透過模仿學習達到最佳平衡。
整個流程分兩階段:先用8億參數模型粗略篩選候選人,再用高度蒸餾的學生模型做精細排序。與求職搜尋600萬參數學生模型相比,人物搜尋的學生模型更為精簡,由4.4億剪裁至2.2億參數,以確保在13億用戶規模下的速度與準確度。
技術基礎設施大改造:從CPU到GPU
人物搜尋不只是排序,還涉及大規模檢索。過去CPU架構難以應付,團隊改用GPU基礎設施,實現快速響應,這是求職搜尋產品未曾面對的基礎架構挑戰。
組織層面,LinkedIn曾讓求職搜尋和人物搜尋團隊並行研發,直到求職搜尋團隊成功後,公司將其架構師拉入人物搜尋團隊,直接移植成熟「烹飪秘方」。
輸入資料壓縮帶來10倍效能提升
為了提升效率,團隊訓練另一個大型語言模型作為「摘要器」,用強化學習專門將輸入內容濃縮,令模型輸入大小縮小20倍,資訊損失極少。配合2.2億參數學生模型,整體排名吞吐量提升10倍,成功應付龐大用戶量。
務實優先,打造工具非代理人
產品工程副總裁Erran Berger強調,企業應該聚焦完善推薦系統,而非追逐「代理人」的炒作熱潮。LinkedIn選擇最有效率的模型,而非執著於特定模型。
新人物搜尋包含一個由大型語言模型驅動的智能查詢路由層,能判斷用戶查詢應該走自然語言語義搜尋還是傳統關鍵詞搜尋。整套系統被設計為未來代理人將使用的「工具」,而非代理人本身。
Berger說:「代理產品的效能取決於他們所用的工具。即使你有世界上最強的推理模型,但如果人物搜尋引擎不好,代理人也無法交付好成果。」
他透露,未來或會推出整合代理人的版本,但未提供具體時間表,也表示這套「烹飪秘方」將逐步應用於公司其他產品。
LinkedIn AI部署三大教訓:
1. 務實:別一開始就想包山包海,先攻下一個垂直領域,即使要花18個月也值得。
2. 制度化「烹飪秘方」:將勝利經驗轉化為可複製流程(政策文件、蒸餾管線、共設計)。
3. 持續優化:真正10倍提升在於模型後期的精簡、蒸餾和創新優化,例如RL訓練的摘要器。
LinkedIn的經驗告訴企業,真實世界的AI應用不應過度追求炫酷模型或代理系統,而是要掌握從設計到蒸餾再到優化的完整管線,這才是長遠且有競爭力的策略。
—
評論與啟示
LinkedIn這次人物搜尋的推出,揭示了生成式AI在企業級大規模應用中,面對的真實挑戰與解決之道。與坊間許多只講概念和理想的AI報道不同,LinkedIn展示了AI落地的「慢工出細活」——從小規模、嚴謹的標註數據出發,通過多模型蒸餾和架構創新,逐步攻克龐大用戶量和延遲要求。
這不僅是技術問題,更是組織與策略問題:一開始就想做全公司統一系統反而拖慢腳步,反而分步聚焦一個垂直領域,再將成功經驗複製推廣,才是可行之道。這種「分階段攻堅」和「制度化成功模式」的思維,值得所有企業AI團隊借鑒。
此外,LinkedIn強調推薦系統本身的價值,而非盲目追逐代理人或「智能助理」的噱頭,提醒業界勿被市場熱潮迷惑,務實打造穩定可靠的核心能力才是王道。
最後,LinkedIn在技術基礎設施上的大刀闊斧改造,從CPU轉向GPU加速,以及訓練專門的摘要模型以大幅縮減輸入規模,這些細節展現了真正大規模AI服務背後的複雜性和創新,值得香港企業在AI基建規劃時深思。
總結來說,LinkedIn的AI人物搜尋不僅是產品升級,更是企業級AI實踐的寶貴範例。對於香港和全球的企業來說,這提供了清晰的路徑與策略啟發:AI成功的關鍵,絕非一蹴而就,而是持續的精細化運營和技術優化。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。
🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年!
不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放