知識圖譜增強語言代理(KGLA):統一語言代理和知識圖譜的機器學習框架,用於推薦系統
隨著全球逐漸走向個人化的數字體驗,從電子商務到媒體串流的推薦系統成為必需品。然而,這些系統卻未能充分模擬用戶的喜好,從而提供更好的推薦。傳統模型無法捕捉用戶-項目互動背後的微妙原因,因此只能提供一般化的推薦。由於這些限制,大型語言模型代理只能依賴用戶的基本描述和過去互動,缺乏解讀和推理用戶偏好的深度。這種有限的推理能力導致用戶資料不完整或缺乏特異性,進而使代理難以提供既準確又具上下文的推薦。因此,在推薦系統中有效地建模這些複雜的偏好對提高推薦準確性和改善用戶滿意度至關重要。
儘管經典的BPR和先進的基於深度學習的框架如SASRec在用戶偏好預測性能上有所提升,但這種提升卻缺乏可解釋性,無法深入理解用戶行為的動機。傳統模型通常基於互動矩陣或簡單的文本相似性,這大大限制了它們在用戶動機方面的可解釋性。深度學習方法雖然能夠捕捉用戶的序列互動,但在需要推理能力時卻顯得不足。儘管基於大型語言模型的系統更強大,但它們主要依賴於簡單的項目描述,無法全面涵蓋用戶偏好背後的所有理由。因此,這一差距凸顯了需要一種基於結構化和可解釋的方式來捕捉和模擬這樣的複雜用戶-項目互動的新方法。
為了解決這些問題,來自聖母大學和亞馬遜的研究人員引入了知識圖譜增強語言代理(KGLA),這是一個利用知識圖譜(KG)的上下文深度來豐富語言代理的框架,以模擬更準確和基於理由的用戶資料。在KGLA中,KG路徑被用作自然語言描述來向語言代理提供偏好背後的理由,使模擬更具意義且更接近現實行為。KGLA包括三個主要模塊:路徑提取,專注於發現KG中連接用戶和項目的路徑;路徑翻譯,將這些連接轉換為可理解的語言描述;最後是路徑整合,將這些描述整合到代理模擬中。由於KGLA利用KG路徑來解釋用戶的選擇,它允許代理學習一個細緻的用戶資料,比以往的方法更準確地反映用戶偏好,並解決了傳統和基於語言模型的方法的限制。
在本研究中,KGLA框架在三個基準推薦數據集上進行評估,包括結構化知識圖譜,涵蓋用戶、項目、產品特徵等實體,以及“由…生產”或“屬於”等關係。對於每個用戶-項目對,KGLA利用其路徑提取模塊檢索2跳和3跳路徑,封裝詳細的偏好信息。然後,這些信息被轉換為自然語言描述,2跳的描述長度減少約60%,3跳的則高達98%。這樣,語言模型可以一次性處理它們,而不必擔心超出令牌限制。路徑整合直接將這些描述嵌入到用戶代理資料中,以正負樣本豐富模擬,創建全面的資料。這種結構使用戶代理能夠根據偏好進行選擇,並提供詳細的支持理由,從而根據與不同屬性項目的各種互動集精煉資料。
KGLA框架在所有測試數據集上均顯著優於現有模型,包括在CDs數據集上NDCG@1準確性提高了95.34%。這些性能提升歸功於豐富的用戶代理資料,因為KG路徑的添加使代理能夠更好地模擬現實世界的用戶行為,提供對偏好的可解釋理由。該模型還展示了隨著2跳和3跳KG路徑的加入,準確性逐漸提高,證實了多層次方法在數據稀疏或用戶互動複雜的情況下提高推薦精度。
評論
KGLA框架的提出為推薦系統帶來了一個全新的視角,將知識圖譜的結構化知識與基於語言的模擬代理結合起來,通過有意義的理由豐富用戶代理資料。該框架的組成部分——路徑提取、路徑翻譯和路徑整合——協同工作以提高推薦準確性,在基準數據集上超越了傳統和基於LLM的方法。通過在用戶偏好建模中引入可解釋性,KGLA為開發基於理由的推薦系統提供了堅實的基礎,使這個領域更接近於個性化、富有上下文的數字互動。
這篇文章展示了KGLA在處理複雜用戶互動和稀疏數據方面的潛力,尤其是在需要深入了解用戶偏好的場景中。這種結合語言模型和知識圖譜的創新方法,不僅提高了推薦準確性,還為未來的推薦系統提供了一個可行的路徑。它提醒我們,在數據驅動的時代,提升技術的關鍵在於不斷追求更深層次的理解和更精細的建模能力。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。