谷歌推出新AI系統,提升疾病管理與藥物推理能力
大型語言模型(LLMs)在臨床疾病管理中的應用面臨許多挑戰。儘管這些模型在診斷推理方面表現出色,但在長期疾病管理、藥物處方和多次就診的患者護理中,仍未經過充分測試。主要挑戰包括在多次就診中理解上下文的能力有限、對臨床指導原則的遵循程度不一,以及藥物推理的複雜性。此外,提供實時、高質量的患者互動和計算效率也是一個重大挑戰。克服這些挑戰對於開發能協助醫療專業人員提供準確、基於證據和個性化的疾病管理的AI系統至關重要。
早期的人工智能臨床模型主要集中於診斷推理,使用結構化數據集生成鑑別診斷。然而,這些方法在現實世界的疾病管理環境中存在顯著限制。大多數現有方法未能在多次就診中充分跟踪患者歷史,導致護理建議不連貫且不一致。許多模型也顯示出未能有效遵循現有的臨床指導原則,從而降低了其管理計劃的可靠性。此外,藥物推理也是一個挑戰,因為現有技術往往在藥物選擇、劑量和相互作用方面產生不一致,從而降低了安全處方的可靠性。更重要的是,在醫療環境中實時做出決策需要快速處理大量臨床數據,這對大多數基於大型語言模型的系統來說是一個計算瓶頸。
谷歌的研究人員提出了一種創新的基於LLM的代理系統,旨在用於臨床疾病管理和多次就診患者的互動。這一解決方案通過一系列創新來改善基於AI的醫療推理。系統中引入了一個多代理系統,其中對話代理能夠進行自然、富有同情心的對話,並在每次就診中跟踪患者歷史,管理推理(Mx)代理則基於臨床指導原則、患者歷史和檢測結果進行推理,制定結構化的治療計劃。該系統利用Gemini的擴展上下文能力,保持與當前臨床指導原則和藥物名單的一致性。與在靜態、單次就診環境中運作的傳統AI模型相比,這一解決方案能夠動態管理實時的多次就診互動,根據患者的進展和檢測結果調整建議。此外,還推出了一個新的多選基準RxQA,用於評估藥物推理的準確性。這個數據集來自美國和英國的兩個國家藥物名單,挑戰處理複雜藥理查詢的能力,並顯示出在管理高難度藥物相關任務方面的表現優於人類臨床醫生。
該系統結合了幾種尖端方法以提升性能。實施了一項盲法隨機虛擬客觀結構化臨床考試(OSCE),將這一AI增強方法與21名初級護理醫生在100個多次就診案例場景中進行比較,包括英國NICE指導原則和BMJ最佳實踐指導原則。在藥物推理評估中,RxQA基準包含600個多選題,來自OpenFDA和英國國家藥物名單(BNF),並由持牌藥劑師驗證。從架構上看,該系統包括一個基於Gemini 1.5 Flash的對話代理,專為多次就診醫療對話進行優化,以及一個基於結構化檢索和推理的Mx代理,以生成詳細的管理計劃。一個結構化生成框架,配有指定約束,確保輸出的連貫性以及來自臨床指導的引用準確性。為了確保在實時患者互動中的效率,該模型設計為在一分鐘內做出反應,基於627條臨床指導的綜合評估語料庫,這些指導包含1050萬個標記,這需要優化檢索方法來有效處理如此龐大的數據。
該AI系統在疾病管理推理方面的表現與初級護理醫生不相上下,但在治療準確性、藥物推理和指導原則遵循等關鍵領域超越了他們。在一項多次就診的OSCE研究中,該系統提供了更結構化和準確的管理計劃,並在臨床指導原則的遵循上有了改善,治療和檢查建議的具體性也有所提高。藥物推理能力在高難度藥物相關查詢中同樣超過了人類臨床醫生,成功利用外部藥物名單提高準確性。此外,專科醫生和患者評估者的評價也反映了AI在監控和更新管理計劃方面的能力,確保了多次就診中結構化和以患者為中心的決策。這些發現顯示出該系統在改善基於AI的臨床決策支持方面的潛力,提供準確、基於證據且有效的疾病管理解決方案。
這一AI系統是疾病管理的一次顯著進步,從簡單的診斷功能提升至訪問之間的整體患者護理和系統治療計劃。隨著深度上下文推理、多代理協調和臨床指導的實時檢索的加入,它在複雜案例的決策能力上達到了與醫生相當的水平。其準確的治療建議、增強的藥物推理能力和嚴格遵循既定協議的能力,顯示出它在AI輔助臨床實踐中的革命潛力。儘管在現實環境中的應用仍需進一步研究,但這項研究是縮小初級護理差距、提升治療一致性和通過AI驅動的自動化最大化醫療服務的顯著一步。
在這個快速變化的AI領域,這一創新不僅僅是技術的進步,更是對未來醫療服務的一次重新思考。AI系統的發展使得醫療專業人員能夠利用更先進的工具來提升患者護理的質量,未來的研究應該著重於如何有效整合這些技術到現實的醫療環境中,從而實現更高效和人性化的醫療服務。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。
🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年!
不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放