生成式人工智能如何變革醫學教育
在2022年11月公開發布後的幾週內,ChatGPT已經開始變得無處不在,而伯納德·張(Bernard Chang),醫學碩士 ’05,正在思考這對醫學教育未來的意義。哈佛醫學院的醫學教育院長張表示:“也許每隔幾十年就會有一次真正的革命發生在我們教授醫學生的方式上,以及我們期望他們成為醫生後能夠做什麼。這就是其中一次。”
到2023年,研究發現初版的ChatGPT能夠達到通過美國醫學執照考試的水準。2023年3月發布的更強版本ChatGPT,在某些醫學知識和臨床推理測試中超過了醫學生、住院醫生,甚至是執業醫生的表現。如今,有許多大型語言模型的能力與ChatGPT相匹敵。那么,這將如何影響當今的醫學生及教育他們的機構呢?
張表示,上一次這樣的醫學教育革命發生在1990年代中期,當時互聯網變得廣泛可及。“最初我們只是玩遊戲,”他說,“但它很快變得不可或缺,這正是現在生成式AI的情況。在幾年內,它將被內建到一切中。”
伯納德·張
哈佛醫學院(HMS)正在抓住這一轉變,今天就將生成式AI(也稱為genAI)納入課程。“現在是回應這一呼籲的合適時機,”張說。“我們沒有等待看看其他學校在做什麼,因為作為一個機構,我們希望走在前沿,同時這也是為了我們學生的正確選擇。”
融入AI
今年秋天,HMS為所有進入健康科學與技術(HST)課程的學生設置了一門為期一個月的AI在醫療保健中的應用入門課程。“我不知道有哪所醫學院在第一個月就這樣做,”張說。“這門課程探討了AI在醫學中的最新應用,批判性地評估了其在臨床決策中的局限性,並且,重要的是,它讓學生們意識到醫學將會變得不同。在這個時代,如果他們想成為醫學科學家或醫師工程師,他們不僅需要成為好的聆聽者和醫學面試者,還需要具備良好的數據技能、AI技能和機器學習技能。”每年大約有三十名學生報名HST課程,其中許多人將獲得碩士或博士學位,除了醫學博士(MD)。
一個本學期開始的博士課程,AI在醫學中的應用(AIM),正在進一步推進AI綜合教育。“生物信息學學生越來越多地表示他們對AI感到興奮,並詢問我們是否可以提供博士學位,”艾薩克·科恩(Isaac Kohane)說,他是HMS Blavatnik研究所生物醫學信息學系的主任。“我們不知道需求量會有多大,但最終我們收到了超過400份申請,僅提供了七個名額。”
科恩說:“像任何重大的技術爆發一樣,幾年內工作市場將會出現巨大的缺口。因此,我們希望培養了解醫學並理解AI可以解決的真實醫療問題的研究人員。”
為此,HMS還為對這項技術感興趣的醫學生和教職員開設了第三條途徑:人工智能在教育、研究和管理中的應用院長創新獎,這些獎項於去年宣布,每個選定項目可獲得高達10萬美元的資助(見下文“推動醫學教育創新”)。“這些獎項真正展示了HMS在努力將這些驚人的新工具整合到我們的工作和學習方式中處於領導地位,”醫學博士和博士學生阿里亞·饒(Arya Rao)說,她是研究AI在臨床培訓中應用的一個獎項的共同獲得者。“我很感激能有這樣的經驗,並將其帶入我的醫學職業生涯。”
阿里亞·饒
與HMS相關的醫院也在將AI納入他們的臨床工作流程。例如,布萊根婦女醫院正在測試一種環境文檔工具,該工具可以記錄臨床筆記,讓醫生有更多時間與患者互動。隨著這些工具的實施,張表示,它們將讓學生專注於與患者交談“而不是不斷地轉身看屏幕。這也將幫助他們更快地轉向更高級別的學習和我們希望醫生做的更高級的主題,比如聆聽。”
“生成式AI經常被認為是將人性從交流中剝離,”研究生教育辦公室的教育獎學金和創新助理院長塔拉琳·譚(Taralyn Tan)說。“但我實際上認為它是一種機制,通過將許多行政任務的負擔從醫生身上移除,重新引入臨床實踐的人性維度。”
塔拉琳·譚
饒同意這一觀點。“醫學的真正美麗,成為其中一員的原因,是你能夠與患者建立的聯繫,”她說。“如果你看看醫生花在挖掘醫療記錄和寫筆記上的時間,每天都是幾個小時。AI可以釋放一些這些時間,讓我們可以專注於我們真正存在的目的,那就是幫助人們。”
學習環境指導委員會主席兼艾倫和梅爾文·戈登醫學教育傑出教授理查德·施瓦茨斯坦(Richard Schwartzstein)認為,控制記錄保存和其他此類職責是有價值的,但他警告說,過度使用AI可能會導致學生在準備方面的不足。“我們需要將其放在現實世界的床邊醫學和醫生工作的背景中,強調推理和批判性思維,”施瓦茨斯坦說。“床邊臨床醫生應該如何使用它?臨床醫生需要警惕什麼?臨床醫生仍需擅長什麼才能適當使用AI?”
施瓦茨斯坦指出,例如,AI可以幫助醫生追踪患者可能接觸過但醫生不熟悉的全球病原體。“我現在可以用互聯網做到這一點,”他說,“但AI可以進行更廣泛和更快速的搜索。然而,一個缺點是它不會告訴你它在查看哪些來源,因此你無法確定信息是否來自你信任的期刊。”
理查德·施瓦茨斯坦
他說,雙重檢查AI的結果是關鍵,能夠將其提供的選項與患者的實際症狀和病史相匹配也是如此。“AI不擅長解決問題,而這是醫學中最困難的部分之一,”施瓦茨斯坦指出。HMS和貝斯以色列女執事醫療中心的研究人員的一項研究發現,儘管ChatGPT在做出診斷時是準確的,但在推理方面它比醫生犯更多錯誤,這些任務包括考慮為什麼應該問某些問題而不僅僅是問什麼問題——比住院醫生做得好,但不如主治醫生。
施瓦茨斯坦說,學生可能過度使用AI的另一個領域是分析實驗室數據。“解釋測試結果並在歸納模式下工作有助於他們學習批判性思維,”他說。“大多數由可能的診斷錯誤引起的醫療事故案件不是奇怪的病例,而是人們犯錯的基本病例——思維錯誤。因此,雖然在沒有醫生在旁的資源不足地區使用AI來處理這樣的病例對護士從業者來說是很好的,但對於醫生來說,沒有這樣的訓練和思維技能的能力將是有問題的。”
然而,一旦醫生有了一些年的實踐經驗,“擁有一個持續的AI代理來監督我們的行動並捕捉錯誤將是一個巨大的勝利,”科恩堅信。“有時候,經驗豐富的醫生因為疲憊或身體不適而犯下新手錯誤,因此讓AI檢查我們的工作可能會顯著改善醫院的死亡率和發病率。”
實際應用
但AI不是也以其錯誤而著名嗎?ChatGPT的“幻覺”——例如在回答“完全步行穿越英吉利海峽的世界紀錄是多少?”時提供詳細但非常錯誤的答案——是笑話的素材。科恩說,這個問題預計會隨著時間的推移而改善,但即使在今天,他指出,“AI犯的錯誤與人類犯的錯誤不同,因此它可以成為一個良好的合作夥伴。”不僅基礎技術在改進,他指出,還擴大了醫生可以用來做出診斷的數據池。例如,訓練在接近一百萬個心電圖上的機器學習模型在診斷三十八種疾病方面表現得與心臟病專家一樣好甚至更好。“想像一下,這在初級醫生手中會是什麼樣子,”科恩說。
科恩指出,這樣的巨量數據集可以在補充電子健康記錄(EHR)和患者可穿戴設備的輸入時變得更加全面。“生成式AI不必僅僅從試驗和醫學期刊中汲取數據,”他說。“如果在獲得同意和透明度的情況下收集現實生活數據,這些額外的信息可以幫助醫生看到他們可能看不到的東西。”
這類數據已經在布萊根婦女醫院的內科學生的試點項目中使用。“當他們在病房時,”張說,“學生只能從當時在醫院的患者中學習。但這個工具可以訪問課程目標和患者的EHR,因此可以比較學生實際遇到的情況與我們的學習目標。”張相信,這樣的用例在幾年內將變得普遍。“在進入輪轉之前,學生將訪問他們手機上的應用程序,應用程序會說,‘早上好,我建議你看這三位患者,’因為這些患者代表了學生知識中的空白。”
AI訓練數據中的偏見問題也是眾所周知的。施瓦茨斯坦和同事在《胸腔》雜誌上發表的一篇文章中指出,不僅AI本身容易再現其學習的人類生成材料中的偏見,而且至少有一項研究表明,這種循環可以迴圈回來,將AI的偏見傳遞給人類。
同時,有證據表明反饋也可以朝另一個方向發揮作用。布萊根婦女醫院的一項最近研究表明,在AI訓練數據集中包括更多細節可以減少觀察到的差異,而麻省總醫院的一名兒科醫生的持續研究正在訓練AI識別學生評價中的偏見。
譚說:“無論信息來自哪裡,都有很多偏見,所以我們必須密切關注這一點。但如果我們能夠以協同的方式利用AI,它可以成為我們工具包中促進教育公平的有用工具——例如,放入特定的文章、引用、我們知道有效的工具,並要求它從反映該領域最新資源的資源中汲取,同時保持對這些問題的意識。”
解決方案的一部分在於了解用於創建AI工具的數據。張提到HMS的“輔導機器人”,這些機器人是基於自家課程訓練的。“我們正在使用ChatGPT作為引擎,”他說,“但通過我們提供的語言和課程信息來約束它。如果我們不這樣做,到HMS來會有什麼特別的?”
考慮到所有正在發生的變化,當今年的學生群體畢業時,HMS學位會有什麼特別之處呢?
科恩說,如果AIM博士課程的學生今天畢業,“他們將立即受到所有競爭激烈的醫院和大學的頂級工作邀請。我估計60%的畢業生將進入工業界。但當他們在五年左右畢業時,他們也會在學術界和研究領域找到很多綠地。”
譚說,這部分原因在於受過這些技術訓練的學生的適應能力。“很難預測這將走多遠,”她說。“但明天最成功的醫生和研究人員將是那些能夠利用生成式AI進行創新和戰略規劃的人。提出解決方案的人將是那些使用這些工具的人。”
推動醫學教育創新
2024年3月,HMS宣布了三十三個人工智能在教育、研究和管理中的應用院長創新獎的獲獎者。以下是與醫學教育相關的項目示例。
未來患者角色:一個交互式的大型語言模型增強型哈佛臨床培訓伴侶
阿里亞·饒、馬克·蘇奇和蘇珊·法瑞爾
饒說,為學生提供在標準化患者上練習臨床技能的機會是醫學院的重要組成部分。當“訪問”結束後,學生會由扮演患者的演員和他們的教授對他們的臨床推理、溝通技能等進行評價。但這需要的費用和時間可能會限制這些機會。因此,饒、HMS放射學助理教授馬克·蘇奇和綜合臨床技能OSCE考試主任蘇珊·法瑞爾正在開發定製的大型語言模型,可以充當標準化患者。他們稱這些模型為SP-LLM,這些模型是基於HMS課程的特定材料進行強化的。學生將能夠使用文本和語音與這些模型互動,收集患者病史、獲取診斷信息並啟動臨床管理,同時練習他們的溝通技能。
饒說:“一個很好的特點是,當訪問結束後,SP-LLM還會向學生提供關於此次會面的反饋,既充當患者又充當導師。由於該工具隨時隨地可用,學生可以在開始見真正的患者之前獲得更多的實踐經驗。”
開發生成式人工智能評分和學習工具
格雷格·庫林、傑伊·瓦西列夫、薩曼莎·普爾曼、蘭迪·金、芭芭拉·科克里爾、理查德·施瓦茨斯坦和亨里克·貝舍
HMS的Pathways課程強調獨立學習和基於案例的協作課堂。施瓦茨斯坦和同事們開發了一個系統,能夠批量自動評分簡答題,以總結學生的優勢和劣勢,識別概念挑戰並提出針對性的教學策略。施瓦茨斯坦說,他擔任Pathways課程指導委員會主席,開發該課程用了大約八個小時來評分所有170名學生對單個開放式問題的回答,不包括提供反饋。“我不可能對作業這樣做,”他說,“但如果AI能做到,這對學生會很有幫助。”他補充說,簡化這一過程將使學生能夠進行更多的練習,從而“更多地練習判斷他們是否正確地將所學原則應用於案例研究。”
利用生成式AI創建以學習者為中心且基於證據的課程大綱
塔拉琳·譚和克里斯蒂娜·費舍爾
譚和布萊根婦女醫院的放射學助理教授克里斯蒂娜·費舍爾正在研究在譚的教學100課程中使用AI來開發和試點一個工具,該工具使用生成式AI來創建課程大綱,目標是讓其他HMS教職員採用。在課程中,譚的
以上文章由特價GPT API KEY所翻譯