紐約大學教授因學生作業似麥肯錫備忘錄,利用AI進行口試「以火攻火」
紐約大學商學院教授Panos Ipeirotis發現,學生的作業雖然看似精彩,但實際理解卻不足,內容讀起來像是用AI生成的麥肯錫備忘錄,缺乏真實的思考和掌握。為此,他決定用AI技術來進行口試,以「以火攻火」的方式測試學生的理解能力。
Ipeirotis在一篇博客中表示,當他在課堂上隨機點名學生,要求他們為自己提交的作業辯護時,許多學生無法流暢回答,顯示他們並未真正掌握內容。他認為:「如果學生無法當場為自己的作品辯護,那麼這些書面作業就無法反映真實的學習成果。」
重拾口試,利用AI擴大規模
傳統口試因耗時太長而逐漸被淘汰,但Ipeirotis認為,口試是評估學生即時思考和判斷能力的最佳方式。他和同事利用ElevenLabs的對話式語音技術,打造了一個AI口試官。教師只需輸入指令,AI便能自動詢問學生問題,整個過程準備只需數分鐘。
這個AI口試分兩部分:首先AI會針對學生的畢業設計項目提問,深入探討其決策與推理過程;接著AI會選擇課堂上討論過的案例,要求學生即時分析思考。整個口試平均每位學生約25分鐘,9天內完成36名學生的評估,總成本約15美元,遠低於人手口試的數百美元。
Ipeirotis還用AI進行口試評分,三個AI模型Claude、Gemini和ChatGPT分別獨立評分,互相審核後再修正分數,由Claude擔任「主席」統籌最終結果。他發現這種「大型語言模型評審團」比人類評分更嚴謹且公平,甚至能指出教學上的不足。
學生反應分歧,口試仍有壓力
儘管AI口試更能真實反映理解水平,但學生反應不一。只有少數學生偏好這種考核形式,許多人認為口試比筆試更具壓力,但也承認這是更有效的學習檢測方式。Ipeirotis認為,口試正是學習應有的模樣,「練習越多,表現越好」。
AI時代下的教育考核挑戰
Ipeirotis的嘗試正值全球大學重新思考AI時代如何公平評估學生之際。2024年9月發表於《高等教育評估與評價》期刊的研究指出,AI已將學生成績評估變成一個「棘手難解」的問題。澳洲一所大型大學的20名教學主管透露,他們面對工作量激增、AI使用規範混亂,甚至無法統一對防作弊考核的標準。
有教師認為AI應成為學生的學習工具,另一些則視其為學術不誠實的根源,許多人都不確定未來該如何應對。LinkedIn聯合創辦人Reid Hoffman早前在播客中建議,傳統考試形式如寫作作業容易被AI利用作弊,大學應重新設計評核方式,口試因需即時回答問題,能降低作弊空間,未來或會出現「AI考官」來執行口試。
—
評論與啟發
Ipeirotis教授的創新嘗試不僅是科技融入教育的實例,更是對現代教育評核模式的深刻反思。當AI技術使學生能輕易生成看似完美的作業,傳統的筆試和書面作業評分已無法有效衡量學生的真實理解與思考能力。AI口試的引入,既解決了口試人力成本高昂的問題,也提升了評核的真實效度與公正性。
不過,學生對AI口試的壓力感與接受度問題,提醒教育者在推行新評核形式時,需兼顧學生心理負擔及適應過程。教育不應僅是考核的公平性,更應注重學習過程的支持與激勵。
此外,AI在評分上的一致性與嚴謹性,為人類教師提供了寶貴的參考,但也帶來了對「人性化評價」的挑戰。AI或許能指出知識漏洞,卻難以完全理解學生的創意與獨特見解。如何平衡AI效率與人類判斷,將是未來教育發展的關鍵。
最後,這次實驗提供了一個鮮明的訊號:教育必須不斷進化,與時俱進。AI不應只是作弊者的工具,更是提升教學質量和評核公正的助力。面對AI的挑戰,教育者需要「以火攻火」,勇於創新,才能真正培育出具備批判思考和實踐能力的未來人才。
以上文章由GPT 所翻譯及撰寫。而圖片則由GEMINI根據內容自動生成。