AI輔導:對於學生的真正幫助?

Ai

科技
11年級學生深入探索AI輔導
而一位人類輔導專家在旁觀察

Sean Geraghty

Nash Goldstein

Sean寫道:

優質的輔導是有效的,但優秀的輔導員卻難以尋找。大型語言模型(LLMs)理論上可以以成本效益高的方式滿足這一龐大需求。但它們真的能進行輔導嗎?如果可以,那對誰有幫助呢?

在2023年11月,我共同撰寫了一篇文章,預測AI可以對有動力的孩子產生變革性的影響,但對於缺乏動力的孩子則是“無所謂”。在2024年4月,我們的朋友Laurence Holt在本刊發表了《5%問題》,同樣主張教育科技往往幫助那些富有的學生——在這裡,“富有”是指學業強勁並有學習動力的學生。今年5月,Laurence和我在哈佛舉辦了一次小型AI峰會。我們希望能找到一個有力的反駁,但未能找到令人信服的證據。我們仍然抱有希望!

在7月,我讓我的一位16歲實習生Nash評估當前AI對像他這樣的“強者”學生的幫助程度。結果超出了我的預期。以下是他的故事。然後請回到最後聽聽我的主要收穫。

Nash寫道:

我是Nash,一名高中三年級學生。今年我正在修讀AP統計。我好奇AI平台GPT和Claude是否能以自我導向的方式幫助我學習這門學科。

總體而言,這種方法效果很好。我更喜歡這種學習方式,甚至可以將其視為傳統課堂教學的一個合理替代方案——至少對於那些真正有動力的孩子來說。以下是我的經歷。

我第一次使用的是GPT-4o。過程很簡單:我會從其他來源(無論是Khan Academy還是傳統教科書)查找一個關於標準差的問題,截圖並複製過來。然後我會請4o解釋給我聽。

例如,我會問:“這是一個有效的概率分佈嗎?”它會這樣回答:

這與人類輔導員非常不同。在其基本模式下,它並不試圖讓我自己解決問題。相反,它的回答更像是Google的回答(也許因為它正在與Google競爭?)。

不過,有一種方法可以在一定程度上改善這一點。ChatGPT允許你創建自己的自定義GPT。我們創建了一個旨在模仿人類數學輔導員的版本,與默認的GPT-4o有兩個主要區別。一是它試圖通過提問來更好地引導學生,讓他們自己解決問題,而不是立刻給出答案。它還試圖以更簡單的方式表達。結果如下:

如你所見,在這個例子中,它能夠引導我完成問題的步驟,並僅提供完成問題所需的必要信息(在這種情況下,是有效概率分佈的性質)。這個版本唯一的缺點是有時它將步驟拆分得過於細緻。比如,你可能完成了步驟並解決了問題,但卻無法再次重複,因為你迷失在大局中,忘了為什麼要這樣做。

虛假答案的問題很少出現。我見過幾次,但我把它看作是一位偶爾故意犯錯的老師,試圖讓學生“發現”錯誤。

對於我擅長的主題,我會使用基礎的GPT以提高速度。對於我卡住的主題,我會使用這個自定義的GPT。

我還試用了Claude 3.5 Sonnet模型。它和GPT-4o之間的區別?微乎其微。看看這個:

我觀察到ChatGPT似乎在數學方面更強,而Claude的問題解決更具文學性。人們可能會偏好其中一個,但它們都能引導你到達相同的目的地。

在我的情況下,我經常從“半懂”進展到“完全理解”。我能夠很快抓住大意,而LLM能幫我完成最後一步。但我認為這對於在某個主題上基礎知識較少的學生來說會很糟糕。人類輔導員會更擅長於將一個人從“毫無頭緒”帶到“半懂”。

好吧,LLM幫助我練習問題。但如果我想深入學習,不僅是學會“如何”,還要學會“為什麼”——從“完全理解”到“超級理解”?LLMs能幫助嗎?

我進行了一些實驗。例如,我問ChatGPT為什麼我們以這種方式計算標準差,然後問了一些後續問題。

對我來說,這個方法論和理由的總結感覺很有幫助且解釋清晰。我更容易記住必須平方偏差以使其誇大,這樣可以更好地感知異常值。

然而,這引出了目前LLM輔導面臨的最大挑戰。人類輔導員的主要目的在於教學和激勵。幾乎不可能教導一個不想學習的學生。而這正是AI輔導的主要缺陷。從一開始,它就需要用戶輸入才能開始會話。如果用戶被其他事情分心,或其回應不在主題上,那麼教學(或學習)就無法進行。我認為LLMs對於有動力的學習者效果良好,但如果用戶完全不想學習,AI輔導就無法有效,因為它缺乏激勵他們的策略。

我的學習效率排名,從最差到最好:

在線視頻
單獨使用教科書
正常課堂
Claude
GPT
然而,效率並不是唯一需要考慮的方面。就我個人而言,我仍然更喜歡在學校學習,而不是單獨學習。因此,即使我理論上可以在兩個月內完成AP統計,我也更願意和同班同學一起在學校學習。

Sean寫道:

我是一名國家認證的數學教師,曾在紐約市和芝加哥任教。之前,我在一家大型國際教育機構負責數學教學設計,我們的教師為學生取得了顯著的數學進步。基於這個背景,以下是我在與Nash合作後的印象:

1. 目前對於Holt文章中描述的有動力的孩子來說,Chat GPT-4o的效果優於一般人類輔導員。對於那些優秀的學生,人類輔導員會介紹一個主題,展示一個例子,學生通常會“理解”。如果沒有,他們可能會問輔導員一兩個問題來達到“完全理解”。

我認為4o略優於人類輔導員,因為它可以以有動力的前5%學生的速度工作。而且,它可以根據學生的需求以適合他們的風格進行詳細解釋(尤其是如果你像我們為Nash所做的那樣建立自定義GPT)。最近的一項研究證實了Nash的經歷,839名學生中,自定義GPT版本的表現優於“基礎版本”。

沒有任何人類輔導員能像最先進的LLMs那樣快速或智力多樣化,只要提供的提示清晰且具體。

2. 正如Dan Meyer所說,“優秀的教師……不會等待學生自然產生對他們教學的需求。他們把這視為自己的工作來創造需求。”

當我看到Nash與AI輔導員互動時,那種需求自然存在。他對某些事情感到好奇或需要幫助解決問題,因此他請求4o。這幫助他不斷前進。他並不需要教師來激發他的動力。

我注意到Nash與4o的互動中有一種交易的質感,這讓一些教育工作者感到不安。在觀察他學習標準差時,我感到需要問他一些“理解檢查”的問題,既是為了推動他的理解,也是作為教師感到有用。我們的討論確實提升了他的理解,但並不是必需的。Nash表現得很好。我可以想像,前5%的有動力孩子會很喜歡與LLM的互動——隨時隨地就某個主題進行深入的交流。

截至目前,一切都還不錯?

3. 也許你已經意識到了這個巨大的警告。即使AI問題解決,即使被定制以更像真正的輔導員,對大多數學生來說仍然無法有效。我認為對80%的學生來說,它的效果會比一般人類輔導員差,對15%的學生效果相同,對5%的學生效果更好。這與Holt的論點和Meyer的批評精神一致。

不僅LLMs無法輕易激發學生的興趣或動力,它們的幫助也可能帶來意想不到的後果。當我問Nash是否有些同齡人會將LLMs僅視為“答案提供者”時,他只是微笑;當然會。作為一名前高中的教師,我應該早就明白這一點。那項隨機對照試驗的結果也印證了這一點:學生高估了AI在學習中的幫助,而非僅僅是給出答案。他們過度依賴它,失去它後,相對於對照組的表現受到了傷害。

4. 我認為如果Nash這學年只使用GPT-4o作為他的AP統計輔導,而不是在高中上課,他可能在六週內就能在考試中獲得滿分5分。相對而言,他將上30週的課,最終可能還是會得到相同的分數。

重要的是,Nash並不想走更高效的路。他喜歡高中——他的朋友、上課的體驗、發生的討論。他喜歡他的老師和社交的友誼。所以,為什麼要急於求成呢?

5. 不過,我忍不住想問幾個問題。

a. 如果有選擇,多少前5%的學生會選擇退出榮譽課程,選擇自我進度的GPT運行課程?

b. 如果Nash能與一些朋友一起使用GPT-4o,而不是參加正常的AP統計課,他會選擇AI輔導嗎?

c. 這會變得更好嗎?已經有聲稱新進展使幾個月前的AI工具看起來像是史前的。自從Nash和我合作以來,OpenAI已經發布了兩個主要更新——語音模式和“o1進階”,我本會在與Nash的工作中使用。

但我們之前也經歷過這樣的情況。教育科技浪潮來來去去,經驗表明,受益的主要是像Nash這樣的孩子。

即便如此,我對4o作為輔導員的能力印象深刻,超過了我見過的任何其他科技產品。它在一對一的輔導情境中的上限相對於Khan Academy的資源或Zearn或我見過的其他學習平台更高。專業的人類輔導員仍然佔有優勢,但他們難以找到且價格昂貴。

如果ChatGPT-4o和Claude超出了我對Nash的期望,那麼下一次驚喜會是什麼樣子?Laurence Holt和我可能需要在2025年更新我們對AI的預測。

Sean Geraghty是一名教育顧問。Nash Goldstein是馬薩諸塞州沃特敦的一名高中三年級學生。

這篇文章深入探討了AI輔導的潛力及其限制,特別是在不同學生的學習需求上。從Nash的親身經歷來看,AI輔導對於有動力的學生確實能提供有效的支持,這讓人思考AI如何能成為教育中的一個重要工具。然而,對於缺乏動力的學生而言,AI輔導的效果卻顯得有限,這凸顯了人類輔導員在激勵學生方面的無可替代性。

這種現象引發了對教育公平的反思。若AI輔導能夠進一步發展,是否能夠更好地適應不同學習者的需求?而且,根據文章中的觀察,AI可能會被某些學生視為“答案提供者”,這可能會影響他們的學習態度和深度理解。這提醒我們,在推廣AI輔導的同時,也必須重視如何培養學生的學習動機和獨立思考能力。

未來的教育技術發展應該更加注重如何融合人類的情感智慧與AI的技術優勢,才能真正提升學習效果並促進教育公平。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Chat Icon