
使用ChatGPT,學生可能通過課程,但代價不小
2025年4月21日 0 評論
由Eurasia Review報導
隨著學生使用人工智慧和大型語言模型,例如ChatGPT來完成作業的假設,伊利諾伊大學厄本那-香檳分校的航空工程系研究人員展開了一項研究,旨在了解免費版本的ChatGPT在一門學期長的本科控制系統課程中,與人類學生的表現相比如何。
結果顯示:在簡單的數學作業中,ChatGPT獲得了A的成績,但有些答案顯得古怪。然而,在需要推理的高級問題上,它的成績卻是D。
「我們發現,ChatGPT技術能夠在結構化的簡單問題上獲得A,而在開放式問題上則只有62分,這使得ChatGPT的學期成績降至82,屬於低B。人類學生的班級平均成績為84.85%,因為他們能處理需要高級推理的問題。」博士生Gokul Puthumanaillam表示。
研究結論指出,若一位學生只付出最少的努力,完全依賴ChatGPT,仍然可以獲得B並通過課程。問題在於,這個及格分數可能是簡單數學題的A+和分析題的D-的結合,實際上他們並沒有學到太多東西。
「就像數學課中的計算器一樣,ChatGPT是一個將持續存在的工具,學生會使用它。這項研究結果讓我意識到,我需要作為教育者進行調整。」Puthumanaillam的導師Melkior Ornik說。「我計劃考慮如何設計我的課程,隨著時間的推移,逐步增加更多高級問題,也許還包括基於項目的作業。學生仍會使用像ChatGPT這樣的程序來解決簡單的數學問題,但通過增加更多開放式問題,他們將達到更高層次的批判性思維,真正學會這些材料。」
Puthumanaillam提到,雖然ChatGPT在結構化問題上快速且大多正確,但使用時應謹慎。
「一名學生可能需要20分鐘來回答一個問題,而ChatGPT則在不到20秒內解決,但其正確性有時值得懷疑。」
他還描述了ChatGPT在作業中出現的一些奇怪行為,例如使用不當的技術術語或說出一些根本不正確的事情。
「儘管我們提供了所有所需的課程材料給ChatGPT,但它仍然出現了幻覺,使用了像是『準周期振蕩』這樣的詞,這些在課堂上、講座中或課程材料中從未出現過。」
這項研究考慮了選擇付出最少努力的學生類型。Puthumanaillam表示,ChatGPT的高級版本可能在解決分析問題方面稍有能力,並且能存儲更多記憶以解決更長、更複雜的問題。研究人員選擇使用免費版本的軟件,因為一般學生可能不願意支付每月的費用。
Puthumanaillam指出,課程中沒有團隊作業,ChatGPT使用的提示語言與人類學生接收的完全相同,並且所有操作都是同步進行的。
「當學生們在做作業時,ChatGPT也在做作業。ChatGPT只是班上的一個額外學生。」
那麼,ChatGPT是否從錯誤中學習了呢?
「當我們告訴ChatGPT在一個多選題上它是錯的,並給它正確的選項,然後再變換同一問題時,它確實表現得更好。在某種意義上,它是在學習,但總體上,它的表現是停滯的。如果它在作業中獲得90%的分數,那麼在學期結束時,它的分數仍然會是90或92。」
—
這項研究揭示了在教育環境中使用人工智慧的潛在挑戰。雖然ChatGPT能在某些方面表現出色,但它的局限性顯而易見,尤其是在需要深度理解和批判性思維的情況下。教育者必須重新思考課程設計,尋找平衡,以確保學生不僅依賴工具,而是能夠真正吸收和應用知識。這也提醒我們,在科技快速發展的今天,如何合理使用這些工具來促進學習,而非取代學習,將成為未來教育的重要課題。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。