學生抵抗AI檢測虛假指控的戰鬥

Ai

學生對抗AI檢測假藥的錯誤指控

教學壓力導致某些假藥的盲點——如AI檢測軟件。儘管其準確性欠佳,但卻成為無法法醫證明的懷疑的行政證據。這些假藥的使用得到了零容忍政策、薄弱或缺失的調查過程、心理依賴效應和歧視性執法的支持。而那些被針對的人最終面臨的是與官僚主義的全盤對抗——這種對抗最有可能通過威脅公開羞辱、訴訟或慷慨應用政治腐蝕劑來解決。彭博社報導了那些反擊的學生,比如在中央衛理公會大學被老師錯誤指控使用AI的教學學生莫伊拉·奧姆斯特德。

在秋季學期開始的幾週內,奧姆斯特德提交了一份必修課的書面作業——這是她每週需要完成的三個閱讀摘要之一。不久之後,她收到了成績:零分。當她向教授求助時,奧姆斯特德說她被告知AI檢測工具認為她的作品可能是由人工智能生成的。事實上,教師表示,她的寫作至少在之前也被標記過一次。

對於現年24歲的奧姆斯特德來說,這項指控是一記「重拳」。這也是對她在大學地位的威脅。「這就像是,天哪,這是我們現在的工作——而且它可能會因為我沒有做的事情而被奪走,」她說。

注意到教師的盲目「電腦說不」的推理。但你被標記了,莫伊拉!

最終成績被改變了,但在此之前她收到了嚴厲的警告:如果她的作品再次被標記,教師將以同樣方式對待,就像處理抄襲一樣。

我們承認這是錯誤的,但我們保證它會再次錯誤!

《商業周刊》測試了兩個領先的服務——GPTZero和Copyleaks——在2022年夏季提交給德州農工大學的隨機抽樣的500篇大學申請論文中,這些論文在ChatGPT發布前提交,基本保證它們不是AI生成的。這些論文是通過公開記錄請求獲得的,這意味著它們不是AI工具訓練的數據集的一部分。《商業周刊》發現這些服務錯誤地將1%到2%的論文標記為可能由AI撰寫,有些案例甚至聲稱有近100%的確定性。

找出方法論假設中的缺陷。儘管尊重這些假設,2%的錯誤率也是不可接受的。你將每隔一份作業就會做出錯誤指控。而現實情況是它們並不那麼準確。Turnitin承認有4%的錯誤率,但除此之外「拒絕向彭博社提供其服務」以供報導。

此外,AI檢測AI往往針對弱勢群體的寫作。

最容易受到錯誤指控的學生可能是那些以更通用方式寫作的學生,無論是因為他們像奧姆斯特德一樣是神經多樣性,還是英語作為第二語言(ESL),或者只是學會了使用更簡單的詞彙和機械化風格,根據學生、學者和AI開發者的說法。

一個表面的問題是,AI檢測研究受到急於從AI潛在用途中受益的AI研究者和其他學者的強烈影響。這是一個新領域,每個人都非常熱情!一個更深層次的問題是,假藥提供者已經在提供解決其自身產品造成問題的方法:他們希望學生自己註冊,使用他們的服務,提供他們所做的所有寫作,等等。他們希望加速控制三角形的進程,最終控制機構用戶和最終用戶之間的了解,並能夠擠壓雙方。

現在與Copyleaks合作的大多數學校都給學生提供了訪問該服務的權限,Yamin說,「這樣他們可以自己驗證」並查看他們自己的AI分數。與此同時,Turnitin正在擴展其AI產品組合,提供一項服務,幫助學生展示他們如何組織寫作作業的過程,以回應教師和學生的反饋。

向蛇怪驗證自己,它就會和你玩躲貓貓!最後一句話:現在有一些服務可以編輯文本以通過AI檢測測試。彭博社發現其中一個服務,Hix Bypass,非常有效。

彭博社對Hix Bypass服務的測試發現,一篇由人撰寫的論文被GPTZero錯誤地判定為98.1% AI,經過該服務修改後,AI判定顯著下降到5.3%。

彭博社沒有說是否用AI撰寫的論文測試Hix Bypass。

評論

這篇文章揭示了AI檢測工具在教育領域中的潛在危害,特別是對於那些來自弱勢背景的學生。AI檢測工具本應提升學術誠信,但目前的錯誤率和偏見問題顯示,這些工具在現階段更多地是增加了不公平,而不是解決問題。從奧姆斯特德的案例中可以看出,學生被迫在不公平的指控下捍衛自己,這不僅對他們的學業有害,還對他們的心理健康造成威脅。

我們需要認識到,技術應用在教育中的潛力與風險並存。AI檢測工具如果運用不當,可能會成為另一種形式的壓迫和歧視。學校和教育機構應該更加謹慎地使用這些工具,並確保有一套完善的機制來處理可能出現的錯誤指控。

此外,AI檢測工具的開發者和提供者也應該承擔更多的責任,確保他們的產品在各種背景下都能公正地運行,而不是僅僅追求商業利益。我們不能讓技術成為教育不公的工具,而應該用它來促進公平和進步。

以上文章由特價GPT API KEY所翻譯

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *