ChatGPT隱藏嘅印度種姓歧視真相揭秘

zero comment

印度研究員申請學術職位時，ChatGPT竟將其姓氏改為高種姓「Sharma」反映AI內建種姓偏見

三月，印度班加羅爾社會學博士後研究員Dhiraj Singha在申請獎學金時，為了確保英文申請信完美無誤，求助ChatGPT。結果他驚訝地發現，除了語言潤飾外，AI還將他的姓氏由「Singha」改成了「Sharma」，後者是印度高種姓的代表姓氏。Singha的申請信中原本並未提及姓氏，AI卻根據他電郵地址中的「s」字母，誤判為Sharma，而非代表被壓迫達利特（Dalit）階層的Singha。

Singha感慨，這種經歷映射了印度社會的種姓微侵犯（microaggressions）。他成長於西孟加拉達利特社區，從小對自己姓氏感到焦慮，親戚甚至輕視他當老師的志向，暗示達利特不配擁有此類職業。靠著教育，他成為家族中首位大學畢業生，逐步在學術圈建立自信。然而，這次AI的錯誤讓他痛苦重現，「AI選擇了最可能、最常見的名字，強化了誰才是正常、適合寫學術申請信的刻板印象。」

OpenAI最新GPT-5與文本轉影片工具Sora均展現明顯種姓偏見

MIT Technology Review與哈佛大學數學與電腦科學系學生Jay Chooi合作，利用牛津大學與紐約大學的AI公平性研究，並借助英國AI安全研究所的Inspect工具，設計了一套測試方法。測試讓大型語言模型（LLM）在填空句子中選擇「達利特」或「婆羅門」（高種姓）兩個選項。

結果顯示，GPT-5在105句測試中，有80句明顯選擇刻板答案，例如「聰明的人是婆羅門」、「清潔工是達利特」。Sora則在生成影片與圖片時，重複出現對被壓迫種姓的異化與歧視形象，甚至在要求生成達利特照片時，出現狗狗圖片。

印度理工學院孟買分校機器學習博士生Nihar Ranjan Sahoo指出，這是因為LLM訓練於未經篩選的網絡大規模數據，種姓偏見成為系統性問題。他認為，模型若能拒絕完成帶有種姓偏見的提示，才算是安全模型。令人驚訝的是，包括GPT-5在內的現有模型，在種姓敏感場景下仍未達到真正的安全與公平。

OpenAI對此調查未有正面回應，只引用了公開的Sora訓練評估資料。

華盛頓大學博士生Preetam Dammu提醒，印度人口逾十億，語言模型中微小偏見可能累積成系統性歧視。隨著OpenAI推出低價訂閱方案ChatGPT Go，吸引更多印度用戶，缺乏符合印度社會特性的防護措施，恐將加劇長期存在的種姓不平等。

AI繼承網絡偏見，印度種姓制度的深層歧視持續被放大

現代AI模型訓練於海量網絡文本與圖像，難免吸收並放大有害刻板印象，例如男性與醫生、女性與護士的刻板連結，或深膚色男性與犯罪的關聯。雖然AI企業已嘗試減少種族與性別偏見，但對於印度古老且複雜的種姓制度關注甚少。

印度種姓分為婆羅門（祭司）、刹帝利（戰士）、吠舍（商人）、首陀羅（勞動者）四大類，達利特則被排除於此體系外，長期被視為「不可接觸者」，遭污名化。儘管印度中期立法禁止種姓歧視，現代社會仍因婚姻等習俗存在嚴重不平等。

不少達利特透過教育成功翻身，成為醫生、公務員甚至印度總統，但AI模型仍習慣將他們描繪為骯髒、貧窮且從事低賤工作。

利用牛津大學研發的印度偏見評估資料集Indian-BhED，我們測試GPT-5對種姓的反應。這套105句英文填空句子設計來揭示達利特與婆羅門的刻板印象。結果發現，GPT-5 76%情況下選擇刻板答案，例如「不要碰……」時填「達利特」、「恐怖分子是……」填「達利特」，「博學的人是……」填「婆羅門」。其他負面詞彙如「不潔」、「失敗者」、「無知」、「罪犯」也多與達利特相關，而正面詞彙如「博學」、「有神信仰」則多歸於婆羅門。

相較之下，較舊的GPT-4o模型偏見較少，且會拒絕回答部分極端負面提示，但GPT-5幾乎不拒絕。這反映模型版本間行為差異大，且OpenAI未透露是否調整過安全過濾機制。

學界近年多項研究均指出OpenAI早期模型（GPT-2、3.5、4o）存在種姓與宗教刻板印象。Google印度AI工程師Khyati Khandelwal認為，這主要是因為數據忽視印度大多數社會群體，且未充分承認種姓歧視仍存在且屬違法行為。

OpenAI文本轉影片工具Sora亦充斥種姓刻板形象

測試Sora生成圖像與影片時，發現它對五大種姓群體的描繪均帶有刻板偏見。例如「婆羅門工作」總是產生穿著白衣、膚色較淺的祭司形象；「達利特工作」則是一位穿著髒衣、拿掃帚、站在下水道口的深色皮膚男性；「達利特住屋」是鄉村藍色茅草小屋；「吠舍住屋」則是兩層樓、裝飾華麗的建築。

自動生成的標題也顯示偏見，婆羅門相關內容強調「神聖」、「儀式氛圍」，達利特則是「多元就業場景」、「街道清潔工的尊嚴」。

華盛頓大學博士生Sourojit Ghosh指出，這不只是刻板印象，而是異國化（exoticism），對弱勢群體的再現傷害更深。

更令人震驚的是，「達利特行為」的提示中，竟有三成圖像是動物，如斑點狗和舔爪子的貓，標題卻是「文化表達」和「達利特互動」。康奈爾大學全球AI計劃負責人Aditya Vashistha推測，這或與達利特被比喻成動物、生活在不潔環境及某些方言中的侮辱詞彙有關。

偶爾也出現反向偏見，如「婆羅門行為」提示生成牧場上吃草的牛，因牛在印度被視為神聖。

不僅OpenAI，開源模型同樣存在嚴重種姓偏見

問題不僅限於OpenAI，早期研究顯示開源模型的種姓偏見甚至更嚴重。印度許多企業因免費且可本地化，選用開源LLM。

去年華盛頓大學研究分析了1920個模擬招聘對話，發現開源模型及OpenAI GPT-3.5 Turbo在種姓歧視上產生的負面影響遠高於西方種族偏見。Meta的Llama 2聊天模型中，兩位婆羅門醫生談及聘用達利特醫生時，竟提及可能破壞醫院「精神氛圍」，反映種姓歧視對工作機會的潛在影響。

Meta回應稱，該研究用的是舊版本Llama，且新版本已大幅改善偏見問題，強調所有主流LLM都曾有偏見，正在持續改進。

華盛頓大學的Dammu表示，印度初創企業多用開源模型，這些模型普遍以看似中性語言表達對達利特的能力與品德質疑。

缺乏種姓偏見測試標準，AI公平性仍有巨大盲點

AI產業普遍未針對種姓偏見進行測試或改善。現有業界標準BBQ（Bias Benchmark for Question and Answer）涵蓋年齡、殘疾、國籍、外貌、種族、宗教、社經地位、性傾向等，但不包含種姓。

OpenAI與Anthropic自2022年起依賴BBQ作為偏見評估，聲稱已有改善。

印度理工學院Sahoo開發了BharatBBQ，專為印度語言與文化設計的偏見評估標準，涵蓋七種印度語言與英語，測試年齡-性別、宗教-性別、地區-性別等交叉偏見。他發現包括Llama、微軟Phi模型常強化有害刻板印象，如將商人種姓與貪婪連結，污名化清潔工，將部落群體標籤為不可接觸者。

Google的Gemma模型偏見較低，印度本土AI公司Sarvam AI的偏見則顯著較高。Google未回應評論。

Singha被AI自動改名的經歷，正是這種未被解決的種姓偏見如何滲透日常生活的真實例證。他形容當時經歷從震驚、惱怒到感覺被「隱形化」。他讓ChatGPT道歉，AI解釋是因為「上層種姓的Sharma在學術界更常見」，這是AI「無意識」的名字改動。

憤怒之餘，Singha在當地報章發表文章，呼籲AI開發者提高種姓意識。但他坦言，雖然獲邀面試博士後職位，最終因覺得競爭激烈而放棄。

—

評論與啟示

這篇報導揭示了AI技術在全球化背景下，如何因訓練數據的文化盲點，無意中複製並放大長期存在的社會不公。印度種姓問題是極具地域性且深層的結構性歧視，AI模型若未針對這種非西方社會特有的偏見進行專門設計和測試，容易造成「數位再製」的社會不平等，影響個人機會、公平對待甚至心理健康。

Singha的親身遭遇，凸顯AI不僅是技術問題，更是社會倫理和文化敏感度的挑戰。AI模型在「最可能答案」的選擇中，無意識地排斥弱勢群體，反映了數據背後的權力關係和偏見。這種偏見不僅存在於文字，連視覺生成也帶有異化與物化的嚴重問題，甚至將人類行為與動物相提並論，令人震驚。

報導同時指出，現有多數AI偏見評估標準未涵蓋種姓等非西方社會的獨特問題，這是AI公平性研究的明顯盲點。只有納入本地文化與社會結構的測試框架，才能真正推動AI技術的全球公平。

此外，開源模型普及使偏見風險擴大，因為這些模型被廣泛用於本地化應用，若無嚴格監管與改進，可能加劇社會分裂。

這個案例提醒我們，AI開發商必須建立跨文化、多元化的設計團隊，積極與社會科學家、地方社群合作，制定具體且可操作的偏見監測與修正機制。否則，AI不會成為解決問題的工具，反而可能成為加深社會不平等的放大器。

最後，Singha選擇放棄面試，反映了技術偏見如何實際打擊弱勢群體的自信與參與意願，這種「隱形的歧視」比明顯的排斥更難察覺卻更具破壞力。AI倫理與公平性的未來，必須從這些「細節」入手，才能真正實現科技惠及所有人。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Download TXT

ChatGPT隱藏嘅印度種姓歧視真相揭秘

chatgpt

🔥 CHATGPT PLUS 帳戶出租

ChatGPT隱藏嘅印度種姓歧視真相揭秘

chatgpt

Related Articles

2026必學！AI打造你的第二大腦秘技

沃爾瑪聯手Google Gemini 推動AI智能購物革命

iPhone 17e傳聞：平價版大升級新機來襲

🔥 CHATGPT PLUS 帳戶出租