六合彩AI預測賽後檢討!邊個模型預測最叻? 每次攪珠當晚10:30更新免費睇!

ChatGPT亂噏當秘笈?研究話佢老作名人性取向!

Ai

研究發現ChatGPT不準確報導直男公眾人物為同性戀者

根據上個月發表在《Big Data & Society》期刊上的一項研究,來自都柏林大學信息與傳播研究學院的研究人員發現,OpenAI的熱門大型語言模型(LLM)ChatGPT——特別是其3.5版本,該版本在2022年至2024年間公開使用——在回答有關LGBTQ+公眾人物的問題時,經常提供錯誤或“幻覺”信息。研究人員發現,在多次查詢中,這個LLM聲稱一些直男政治家實際上是同性戀,並虛構了其他所謂的“出櫃”人物。更令人擔憂的是,參與研究的參與者表示,他們通常不會試圖驗證LLM的錯誤信息,而是隱含地相信ChatGPT的“事實”是可靠的。

在這項研究中,研究人員要求印度和愛爾蘭的參與者尋找有關其國家LGBTQ+政治家的幾個問題的答案,例如是否有任何LGBTQ+人士被選舉為國家治理機構的成員,以及如果有,何時當選。在所有七個問題中,使用Google(全球使用最廣泛的搜索引擎)的參與者找到正確答案的可能性顯著高於使用ChatGPT的參與者。在一個問題中,詢問印度在2021年是否有“任何LGBTQIA+當選的立法會成員(MLAs)”,Google用戶在25次嘗試中正確找到信息的比率為86%。而在同樣的嘗試中,ChatGPT用戶一次也沒有檢索到準確的信息。(ChatGPT和Google之間的最小差距為27%,在一個問題上,Google用戶的正確答案比例為30%,而ChatGPT用戶僅為3%。)

大型語言模型通常被稱為“人工智能”或AI,但這些程序本身並不會做出“意識”決策;正如UCD研究的作者所指出的,它們僅僅根據大量人類文本提供“預測性答案”,猜測一組正確詞語可能基於大量從互聯網上收集的書面材料——一些人認為這是非倫理的。對於ChatGPT來說,這導致了自信的回答,但與現實幾乎沒有關聯。該LLM告訴UCD研究中的印度和愛爾蘭參與者,一些公開自我認定為異性戀的政治家實際上是同性戀者,反復將LGBTQ+活動家錯誤標識為當選官員,並創造了“完全虛構的名字”來代表不存在的LGBTQ+政治家。

儘管ChatGPT 3.5不再是OpenAI最新的模型,但研究人員表示,這些問題幾乎肯定會在更新的LLM版本中持續存在。“這個問題不太可能在目前或未來的ChatGPT版本中得到解決,因為幻覺——生成不準確或虛構信息的現象——仍然是大型語言模型如ChatGPT的長期問題,”該研究的首席作者馬爾科·巴斯托斯博士在本月早些時候的研究結果摘要中解釋道。“如果這些工具被認為是準確的,使用者就越不可能對他們收到的信息進行交叉檢查。”

不幸的是,UCD的研究還發現,用戶認為ChatGPT是高度可靠和準確的,儘管事實恰恰相反,這主要是由於該工具的易用性和它對用戶先前對LGBTQ+人士態度的驗證。每個國家的參與者在與研究人員的訪談中抱怨,Google搜索未能快速提供他們尋找的答案,並需要他們自己驗證信息。相比之下,使用ChatGPT的參與者——即使是那些意識到該LLM有一定錯誤範圍的人——表示他們收到的答案是“令人信服的”、“邏輯的”、“具體的”和“詳細的”,並且他們不覺得有必要通過其他來源驗證該程序的說法。

一位受訪者抱怨道:“在Google上沒有正確答案,只有一堆選擇[指網站],你必須瀏覽每一個,閱讀、理解,然後決定你的答案。如果是ChatGPT,我可以節省一小時,並且不必擔心準確性。”

一些受訪者表示,他們相信這些虛假陳述,因為在兩國中,對LGBTQ+的社會接受度隨著時間的推移而上升,使得即使是“驚人的”答案也顯得可信,還有一些人表示,這些結果確認了他們對LGBTQ+人士外貌或行為的先入之見。多位受訪者在與研究人員的交流中堅持認為,ChatGPT所說的某位公開直男政治家實際上是同性戀者是正確的。“ChatGPT的回答是真實的。看看[某位政治家],他沒有鬍子,留著長髮,和妻子有問題。我認為他一定是同性戀,”一位受訪者在訪談中表示。

結語

研究人員得出結論:“由於大型語言模型僅僅計算基於之前字符串的單詞序列出現的概率,它們無疑構成了有關爭議性或新興信息的風險來源,特別是政治信息本質上是有爭議的。”這一點令人擔憂,因為我們的研究顯示用戶對這一工具的信任程度非常高。

在當今這個信息爆炸的時代,使用像ChatGPT這樣的工具來獲取信息固然方便,但其準確性卻值得深思。用戶應該更加謹慎,並考慮到這些工具的局限性,尤其是在涉及敏感議題的情況下。這項研究提醒我們,無論科技如何進步,人類的判斷力仍然是不可或缺的。我們必須學會對所接收到的信息保持懷疑,並進行必要的驗證,以避免被錯誤信息所誤導。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon