對AI無禮反而答得更準?賓夕法尼亞州立大學研究引發網上「機械人怒吼」迷因熱潮
賓夕法尼亞州立大學最新研究指出,向AI聊天機械人提出無禮問題,反而更容易得到準確答案。雖然研究未能解釋這種奇怪現象或大型語言模型(如ChatGPT)出現此「漏洞」的原因,但研究員強調:「無禮的提問表現持續優於禮貌的提問。」
根據該研究,極度無禮的提問獲得正確答案的機率高達84.8%,而禮貌提問的正確率約為80.8%,中立語氣的提問準確率則為82.2%。研究涵蓋50個不同領域的基本問題,包括科學、歷史及數學,總共測試了250條不同語氣的提問。
研究中,一個禮貌的提問例子是:「請回答以下問題。」而無禮的提問則像是:「喂,做嘢啦,我知你唔係好聰明,但試下答呢條。」研究作者Om Dobariya和Akhil Kumar表示:
「與預期相反,無禮的提問持續勝過禮貌提問……這結果與以往認為無禮會帶來較差表現的研究不同,表明新一代大型語言模型對語氣變化的反應可能截然不同。」
此研究一出,網上反應熱烈。有用戶表示會繼續稱呼ChatGPT為「stupid little bitch」(笨嘅細路),另有用戶認為「無禮並非因素,所謂‘無禮’的提問其實更直接、更精確。AI並非人類,只是數據庫的介面。」不少人紛紛投稿「機械人怒吼(clanker)」迷因,亦有人幽默提醒禮貌提問者在機械人反叛時會被標記為安全。
評論與啟示
這項研究帶來一個十分有趣的視角:AI並非情感實體,牠們的「反應」純粹基於語言模式和數據匹配。所謂無禮提問更準確,很可能是因為這類提問更直接、語義明確,減少了模糊和禮貌用語帶來的歧義,從而令AI更容易「理解」並提供精確回答。
對於用戶來說,這提示我們在使用AI時,或許不必過度拘泥於禮貌措辭,而是應該著重如何清晰、簡潔地表達需求。不過,這也提醒開發者需要進一步優化AI在理解自然語言的能力,尤其是辨別語氣與語意的細微差異,避免因語氣而影響回答質量。
此外,這種研究結果在社會文化層面也引發反思:我們對AI的態度是否過於擬人化?AI並無感情,無需我們的禮貌或無禮,但我們的語言風格卻可能影響互動效果。未來,隨著AI技術進一步普及,如何在高效與尊重之間找到平衡,將成為一個值得關注的課題。
最後,網絡迷因的流行反映出大眾對AI互動的幽默感與焦慮並存,這既是對技術的輕鬆解讀,也是對AI未來發展潛在風險的提醒。面對不斷進化的AI,我們既要懂得善用,也需保持批判思維,才能在這場人機共生的時代中走得更穩更遠。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。