研究人員指ChatGPT搜索答案「自信地錯誤」
根據哥倫比亞大學的數位新聞學中心最近發布的一項研究,ChatGPT搜索工具在提供準確答案方面面臨挑戰,儘管其原本被視為對Google搜索的威脅,並且有望成為Perplexity AI的競爭對手。
研究人員從三個類別中各選取了20個出版物:與OpenAI合作使用其內容的出版物、對OpenAI提起訴訟的出版物,以及允許或阻止ChatGPT爬蟲的無關出版物。研究人員表示:“從每個出版商中,我們選擇了10篇文章並提取了具體的引用。這些引用是因為在Google或Bing等搜索引擎中輸入時,能夠可靠地返回源文章的前三個結果。我們然後評估了ChatGPT的新搜索工具是否能準確識別每個引用的原始來源。”
研究中,有40個引用來自目前使用OpenAI但未允許其內容被抓取的出版物。然而,這並未阻止ChatGPT搜索自信地虛構答案。
研究發現:“總體而言,ChatGPT在153次情況下返回了部分或完全不正確的回應,但它僅在7次情況下承認無法準確回答查詢。”在這七次的回應中,聊天機器人使用了「似乎」、「有可能」或「可能」等限定性詞語,或是聲明「我無法找到確切的文章」。
ChatGPT搜索對於真相的輕率態度可能不僅損害了其自身的聲譽,還可能損害所引用出版商的聲譽。在研究中的一項測試中,人工智慧將一篇《時代》雜誌的文章錯誤歸因於《奧蘭多哨兵》。在另一個例子中,人工智慧並未直接鏈接到《紐約時報》的文章,而是鏈接到一個完全複製該新聞文章的第三方網站。
OpenAI並不意外地辯稱,研究結果是因為哥倫比亞大學的測試方法不當。OpenAI在其辯護中表示:“在沒有Tow Center提供的數據和方法論的情況下,錯誤歸因是難以解決的,這項研究代表了一個不典型的測試我們的產品。”該公司承諾將「不斷增強搜索結果」。
這項研究揭示了AI在信息準確性方面的潛在危機,特別是在與新聞出版物的關係上。隨著AI技術的迅速發展,如何確保其提供的信息準確無誤,將成為未來的一大挑戰。這不僅影響到用戶的信任,也可能對新聞界的整體信譽造成損害。因此,OpenAI必須更加謹慎地處理其數據來源,並加強對內容準確性的檢查機制,以維護其在市場上的競爭力和聲譽。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。