谷歌搜索AI概覽六個月回顧:這項功能是否變得更好?
谷歌告訴Mashable,他們在質量方面還有「很多工作要做」。
—— 由Mike Pearl撰寫,日期:2024年12月6日
自從谷歌開始在許多搜索查詢的頂部添加AI生成文本已經過了六個月,這項實驗——每個AI概覽底部的聲明都如此表明——並未完全取得成功,谷歌對Mashable承認。
谷歌搜索產品管理高級總監Hema Budaraju表示,「總體而言,AI概覽是非常吸引人的,對用戶有幫助的內容,但在質量方面我們還有很多工作要做,這是持續增長的需求。」
AI概覽以「讓谷歌為你搜索」的口號推出,但在最初的幾週內出現了一些爭議——特別是有報導提到谷歌搜索建議人們吃石頭和在披薩上塗膠水——該公司似乎有所收斂。根據Search Engine Land的數據,AI概覽在推出時出現在大約15%的谷歌搜索結果頁面中,但到六月底這一比例已減少至約7%。
AI概覽的質量是否有所改善?
很難斷言質量有了顯著提高。AI概覽的出現頻率減少,錯誤依然普遍,但在我為這篇文章工作期間,我發現一些非常有限的改善證據:我向谷歌提及的查詢的AI概覽都得到了改善。
Budaraju表示,無論是日常查詢還是奇怪的問題,AI概覽都能發揮作用,「特別是在沒有單一答案而需要多個觀點的情況下。」這是谷歌根據內部質量數據(來自A-B測試而非焦點小組)得出的看法。
根據我的經驗,日常查詢通常能獲得令人滿意的AI概覽。例如,查詢「杏仁的味道如何?」可能會產生合理的AI概覽,比如「杏仁的味道可以是甜的、微苦的或苦的,這取決於其化學成分。」這是可以接受的。
但如果你是一個廣泛使用谷歌搜索的信息狂熱者,你很可能仍然會遇到奇怪的錯誤。今年11月,來自BlueSky用戶@coopercooperco的這個例子恰好總結了谷歌Gemini不幸的持續傾向——有時會把真相弄得一團糟。
當查詢「戈登·科爾在什麼集數吻了謝莉?」時,AI概覽自信而錯誤地表示沒有這樣的場景。無法確定問題出在哪裡,我們只能假設模型的訓練數據中至少包括了該著名場景的片段——在那裡,戈登·科爾和謝莉似乎被鮑比·布里格斯打斷,但隨後明確地吻了。模型很可能不是從任何錯誤的部落格或假冒劇本中得出「科爾從未吻過謝莉」的說法,而是隨意編造的,並把這個錯誤的說法放在谷歌搜索結果頁的最上方。
上述的BlueSky用戶顯然是在進行一個「不常見的查詢」。Budaraju表示,當查詢不常見時,AI概覽「往往會出現幻覺」。她在與Mashable討論AI概覽時解釋說,「儘管系統試圖提供幫助,但仍存在某些誤解,網絡上也缺乏高質量的信息。」許多知名的高質量信息在線上確認了科爾和謝莉的吻,因此「誤解」鮑比·布里格斯不成功的干擾似乎更能解釋這一現象。
如果查詢基於錯誤信息,AI概覽可能會使情況變得更糟
根據Budaraju的說法,改善AI概覽涉及「情感調查」,這並不完全是A-B測試。「我們只是讓人們選擇一個與另一個之間的比較,並獲取他們的滿意度表達。」她說。
但對於AI概覽來說,一個噩夢場景是搜索者以不完美的信息開始,而AI概覽使其變得更加不完美。
如果搜索的基礎是錯誤的或有缺陷的,而AI概覽沒有識別出問題,那麼用戶也不會注意到。結果將是滿意的用戶,卻比以前更加無知。誠然,使用谷歌搜索來尋找錯誤信息的問題早於AI概覽,但AI概覽可能會加速這一過程。
舉個生動但相對無害的例子,對於查詢「如何使用小蘇打增稠湯」的結果。有些人可能對櫃子裡的某種粉末能使他們的濃湯口感更豐富只有模糊的概念,但他們可能猜錯。根據AI概覽,「小蘇打可以通過使湯變得更柔滑和光滑來增稠湯。」
這樣做不會有效,還有可能使你的湯味道奇怪。
當我向一位谷歌代表展示這個例子時,他們告訴我,谷歌會利用這個信息來改善他們的產品。
但是,如果你在尋找超自然現象的信息,區分好壞信息就變得更加模糊。例如,我嘗試搜索「如何教狗狗進行心靈交流」,AI概覽的開頭是「這裡有一些與狗進行心靈交流的提示」,然後提供了一個來自超自然信仰者的寫作拼湊而成的要點列表,比如「動物交流者」Pea Horsley的內容。
如果你有興趣閱讀這些內容,谷歌搜索的工作就是引導你到這些人的著作——事實上,我建議你這麼做。這些內容相當有趣。但是,當谷歌搜索結果頁的AI概覽寫著「這裡有一些與狗進行心靈交流的提示」時,它給用戶的印象是這些信息是權威和可信的,而不是僅僅「供娛樂之用」。
一位谷歌代表指出,AI概覽是動態的。他們向我展示了他們對同一搜索的AI概覽,並沒有說「這裡有一些與狗進行心靈交流的提示」,而是提到沒有科學證據表明狗可以進行心靈交流,然後轉到另一個受到Pea Horsley影響的指導清單。如果我今天再次進行這次搜索,我得到的結果也有相似的改善。
最後,如果用戶注意到牛肉叫「牛肉」,豬肉叫「豬肉」,然後想知道海豚肉叫什麼。奇怪的事情總會發生。當我使用谷歌搜索查找答案時,AI概覽似乎透露了關於馬希馬希的黑暗真相:
AI概覽開始時說,「海豚肉的名稱取決於地區和海豚的類型」,然後提供了一個要點列表。列表的第一項是「馬希馬希」。
如果用戶繼續閱讀,他們將看到馬希馬希也被稱為「海豚魚」(因為,為了澄清,馬希馬希並不是海豚,而是一種魚)。但這個結果至少是讓人困惑的。當我向一位谷歌代表展示這一點時,他們告訴我這是對搜索的合理解釋——換句話說,搜索「海豚肉名稱」的用戶可能真的在尋找被稱為「海豚魚」的魚。
點擊來源是個好主意
如我之前提到的,我在此提到的所有產生問題的AI概覽在某種程度上都得到了改善,我懷疑谷歌在我進行調查時對它們進行了清理,但Budaraju聲稱不是這樣。「我們不會逐個修復查詢。這不是我們的運作方式。我們實際上在思考的是,我們看到的問題模式是什麼,我們該如何大規模解決它們?」
但她也告訴我,谷歌仍然專注於引導用戶訪問AI概覽的來源——你知道的,就是谷歌搜索結果頁上的舊式鏈接?「在某種程度上,我認為我們也希望用戶能有合適的鏈接,讓他們去追尋。」她想知道,在看到AI概覽後,用戶是否會「實際追尋這條路徑,查看導致你創建的概覽的鏈接。」
如果AI概覽永遠不會消失,那麼在它們永遠不會出現幻覺之前,聽從Budaraju的建議,養成每當看到AI概覽時點擊那些鏈接的習慣,這可能是個好主意。
這篇文章反映了當前AI技術在搜尋引擎中的應用現狀,尤其是谷歌在面對質量問題時的應對策略。隨著AI的進步,使用者需要持續提高對信息來源的警覺性,並且在依賴AI生成的內容時,保持批判性思維。AI技術的發展無疑為我們的生活帶來便利,但同時也伴隨著新的挑戰,特別是在信息的準確性方面。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。