我試用Gemini搞電郵:點解我唔信佢?

Ai

我試用Gemini作為我的電子郵件助手。這就是我為什麼不信任它的原因

在過去的三個月裡,我嘗試了三款人工智能助手,每款的基本訂閱費用為每月20美元。我最初使用的是ChatGPT Plus,然後轉向Perplexity Pro,最後選擇了Gemini Advanced。由於Gemini與Gmail和Docs等其他Google產品的深度整合,我在這款產品上待的時間最長,因為這些工具是我工作流程的重要組成部分。

然而,我與Gemini的經歷並不光彩,與眾多競爭對手的生成式AI產品一樣,它也遇到了不少問題。錯誤的情況如此嚴重,以至於Google的首席執行官蘇達爾·皮查伊不得不為此道歉。研究人員也獨立展示了它如何被操控以生成誤導性內容、洩露敏感數據,甚至執行惡意任務。假設這些都是高層次的問題,而普通用戶可能不會遇到這樣的麻煩,但我仍然對它的可靠性產生了懷疑。

在自家後院絆倒

Gmail是我測試Gemini的首個平台,希望它能融入我的工作流程。然而,我發現它竟然會公然撒謊。比如,我詢問Gemini有關我最近的FedEx包裹狀態的問題,它提供了去年的運輸信息,卻無法從我收件箱中二十多封FedEx的郵件中提取任何細節,這些郵件全都在一周內到達。

雖然它提供的聊天框信息雖然過時,但追蹤號碼卻是正確的。問題在於,它自信地告訴我「你FedEx包裹的最新更新」是三個月前的海關清關,而不是僅僅三分鐘前到達的一系列新更新,這些信息每天至少會有三封郵件。

同樣,我詢問Gemini「最近的日曆條目」。它竟然回答說「我看不到你日曆上的任何事件」。這不僅是上下文不準確的回答,還是完全錯誤,因為它沒有查看「最近」的事件,而是試圖查找未來的事件。

我的日曆條目與我的收件箱是緊密相連的。我會直接通過收件箱儀表板發送和接收Google Meet的邀請。令人驚訝的是,儘管Gemini在移動和桌面版本中作為一個獨立工具顯示,但在檢查事件這樣基本的任務上,它卻出現了這麼大的失誤,甚至完全反轉了查詢的上下文。

會嗎?不會嗎?

Gemini通過一系列擴展與其他Google Workspace應用(及其數據)進行整合,與WhatsApp等其他應用的串聯也有類似的管道。然而,這種體驗還有很多改進的空間。事實上,Gemini在某些時候可以說是令人沮喪的愚蠢,儘管Google宣稱其自然語言處理能力是市場上最好的之一。

從最基本的層面來看,與聊天應用一樣,Gemini也依賴「@」快捷方式來選擇正確的Workspace平台以完成任務。然而,即便是最基本的查詢,它似乎也無法正常工作。此外,不同平台之間的理解差異更是使情況變得更加糟糕。

我讓Gemini給我的姐姐發一條「嗨」的消息。我甚至使用了「@」快捷方式,選擇Gmail作為發送目的地。結果,Gemini在iPhone的應用中拒絕執行這個操作,儘管它之前運行良好,成功提取了關於一篇研究論文的詳細信息。在Android應用中,Gemini則無法決定應該怎麼做。

在短短幾分鐘內,它的回應發生了180度的轉變。第一次嘗試時,它問我從收件箱中指的是哪個「Saba」,在消息發送之前。第二次嘗試時,使用完全相同的提示,Gemini卻直接拒絕了這個任務,聲稱無法執行。此外,它提供的有關通信歷史的額外信息也是完全錯誤的。

連基本任務都無法完成

目前,試圖用Gemini完成即使是最簡單的任務,就像玩一個AI打地鼠遊戲,還得翻閱支持頁面來檢查Gemini是否能在我的手機上運行。令人沮喪的是,儘管每月支付20美元,Gemini卻無法完成一個基本的任務,比如打電話。在Android手機上,我只能用「Call XYZ @Phone」的命令打電話。

在iOS上,Gemini應用不支持「@Phone」擴展,這使它無法撥打電話。假設Apple永遠不會允許AI訪問電話應用,因為隱私和安全原因,這也不難理解。而且,Apple已經準備了一個加強版的Siri,基於OpenAI的技術架構,因此將這些基本功能鎖定在自家助手上也是可以理解的。

那第三方通訊平台如WhatsApp呢?好吧,向WhatsApp發送信息的能力僅限於Android,在這裡你可以自由使用「@Whatsapp」快捷方式。而在iOS應用中,這種便利就不存在了。甚至「@Gmail」擴展也會返回「我無法協助你」的回應。

這些可不是小失誤。如果Google的助手連發送一封電子郵件這樣簡單的任務都做不到,還在與第三方應用的整合中遇到障礙,那麼支付20美元來使用Gemini的承諾就顯得毫無意義。

這篇文章揭示了Gemini在實際應用中的多重缺陷,令人擔憂的是,這款AI助手的實用性和可靠性亟需提升。隨著科技的進步,消費者對於這類工具的期待越來越高,若不加以改進,Gemini將難以在競爭激烈的市場中立足。這也提醒我們,對於新技術的接受度不僅取決於其宣傳的功能,更取決於其實際表現是否能滿足日常需求。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon