亞馬遜AI Alexa升級受阻,難解「幻覺」問題

Ai

亞馬遜必須解決幻覺問題,才能推出AI驅動的Alexa

亞馬遜正在準備重新推出其基於語音的數字助理Alexa,這次將其升級為一個能夠完成實際任務的人工智能「代理」。然而,這一技術集團在解決系統AI改造所面臨的挑戰上仍需加把勁。

這家市值2.4萬億美元的公司在過去兩年中一直致力於重新設計Alexa,這個對話系統嵌入了全球5億個消費者設備中,目的是將軟件的「大腦」替換為生成式AI。

負責亞馬遜人工通用智能(AGI)團隊的Rohit Prasad告訴《金融時報》,這個語音助手仍需克服數個技術障礙才能進行推廣。其中包括解決「幻覺」或虛構答案的問題、回應速度或「延遲」問題,還有可靠性。他表示:「幻覺的出現必須接近於零。這在行業內仍然是一個未解決的問題,但我們正在全力以赴解決它。」

亞馬遜領導層的願景是將Alexa從目前僅能執行簡單任務(如播放音樂和設置鬧鐘)轉變為一個能作為個性化禮賓服務的「代理」產品。這可能包括從建議餐廳到根據個人的睡眠周期調整臥室燈光等各種功能。

Alexa的重新設計自2022年底OpenAI的ChatGPT推出以來一直在進行。儘管微軟、谷歌、Meta等公司迅速將生成式AI嵌入他們的計算平台並增強其軟件服務,但批評者質疑亞馬遜能否在技術和組織上的困難中及時解決問題,以便與競爭對手抗衡。

據多名曾在亞馬遜語音助手團隊工作的人士透露,該項目面臨著複雜的挑戰,並且經歷了多年的AI研究和開發。

幾位前員工表示,推出的長時間等待主要是因為在將Alexa原有的簡單預定義算法與更強大但不可預測的大型語言模型相結合的過程中出現了意想不到的困難。

亞馬遜表示,正在「全力以赴,使其語音助手能夠提供更主動和更具能力的協助」。該公司還補充說,這種規模的技術實施,應用於全球客戶使用的實時服務和設備,前所未有,並不是簡單地將大型語言模型覆蓋到Alexa服務上。

Prasad表示,亞馬遜內部的Nova模型的推出部分是為了滿足最佳速度、成本和可靠性的具體需求,以幫助像Alexa這樣的AI應用「達到那最後一公里,這真的很難。」

他說,要作為代理運作,Alexa的「大腦」必須能夠調用數百個第三方軟件和服務。

他補充道:「有時我們低估了集成到Alexa中的服務數量,這是一個巨大的數字。這些應用每周接收數十億的請求,因此當你試圖以快速的速度實現可靠的行動時……你必須能夠以非常具成本效益的方式做到這一點。」

這一複雜性來自於Alexa用戶期望快速回應以及極高的準確性。這些特質與當今生成式AI的固有概率性特徵相悖,後者是一種根據語音和語言模式預測單詞的統計軟件。

一些前員工還指出,在賦予Alexa新的生成特徵(如創造力和自由對話)的同時,保持助理的原始屬性(包括一致性和功能性)也面臨挑戰。

由於大型語言模型的個性化和對話性質,該公司計劃聘請專家來塑造AI的個性、聲音和措辭,以便讓Alexa的用戶感到熟悉。

一位前Alexa團隊的高級成員表示,儘管大型語言模型非常先進,但它們也帶來風險,例如有時會產生「完全虛構的答案」。

他們表示:「在亞馬遜這樣的規模下,這可能每天發生大量次,損害品牌和聲譽。」

在六月,前Alexa機器學習科學家Mihail Eric公開表示,亞馬遜在成為「對話AI的無可爭議市場領導者」方面「掉鏈子」了。

Eric表示,儘管擁有強大的科學人才和「巨大的」財力,但該公司卻「受到技術和官僚問題的困擾」,並暗示「數據的標註質量差」,「文檔要麼不存在,要麼過時」。

根據兩位曾在Alexa相關AI工作的人士的說法,語音助手的歷史技術基礎不夠靈活,難以迅速改變,受到笨重和無序的代碼基礎以及「人手不足」的工程團隊的影響。

最初的Alexa軟件是基於2012年從英國初創企業Evi收購的技術,這是一個通過在有限的事實宇宙中搜索以找到正確答案的問答機器,例如當天的天氣或音樂庫中的特定歌曲。

新的Alexa使用多種不同的AI模型來識別和翻譯語音查詢並生成回應,還能識別政策違規行為,例如檢測不當回應和幻覺。構建能在傳統系統和新AI模型之間進行翻譯的軟件是Alexa與大型語言模型整合的一個主要障礙。

這些模型包括亞馬遜的自家軟件(包括最新的Nova模型),以及來自初創公司Anthropic的Claude AI模型,亞馬遜在過去18個月中對其投資了80億美元。

Anthropic的首席執行官Dario Amodei去年告訴《金融時報》,「AI代理最具挑戰性的事情是確保它們安全、可靠和可預測。」

他補充道,代理型AI軟件需要達到「人們能夠真正信任系統」的地步。「一旦我們達到那一點,我們就會發布這些系統。」

一位現任員工表示,還需要更多步驟,例如疊加兒童安全過濾器和測試與Alexa的自定義集成(如智能燈和Ring門鈴)。

這位員工補充道:「可靠性是問題所在——使其幾乎每次都能正常運作。」他表示,「這就是為什麼你會看到我們……或蘋果或谷歌緩慢且逐步推出。」

許多為Alexa開發「技能」或功能的第三方表示,他們不確定新的生成式AI驅動設備何時會推出,以及如何為其創建新功能。

瑞典內容開發商Wanderword的聯合創始人Thomas Lindgren表示:「我們在等待細節和理解。」他表示,「當我們開始與他們合作時,他們的開放性要高得多……隨著時間的推移,他們已經改變了。」

另一位合作夥伴則表示,在亞馬遜最初對開發者施加的「壓力」過後,要求他們開始準備下一代Alexa,事情就變得安靜了。

對於亞馬遜的Alexa團隊來說——該團隊在2023年遭遇重大裁員——一個持久的挑戰是如何盈利。如何使助理「足夠便宜以便大規模運行」將是一個主要任務,據生成式AI團體OctoAI的聯合創始人Jared Roesch所說。

正在討論的選項包括創建一個新的Alexa訂閱服務,或從商品和服務的銷售中抽取一部分收益,前Alexa員工表示。

Prasad表示,亞馬遜的目標是創建一系列AI模型,作為各種應用的「構建基塊」,不僅限於Alexa。

他說:「我們始終關注客戶和實用AI,我們不是為了科學而科學。」他補充道:「我們這樣做……是為了提供客戶價值和影響力,因為在這個生成式AI的時代,這變得比以往任何時候都重要,因為客戶希望看到投資回報。」

從這篇報導中,我們可以看到亞馬遜在轉型過程中面臨的諸多挑戰。儘管公司擁有強大的資源和人才,但在技術整合和創新方面的掙扎顯示出,即使是行業巨頭也無法避免技術進步帶來的複雜性和不確定性。這不僅是對亞馬遜的考驗,也是對整個AI產業的啟示:在追求創新的同時,必須重視技術的可靠性和用戶的信任。隨著AI技術的快速發展,如何在提供便利的同時保障用戶的安全和準確性,將成為未來的關鍵挑戰。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon