Anthropic 現在成為科技巨頭的寵兒——而 OpenAI 的情況則不太樂觀
不久前,OpenAI 和微軟似乎無法被擊敗。然而,現在他們的競爭對手正在迎頭趕上。Anthropic 的 Claude 在模型方面領先,微軟支持的 GitHub 已將 Claude 加入 Copilot,而亞馬遜則將 Claude 集成到 Q Developer(代碼耳語)中。此外,Meta 的 Llama 現在在用戶數量上與 ChatGPT 競爭,並且已成為開源及其他領域的家喻戶曉之名。
同時,OpenAI 的初步反饋顯示出褒貶不一。OpenAI 的 CEO Sam Altman 將這個模型稱為「GPT-2 的推理版本」,並表示其「深有缺陷」。
Anthropic 與 OpenAI 的比較
OpenAI 似乎更專注於擴展語音功能,還有推理能力,特別是為最終用戶提供服務。相比之下,Anthropic 似乎更重視工程和 API 方面的發展。
OpenAI 最近推出了表現豐富、可操控的語音功能,增強了語音對話的體驗,並通過提示緩存降低了成本。文本輸入的價格減少了 50%,音頻輸入則減少了 80%。這一舉措使得高級實時 AI 更加平易近人。
同時,Anthropic 也在 Claude 移動應用上對語音轉錄進行實驗,選定的用戶可錄音長達 10 分鐘。
在 AI 編程方面,OpenAI 也面臨來自 Anthropic 的日益競爭。Anthropic 正在推進其自有工具,以處理複雜的編程任務並自動化代碼生成等操作,然而 Anthropic 最近推出的「電腦使用」功能卻賦予了它一個優勢。
「AI 編程尚未能完全取代工程師,仍需要一些輔導,」Anthropic 的共同創辦人 Daniela Amodei 表示。她還指出,他們的 Claude 模型顯著提升了生產力,可能改變招聘策略。
隨著兩家公司都在爭奪 AI 的主導地位,OpenAI 即將推出的產品可能會影響市場,挑戰像 GitHub Copilot、Cursor 和其他編程助手的產品。
完美的用戶體驗
Anthropic 正在通過專注於屏幕導航來提升用戶與 AI 的互動。上周,該公司推出了功能,使 AI 能夠控制計算機屏幕,從而能夠瀏覽網頁或替用戶輸入文字。
「電腦使用」是一個實驗性的公眾測試功能,通過它,Claude 3.5 Sonnet 現在可以像人類用戶一樣導航計算機界面。這意味著 AI 能夠查看屏幕、移動光標、點擊按鈕和輸入文本,從而執行各種任務。
此外,Anthropic 還在 Claude 中推出了分析工具。用戶可以直接在平台上執行數據分析,運行 JavaScript 代碼。這使得 Anthropic 在 AI 用戶體驗領域取得了顯著的進展。
這個功能也以預覽模式提供,使 Claude 能夠處理複雜的任務,如數據清理和從 CSV(逗號分隔值)文件進行深入分析。旨在幫助各功能團隊提供精確見解,幫助市場營銷人員分析客戶行為,幫助財務團隊創建儀表板。
上個月,Anthropic 使 Claude Artifacts 在 iOS 和 Android 上對所有用戶開放,允許任何人輕鬆創建應用程序而無需編寫一行代碼。
毫無疑問,Anthropic 正在將人類與 AI 的互動提升到一個新的水平。
「儘管 Anthropic 建立的東西仍然需要計算機作為接口,但未來我們可能會擺脫屏幕,使用新型設備或接口與 AI 代理互動。」—— AIM
OpenAI 也未放棄。在 2024 年的 OpenAI DevDay 上,公司的開發者體驗負責人 Romain Huet 展示了 o1-preview 演示,揭示了希望與挫折。
經過三次嘗試,Swift 地圖應用編碼停滯不前,但隨後,一個展示 o1-mini 和 Cursor 的演示成功地控制了一架無人機,並完成了一個驚人的後空翻。
OpenAI 最近還在 ChatGPT 桌面應用上推出了一個先進的語音功能,不久前,還推出了一個新功能,讓用戶可以搜索之前在 ChatGPT 中的對話內容。
此外,OpenAI 昨天推出了其搜索引擎。ChatGPT 的搜索現在提供改進的網頁搜索能力,以便獲取及時、準確的答案,結合自然語言的互動和最新的體育、新聞、股票報價等數據。
語音功能的專家
最近,OpenAI 為開發者推出了一個實時 API,使他們能夠將先進的語音和自然語音對話功能添加到自己的應用程序中。這個 API 使公司能夠構建能夠處理複雜任務的語音驅動客戶服務系統,從預訂旅行到引導用戶使用軟件。
出人意料的是,Anthropic 的 Claude 在這方面幾乎沒有進展。
OpenAI 的確在這方面表現出色。這個新的 API 是 ChatGPT 的先進語音模式與視覺的擴展,並在 API 更新之前幾天推出。它提供了六種不同的語音,並且支持流暢的音頻輸入和輸出選項。
例如,用戶現在可以通過展示冰箱的照片來請求 ChatGPT 提供食譜建議,或通過分享問題的圖片來獲得數學問題的幫助。
這次更新類似於谷歌的對話 AI 助手 Gemini Live。它聲稱能幫助用戶計劃活動、尋求建議、討論歷史事件,甚至探索新的當地話題和想法。
毫無疑問,OpenAI 的 API 更新與依賴多個模型進行語音轉錄和回應的傳統方法形成鮮明對比。它通過 WebSocket 連接到 OpenAI 最新的 GPT-4o 模型,允許開發者根據用戶請求管理功能和回應。
健康公司 Healthify Me 是早期採用者之一,利用這個 API 通過其 AI 教練 Ria 提供實時營養輔導。它使用 OpenAI 的 GPT-4 Turbo,以及名為 Whisper 的語音機器學習模型。
目前,實時 API 的定價基於文本和音頻標記。音頻輸入的價格為每百萬標記 100 美元,而輸出則為每百萬標記 200 美元。OpenAI 還在 API 中內置了強大的安全功能,包括自動濫用檢測和人工審查機制。
OpenAI 計劃在未來擴展 API 的功能,旨在支持視頻和視覺輸入等額外模態。
與 Anthropic 的 Claude Sonnet 3.5 Artifacts 相反,OpenAI 最近推出了 canvas。這是一個用於在寫作和編碼項目中使用 ChatGPT 的新界面。
不出所料,OpenAI 的新 canvas 界面在編碼方面無法與 Anthropic 的 Claude Sonnet 3.5 相提並論,開發者一致偏愛 Claude 在生成、調試和快速學習代碼方面的能力。
「隨需應變的軟件已經到來,」Flexpa 的首席技術官 Joshua Kelly 說,他在幾秒鐘內就用 Claude 創建了一個自定義應用程序,強調 Claude Artifacts 如何使用戶能夠快速開發量身定制的應用程序,推進每個人都能成為潛在應用開發者的願景。
同時,GitHub 也在編碼領域樹立了新標準,推出了多模型陣容——Claude 3.5 Sonnet、Gemini 1.5 Pro,以及 OpenAI 的 o1-mini 和 o1-preview。這為當今的代碼生成需求在 VS Code、Xcode 等平台上帶來了無與倫比的多樣性和開發者選擇,將 GitHub 定位為終極工具包。
金錢的力量
雖然 OpenAI 和 Anthropic 在用戶增長方面均較去年有顯著提升,但其收入生成策略卻呈現出截然不同的做法。
根據上述分析,OpenAI 的大部分收入增長來自於其 AI 模型(如 ChatGPT)的付費訂閱,而 Anthropic 則主要通過 API 服務來賺取收入。
如實時 API 和語音及語音控制等創新使 OpenAI 的收入在 2024 年飆升至 40 億美元,較去年增長 580%。預測顯示,2025 年的預期收益甚至更為驚人,可能達到 116 億美元。
對於 Anthropic 來說,實用性的飛躍促成了收入增長,今年達到 10 億美元,增長了 1000%。與 OpenAI 一樣,這部分收入也主要來自於 API 訪問,滿足尋求無縫 AI 集成的開發者需求。
如果沒有微軟的支持,OpenAI 恐怕難以生存。這家科技巨頭與 OpenAI 的深厚合作關係,目前已投資超過 130 億美元,並預計將面臨每季度 15 億美元的虧損。微軟將此成本歸因於其在 OpenAI 的股權,因為後者面臨著持續的開支以維持其快速增長的軌跡。
這一場 AI 競爭的變化,無疑預示著未來科技的發展將更加多樣化和激烈。OpenAI 和 Anthropic 之間的競爭不僅僅是技術的較量,更是商業模式和市場策略的較量。隨著兩家公司不斷推出創新,未來的市場格局將會如何演變,值得我們持續關注。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。