Nvidia內部備忘錄透露:Capital One考慮AWS替代方案,擔心AI成本「失控」
據Business Insider獨家取得的一份Nvidia內部文件顯示,金融機構Capital One正因對亞馬遜雲端服務(AWS)在人工智能(AI)領域的成本擔憂,而積極尋找替代方案。
這份由Nvidia員工撰寫的備忘錄透露,該公司曾與Capital One討論過AI基礎設施的其他選擇。Capital One擔心隨著AI需求增加,AWS的費用可能會迅速攀升,難以控制。備忘錄中提到,Capital One預計對GPU和推理模型的需求將持續增長,而在AWS上的花費「很快就會失控」。
Nvidia與Capital One還討論了所謂的「AI工廠」和「新雲」(neo-clouds)概念。AI工廠指的是企業自行架設的數據中心,用於訓練和運行AI模型,作為租用第三方計算資源的替代方案。金融機構利用此類基礎設施可應用於反欺詐、客戶支援及算法交易等多個領域。另一方面,新雲是由Nvidia硬件支持的初創雲端供應商,專注於AI工作負載,與AWS這種涵蓋更廣泛計算需求的雲服務形成對比。主流的新雲供應商包括CoreWeave、Lambda、Crusoe及Nebius等,Nvidia正與這些新雲供應商密切合作,以減少對傳統大型雲端巨頭的依賴。
Capital One的情況凸顯了AI熱潮中的一個重要趨勢:企業在急速採用生成式AI技術的同時,也在努力抑制飆升的雲端運算成本。雖然AI技術潛力巨大,但建置和運行AI模型的成本不容小覷。根據RBC Capital的報告,目前有43%的企業使用超過兩個公有雲供應商,顯示多雲策略已成為常態,以優化成本和性能。
對此,Capital One發言人表示:「我們仍然致力於AWS作為我們主要的戰略雲端合作夥伴。」AWS方面則強調,他們持續努力降低成本,並將節省回饋給客戶,但同時指出真正降低價格並非易事,需要付出巨大努力。
值得注意的是,Capital One並非唯一對AWS成本表示關切的企業。早前Business Insider報導指出,許多AI初創公司正推遲在AWS上的傳統支出,轉而投入更多資源於AI模型和開發者工具。Amazon內部文件顯示,Radical Ventures旗下90%的初創公司主要選擇競爭對手的雲服務,原因正是AWS的成本問題。此外,市場對新雲供應商的需求也在增加,因為它們允許用戶按需租用GPU資源,避免不必要的浪費。
AWS對此回應稱,相關報導使用的是「過時數據」,強調AWS依然是初創企業的首選,因其提供最優質的核心服務和最具創新力的生成式AI產品。
—
評論與見解
Capital One作為美國大型金融機構,其對AWS AI成本的擔憂,反映出企業在追求AI創新與成本控制之間的矛盾。隨著生成式AI應用日益普及,GPU等高性能計算資源需求激增,雲端計算的成本壓力成為企業不得不面對的現實問題。這也推動企業重新思考雲端架構,尋求包括自建AI工廠及採用新興新雲供應商等多元解決方案。
這種趨勢對AWS等傳統雲端巨頭構成挑戰,迫使它們不僅要在技術上保持領先,更需在價格策略上做出調整,以防客戶流失。與此同時,Nvidia積極推動新雲生態系,既有助於分散市場風險,也彰顯硬件供應商在AI產業鏈中的新定位——不僅是晶片供應商,更是整體解決方案的促成者。
對香港及亞洲市場而言,這場「AI雲端成本之戰」同樣值得關注。金融及科技企業如何平衡創新與成本,選擇合適的AI訓練與推理基礎設施,將直接影響其在全球AI競爭中的地位。此外,多雲及混合雲策略的興起,也提醒本地企業在採用AI技術時,需具備更靈活的雲端資源管理能力,避免被單一供應商綁死。
總括而言,這份Nvidia備忘錄不僅揭示了AI技術發展的前線動態,更反映出產業鏈各方在成本、技術和戰略上的博弈。未來,隨著AI應用越趨廣泛,如何有效控制雲端成本,將成為企業能否長期保持競爭力的關鍵。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。