
UBS看好生成式人工智能推動推理運算需求大幅增長
儘管投資者對關稅及人工智能基建過度投資存憂慮,瑞銀(UBS)仍認為生成式人工智能(genAI)推理運算需求將在各行各業急速擴大。
該行指出,人工智能在宏觀經濟不確定環境下依然具韌性,美國主要科技公司重申資本支出計劃,並強調計算需求持續超越供應。
UBS認為,推理運算——即運行AI模型以產生答案的過程,將成為未來AI計算需求的主要驅動力,超越訓練階段。
Nvidia行政總裁黃仁勳在瑞銀報告中表示:「由於代理式AI和推理,我們所需的計算量比去年同期預期高出100倍以上。」
瑞銀亦認同這觀點,指出「連鎖思維」(Chain of Thought, CoT)等更複雜方法的出現,是推動計算強度增長的關鍵因素。
瑞銀將生成式AI應用分為四大類:聊天機械人、企業AI、代理式AI及實體AI。
以聊天機械人如ChatGPT為例,計算需求預計由2024年的10 exaFLOP/s(每秒10的18次方浮點運算)升至2030年的200 exaFLOP/s。
企業應用方面,如欺詐偵測及合約摘要,推理需求預計增長更快,從15 exaFLOP/s躍升至440 exaFLOP/s。
最誇張的增長來自代理式AI,包括自動客戶支援及工作流程自動化。瑞銀估計此類需求到2030年或達14 zettaFLOP/s(每秒10的21次方浮點運算),較現時數百exaFLOP/s需求大幅提升。
實體AI,如機械人及自動駕駛車輛,隨著模仿人類認知能力的演進,計算需求或達到yottaFLOP/s(每秒10的24次方浮點運算)級別。
目前全球GPU計算容量約4,000 exaFLOP/s,加上Google的TPU後可達5,000 exaFLOP/s,但瑞銀指出大部分仍未充分利用。
GPU記憶體瓶頸令實際運算能力遠低於理論峰值,芯片實際運算能力可能僅達標稱的25%,令現有基礎難以滿足未來特別是代理式及實體AI的需求。
報告解釋:「推理運算經常受限於GPU記憶體,實際浮點運算速度遠低於理論最大值。即使如此,目前容量足以應付聊天機械人需求,但遠遠不足以支持代理式及實體AI,後者需要數量級更高的計算能力。」
綜合來看,瑞銀認為推理運算在AI應用中的角色日益重要,加上硬件需求提升,支持對AI基建的持續投資。
對投資者而言,瑞銀建議:「任何與我們‘AI’及‘電力和資源’相關股票的回調,都可視為吸納良機。」
—
編輯評論:生成式AI推理運算需求爆炸性增長,香港投資者應如何把握機遇?
瑞銀的分析突顯了生成式AI從訓練階段轉向推理運算的趨勢,這不僅反映AI應用由模型建立轉向實際應用的成熟,也顯示出未來AI基建需求將遠超過市場預期。代理式AI和實體AI如自動客服及機械人等領域的龐大計算需求,將推動硬件及雲端基建的革新與擴張。
對香港投資者而言,這是一個值得關注的科技浪潮。香港作為國際金融中心,可透過掌握AI基建及相關科技龍頭企業(如Nvidia、Google等)的投資機會,捕捉這股長線成長動力。同時,香港本地科技創業生態亦應積極融入生成式AI應用,推動本地產業升級。
然而,硬件瓶頸如GPU記憶體限制及資本支出過度的風險亦不可忽視。投資者需謹慎評估企業的技術實力與資本配置效率,避免盲目追高。此外,生成式AI快速發展帶來的倫理、監管挑戰也值得關注,這些都將影響市場走向及企業長遠競爭力。
總括而言,生成式AI推理運算需求的爆炸性增長,預示著新一輪科技基建投資熱潮即將來臨。如何在風險與機遇中找到平衡,將是香港投資者及業界未來的關鍵課題。
以上文章由特價GPT API KEY所翻譯及撰寫。