字节发布豆包實時語音模型 國內AI應用有望迎井噴式發展
字节跳动即將推出最新的實時語音大模型,並將根據該模型在豆包App上全面上線實時語音通話功能。目前,豆包App已經在小範圍內測試最新的功能,部分用戶在實時通話界面已經更新。此前,業內曾有消息指出豆包將推出最新的情感語音大模型,測試效果超過GPT-4o。據了解,這一傳言提及的模型正是上述的實時語音模型。最新模型通過統一建模語音生成和理解,相較於以往的ASR+LLM+TTS級聯方式,在對話效果上有了顯著提升,實時交互不僅延遲低,也能流暢地進行打斷。
根據火山引擎2024冬季force原動力大會披露的數據,豆包大模型的日均調用量正在快速增長,2024年5月的日均tokens調用量為1200億,7月增長至5000億,9月達到1.3萬億,截至2024年12月15日已經突破4萬億,在短短7個月內增長超過33倍。中信證券表示,豆包大模型的表現超出預期,顯示字節跳動在AI領域的投入已經形成正反饋,國內AI產業在追趕海外的過程中,效果開始顯現,國內的龍頭企業有望加速在AI領域的布局。
根據財聯社主題庫的數據,與此相關的上市公司中:
海天瑞聲在互動平台上回覆表示,字節跳動一直是公司的重要客戶,公司為其提供智能語音、計算機視覺及自然語言等各類數據產品或服務。
樂鑫科技在投資者關係活動中表示,公司正在聯合推廣豆包大模型在IoT設備的相關應用方案。
關聯個股
樂鑫科技-0.39% 海天瑞聲+3.90%
這項技術的推出不僅是字节跳动在AI領域的一次重大進展,也可能改變我們日常溝通的方式。隨著實時語音技術的成熟,企業和用戶能夠以更高效的方式進行交流,這將對各行各業產生深遠的影響,特別是在客戶服務和遠程協作方面。此外,這也為AI技術的普及和應用提供了新的機會,未來我們可能會看到更多企業將AI集成到他們的日常運營中,從而提升整體效率與用戶體驗。
然而,值得注意的是,隨著技術的迅速發展,相關的隱私和安全問題也不容忽視。用戶在享受便利的同時,應該對自己數據的安全性保持警惕,企業也應加強對數據保護的重視,以建立用戶的信任。
以上文章由特價GPT API根據網上資料所翻譯及撰寫,過程中沒有任何人類參與 🙂