阿里雲AI新模組挑機DeepSeek,仲贏埋GPT-4o?

Ai

阿里巴巴推出新AI模型,針對競爭對手DeepSeek,中國最熱門的初創公司

阿里巴巴集團控股於週三發布了其升級版的Qwen人工智能(AI)模型,並表示該模型在某些基準測試中「全面超越」了DeepSeek-V3,這是中國最熱門的初創公司於去年12月推出的大型語言模型(LLM)。

在一份發佈於微信的聲明中,這家電商巨頭的雲計算和AI部門阿里雲表示,新的Qwen 2.5-Max模型在LLM性能基準平台Arena-Hard和LiveBench上也超越了OpenAI的GPT-4o和Meta Platforms的Llama-3.1-405B。阿里巴巴擁有《南華早報》。

根據阿里雲的資料,Qwen 2.5-Max的基準性能與Anthropic的Claude-3.5-Sonnet模型相當。LLM是支撐像ChatGPT這類生成AI服務的技術。

阿里巴巴的多模態模型提供了多種大小,從30億到720億參數不等,並包括基礎版本和指令調整版本。旗艦模型Qwen2.5-VL-72B-Instruct現在可以通過Qwen Chat平台訪問,而整個Qwen2.5-VL系列則可在開源平台Hugging Face和阿里巴巴自己的開源社區Model Scope上獲取。

參數是機器學習中的一個術語,指在AI系統訓練過程中出現的變量,這有助於確定數據提示如何產生所需的輸出。開源則是指公眾可以訪問軟件程序的源代碼,允許第三方開發人員修改或分享其設計,修復故障鏈接或擴展其功能。

這篇報導展示了阿里巴巴在AI領域的最新進展,尤其是在與競爭對手DeepSeek的對抗中取得的成就。值得注意的是,阿里巴巴的Qwen 2.5-Max模型不僅在基準測試中表現突出,還能與全球知名的AI模型如OpenAI的GPT-4o和Meta的Llama-3.1-405B相抗衡,這顯示出中國科技企業在AI技術上的迅速追趕。

然而,這場AI競爭不僅限於技術的提升,還涉及到市場策略和用戶需求的深刻理解。阿里巴巴強調其產品的開源特徵,這不僅能吸引開發者社群的參與,還有助於加速技術的創新和應用。隨著AI技術的普及,未來的競爭將越來越激烈,企業如何在這個快速變化的市場中保持領先,將成為重要的挑戰。

此外,阿里巴巴的這一舉措也反映了中國在全球AI領域的崛起,這不僅是科技的進步,更是整個行業生態系統的發展。隨著AI技術的日益成熟,未來可能會出現更多創新應用,改變我們的生活和工作方式。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon