IBM的新企業AI模型比OpenAI或Google的更強大
IBM最近推出了其Granite 3.1大型語言模型(LLM),這是一種比以往更強大且開源的企業AI工具,標誌著其在開放源代碼領域的持續努力。Granite 3.1是Granite 3.0的最新一代模型,提供了針對商業應用優化的增強功能和性能。
Granite 3.1系列模型擁有令人印象深刻的128K令牌上下文窗口,這比其前身有了顯著增長。這種擴展使得模型能夠處理和理解更大數量的文本,相當於約85,000個英語單詞,從而能夠進行更全面的分析和生成任務。相比之下,OpenAI的ChatGPT 3僅能處理2,000個令牌,顯示出IBM在此領域的優勢。
超越競爭對手
IBM聲稱其新的Granite 8B Instruct模型在HuggingFace的OpenLLM排行榜基準測試中超越了競爭對手,如Google Gemma 2、Meta Llama 3.1和Qwen 2.5。
Granite 3.1系列包括密集模型和專家混合(MoE)變體。IBM表示,其Granite 2B和8B模型是基於超過12萬億數據令牌訓練的文本專用密集LLM,旨在支持基於工具的使用案例以及檢索增強生成(RAG),以簡化代碼生成、翻譯和錯誤修正的過程。
MoE模型則基於超過10萬億的數據令牌進行訓練,IBM宣稱這些模型非常適合在延遲低的設備上進行部署。
改進的圖形和語言能力
此次新版本還引入了圖像輸入/文本輸出功能,擴大了模型在處理圖形方面的應用範圍。Granite 3.1還提供了更強的外語能力,除了英語外,還可以處理德語、西班牙語、法語、日語、葡萄牙語、阿拉伯語、捷克語、意大利語、韓語、荷蘭語和簡體中文等十幾種語言。簡而言之,如果你的業務是國際化的,IBM提供的LLM將非常適合你。
如同以往,新推出的Granite LLM均在Apache 2開源許可下進行授權。IBM堅持開放的承諾,公開了訓練數據集並提供了詳細的模型開發和性能文檔。
如果你對知識產權問題和AI有顧慮,IBM提供了對第三方知識產權索賠的無上限賠償。或許你目前對這些潛在的法律問題不以為然,但我可以保證,未來你會開始關注這些問題。
為企業提供強大且可靠的AI
Granite 3.1模型可在IBM的Watsonx平台上獲得,並可通過Google Vertex AI等雲服務提供商,以及Hugging Face、NVIDIA(作為NIM微服務)、Ollama和Replicate等AI平台使用。
Granite 3.1的發布預示著企業環境中AI採用的加速。通過將這些模型與專有數據結合,使用IBM的InstructLab等技術,企業可以在成本的極大降低下實現與大型模型相媲美的任務專用性能。
在快速發展的AI領域中,IBM的Granite 3.1代表了為企業提供強大、高效和可靠的AI工具的一個重要進步,這將促進創新並解決複雜的商業挑戰。
—
在這篇文章中,我們可以看到IBM在企業AI領域的積極進取,尤其是在開源和性能上不斷超越競爭對手。這不僅能夠提高企業的運營效率,還可能改變商業模式,讓更多中小企業也能夠利用AI技術。隨著AI技術的普及與發展,企業在選擇AI解決方案時將面臨更多的選擇與挑戰,如何在性能、成本和合規性之間找到平衡,將成為未來企業成功的關鍵。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。