Google推出超輕量Gemini 1.5 Flash-8B AI

Ai

Google 推出輕量版 Gemini 1.5 Flash-8B,正式上市

Google LLC 宣佈推出其受歡迎的 Gemini 1.5 Flash 人工智能模型的新版本,這個新版本比原版更小、更快。

這個新版本名為 Gemini 1.5 Flash-8B,比原版便宜一半。Gemini 1.5 Flash 是 Google 大型語言模型家族中的輕量版本,經過優化以提高速度和效率,設計用於低功耗設備如智能手機和傳感器。

公司在 2024 年 5 月的 Google I/O 大會上宣佈了 Gemini 1.5 Flash,並在幾週後向一些付費客戶推出,隨後通過 Gemini 移動應用免費提供,但有限制使用。

在六月底,這款模型終於正式上市,提供具有競爭力的價格和 100 萬個 token 的上下文窗口,並結合高速處理能力。Google 指出,該模型的輸入大小是 OpenAI 的 GPT-3.5 Turbo 的 60 倍,平均速度快了 40%。

原版設計旨在提供非常低的 token 輸入價格,使其對開發者具有價格競爭力,並被如 Uber Technologies Inc. 等客戶採用,用於該公司 UberEats 食品配送服務中的 Eats AI 助手。

藉著 Gemini 1.5 Flash-8B,Google 推出了市場上最實惠的輕量大型語言模型之一,價格降低了 50%,速率限制翻了一倍。此外,該模型在處理小提示時還提供更低的延遲。

開發者可以通過 Gemini API 和 Google AI Studio 免費訪問 Gemini 1.5 Flash-8B。

在一篇博客文章中,Gemini API 高級產品經理 Logan Kilpatrick 解釋說,公司在改進 1.5 Flash 模型方面取得了“可觀的進展”,考慮了開發者的反饋並“測試了這些輕量大型語言模型的極限”。

他解釋說,公司上個月宣佈了一個實驗版本的 Gemini 1.5 Flash-8B。經過進一步改進,現在已經可以用於生產用途。

根據 Kilpatrick 的說法,8-B 版本在許多關鍵基準上幾乎能匹敵原版 1.5 Flash 模型,特別在聊天、轉錄和長上下文語言翻譯等任務中表現出色。

“我們最好的小型模型的發布仍然受到開發者反饋和我們自己對這些模型可能性的測試的啟發,”Kilpatrick 補充說。“我們看到這個模型在從高容量多模態用例到長上下文摘要任務的任務中最有潛力。”

Kilpatrick 還補充說,Gemini 1.5 Flash-8B 提供了迄今為止所有 Gemini 模型中最具成本效益的智能:

價格與 OpenAI 和 Anthropic PBC 的同類模型相比具有競爭力。在 OpenAI 的情況下,其最便宜的模型仍然是 GPT-4o mini,價格為 $0.15/1M 輸入,但對於重複使用的提示前綴和批量請求,價格會降至 50%。同時,Anthropic 最實惠的模型是 Claude 3 Haiku,價格為 $0.25/M,但對於緩存 token,價格降至 $0.03/M。

此外,Kilpatrick 表示,公司正在將 1.5 Flash-8B 的速率限制翻倍,旨在使其在簡單、高容量任務中更加有用。因此,開發者現在每分鐘可以發送多達 4,000 個請求,他說。

編者評論:Google 最新推出的 Gemini 1.5 Flash-8B 為輕量級人工智能模型市場帶來了顯著的競爭優勢。這不僅體現了技術進步的速度,還展示了大公司在滿足市場需求方面的靈活性。對於香港的開發者來說,這不僅意味著更低的開發成本,還提供了更多創新應用的可能性。特別是在高容量和多模態用例中,這個模型的潛力不可忽視。Google 的這一步驟,也顯示出在 AI 發展競賽中的領先地位,其他競爭者如 OpenAI 和 Anthropic 必須加緊步伐迎頭趕上。這對整個 AI 行業來說,是一個值得期待的積極信號。

以上文章由特價GPT API KEY所翻譯

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *