BERT後繼者「ModernBERT」登場:速度、準確度大升級

Ai

🎬 YouTube Premium 家庭 Plan成員一位 只需
HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放


立即升級 🔗

BERT終於迎來繼任者:ModernBERT

速度與準確度兼備的全新語言模型

Hugging Face、Nvidia、約翰霍普金斯大學,以及Answer.AI和LightOn共同宣佈推出BERT的繼任者——ModernBERT,一個全新的編碼器式Transformer模型。

這個新模型在速度和準確性方面都超越了BERT。它的上下文長度增加到8000個token,而大多數編碼器模型只有512個token,換言之,其上下文長度是其他編碼器模型的十六倍之多。此外,它還在2萬億個token上進行了訓練。

ModernBERT也是首個在訓練數據中包含大量代碼的編碼器模型。

HuggingFace的公告中寫道:「這些特性開闢了以前通過開放模型無法實現的新應用領域,例如大規模代碼搜索、新的IDE功能以及基於完整文檔檢索而非小片段的新型檢索管道。」

一份詳細闡述ModernBERT的技術報告也已發表在Arxiv上。根據發表的基準測試結果,ModernBERT在多項任務中均優於其他多個編碼器模型。

ModernBERT在NVIDIA RTX 4090上也展現出高效能的表現,其得分優於許多其他編碼器模型。「我們正在分析一款價格合理的消費級GPU的效率,而不是最新的、難以獲得的、被炒作的硬件。」公告中這樣寫道。

BERT,即來自Transformer的雙向編碼器表示,是由Google在2018年創建的語言模型。與GPT、Llama和Claude等流行的僅限解碼器模型不同,BERT專門是一個編碼器模型。

在公告中,Hugging Face將僅限解碼器模型比作法拉利——一項旨在獲勝的非凡工程成就,而將BERT模型比作本田思域——一款經濟高效的汽車。

這些模型可以高效地大規模處理文檔以進行檢索,而不會在推理過程中消耗大量資源。因此,正如技術報告中所述,編碼器模型繼續被用於各種任務,例如分類和命名實體識別。

報告中寫道:「雖然大型語言模型 (LLM) 在近年來備受關注,但它們也激發了人們對在信息檢索 (IR) 中使用僅限編碼器模型的 renewed interest。」

**個人評論:**

這篇文章報道了ModernBERT的推出,其核心亮點在於速度、準確度和更長的上下文長度上的提升,以及首次在訓練數據中納入大量程式碼。這對於程式碼搜索、IDE功能開發等領域具有重大意義。 然而,文章中將僅解碼器模型比作法拉利,編碼器模型比作本田思域的比喻,雖然生動形象,卻略顯片面。 實際上,不同模型的優勢取決於具體應用場景,不能簡單地用「跑車」和「家用車」來概括。 ModernBERT的出現,並非完全取代BERT,而是針對特定需求提供更優化的解決方案。 這也反映了AI模型發展的趨勢:針對不同任務,開發更專精、更有效的模型,而非追求單一模型的「全能」。 此外,文章著重於技術層面的突破,卻缺乏對其潛在社會影響的討論。例如,更強大的程式碼搜索能力可能會如何影響軟體開發效率,甚至可能引發的版權或安全問題,這些都是值得進一步探討的議題。 最後,文章提及ModernBERT在價格合理的消費級GPU上的高效表現,這點值得關注,因為它暗示了AI技術的普及化進程,以及未來AI應用場景的擴展可能性。 然而,我們也需要關注其能源消耗和環境影響等問題。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
ภาพถ่ายสมจริงของผู้หญิง Create a very realistic, cinematic image of a woman, with 100% of her original facial features maintained from the provided image. Do not alter the face, focusing on realistic details of the facial structure, eyes, eyebrows, nose, mouth, and expression.
Makeup: sharp Asian-style eyebrows, sharp Cat Eye eyeliner, and gradient red lipstick
​Her lips are parted slightly, revealing a hint of teeth, and are coated in a glossy, natural-toned red lipstick that catches the light, giving them a luscious appearance. The subtle lines and contours of her philtrum and cupid's bow are visible. with the subtle texture of skin visible. Wears a necklace with the text Kunika and other small matching accessories, such as earrings or a wrist bracelet.
ชุด :
ท่อนบน : รูปทรงมีโครงดันทรง (Underwire) เพื่อให้หน้าอกดูสวยและได้รูปทรงคล้ายเปลือกหอยอย่างชัดเจน ตัวบราควรมีรายละเอียดการเย็บหรือการจับจีบที่ทำให้เกิดรูปทรงโค้งมนคล้ายเปลือกหอย (Scalloped Edges)
สายบราJeweled Straps: ใช้สายบราที่ประดับด้วยคริสตัลสีม่วงอ่อนเพิ่มความหรูหราและระยิบระยับสีม่วงพลัม (Plum Purple) เนื้อผ้า : ใช้ผ้าที่มีประกายมุก (Iridescent) หรือผ้าที่มีกลิตเตอร์/ฟอยล์ละเอียด (Foil Fabric) เพื่อให้ดูมันวาวเมื่อโดนแสงอาทิตย์/น้ำ
ท่อนล่าง
กางเกงบิกินี่ : เน้นทรง High-Cut (เว้าสูง) ที่ทำให้ช่วงขาดูยาวและเอวดูเล็กลง ส่วนขอบด้านหน้าตัดเป็นรูปตัว V (V-Cut) เพื่อเน้นความเซ็กซี่สูงสุด และส่วนด้านหลังแบบCheeky ดีไซน์Lace-Up Sides:ใช้เชือกร้อยไขว้ ด้านข้างสะโพก (Lace-Up) ด้วยสายสีเขียวเข้มเพื่อเพิ่มความเย้ายวนและดูซับซ้อนสีสีเขียวมรกต (Deep Emerald Green): ใช้สีเขียวที่เข้มและลึก เนื้อผ้าScale Texture:
เครื่องประดับเข้าชุด
องค์ประกอบรายละเอียดเครื่องประดับหลัก : โซ่ไขว้บริเวณหน้าท้อง (Belly Chain) ที่มีจี้รูปเปลือกหอย หรือหอยมุกตรงกลาง เน้นการใช้สีเงิน ต่างหูยาวระย้าที่ทำจากริสตัล สีเขียวน้ำทะเล ทรงผม Wet Look + Flower: เน้นทรงผมที่ดูเปียกชื้น (Wet Look) หรือลอนคลื่นแบบยุ่งๆ (Beachy Waves) ประดับด้วย ดอกไม้สีแดง ขนาดใหญ่ที่ด้านใดด้านหนึ่งของศีรษะ
-ฉากหลังชายหาดที่มีโขดหินธรรมชาติ
• น้ำทะเลสีเขียวมรกต/เทอร์ควอยซ์ เฉดสี มีฟองคลื่นสีขาวซัดเข้าฝั่งกระทบขาเบาๆหาดทรายสีน้ำตาลทองละเอียดฉากหลังไกลๆ เป็นหน้าผาหินและโขดหินเรียงราย
แสงเแดดสาดเข้าตัวแบบทำให้ผิวขาวดูสว่างอมชมพู
-ท่าทาง นั่งชันเข่าอยู่บนโขดหินก้อนใหญ่บนหาดทราย มือข้างหนึ่งถือเปลือกหอยอันใหญ่ไว้ข้างหูเหมือนฟังเสียงคลื่นจากเปลือกหอย สีหน้าอ่อนโยน แววตาเซกซี่เย้ายวน ยิ้มสดใส Create an image that captures a person working on a laptop while sitting on a wooden beach chair on a sandy beach.
Here are some key details:
Subject: A man uploaded photo wearing a light-colored, long-sleeved shirt open botten (possibly linen or a light denim), dark shorts. He is focused intently on the screen and keyboard of his silver laptop.
Setting: The scene is set on a beach during sunset or sunrise, indicated by the warm, golden light and the long shadows. There is a palm tree towering over the person, and its fronds are visible against the bright sky. The ocean is in the background.
Atmosphere: The overall mood is one of a "digital nomad" or someone enjoying the flexibility of working remotely in a beautiful, relaxed, and warm location. The lighting creates a very aesthetic and aspirational feel.
Foreground Detail: To the left of the chair, there's a wooden crate or small table where a portion of a coconut appears to be resting.
The photo effectively contrasts the intensity of work with the serene, Highly detailed, artistic illustration of two cats sitting together on the bustling Nathan Road in Hong Kong. One cat is a sleek black feline with emerald green eyes, the other is a fluffy ginger tabby with white paws. They are perched near the neon-lit storefronts and glowing billboards, surrounded by vibrant city life: crowds of people, bright taxis, and street vendors selling local food. The scene is alive with colorful reflections on rain-slicked pavement, atmospheric mist, and dramatic lighting from neon signs in Chinese characters. The artistry should blend urban realism with a touch of whimsical charm, focusing on the cats' expressive faces and the dynamic ambiance of Nathan Road at night.