企業應否投資細小語言模型(SLMs)?專家意見分歧
「你點揀?係想要一個高度針對性同專業嘅模型,定係想要一個較為通用嘅?」有專家提出疑問。
隨著大型語言模型(LLMs)如OpenAI嘅ChatGPT同Google嘅Gemini大行其道,大家都好關心細小語言模型(SLMs)係咪可以以較低成本,達到大型模型嘅效果。對IT專業人士嚟講,決定用唔用SLMs,可能會對機構產生重大影響。
Unthread公司CEO Tom Bachant指出,SLMs未必係企業應用聊天機械人同其他AI工具嘅終極方案,特別係消費者對LLMs嘅期待咁高嘅情況下。「你都要畀大型語言模型接觸啲數據,呢點本身唔係壞事,企業而家已經做緊。佢哋會透過Workato或者Zapier等工具,將唔同平台嘅數據連接起來分享。」
細小語言模型唔係大型模型嘅縮小版
根據Hugging Face嘅介紹,SLMs專為資源有限嘅環境設計,例如嵌入式系統、低功耗電腦同智能手機等。佢哋透過知識蒸餾(knowledge distillation)技術訓練,即係由大型模型轉移知識到較細模型;另外透過量化(quantization)降低計算中使用嘅數值精度,例如只用整數。雖然SLMs嘅知識同能力有限,準確度可能較低,但佢哋喺聊天機械人、邊緣運算、語言翻譯同內容生成等應用仍有用武之地。
ServiceNow全球產品管理及AI副總裁Dorit Zilbershot表示,SLMs適合需要高度準確性嘅專門任務,例如使用特定公司術語嘅聊天機械人,但呢類需求係視乎具體情況而定。「我會同客戶講,SLM識做某啲特定任務,但永遠寫唔到法文詩;大型語言模型就可以幫你總結事件,雖然未必完全符合IT服務管理嘅要求,或者完全理解IT術語,但佢亦可以寫法文詩。」
對IT專業人士嚟講,呢種專門化可能足夠成為推動SLMs納入技術架構嘅理由。
—
評論與深度分析
SLMs嘅出現,反映咗AI應用嘅多元化趨勢,唔係所有場景都需要「一體適用」嘅超大型模型。企業面對AI選擇時,唔應盲目追求最大、最強,而係根據實際業務需求同資源限制,靈活部署合適嘅模型。SLMs喺資源受限環境同特定專業任務上有明顯優勢,可以減低運算成本同數據暴露風險,對於數據敏感度高或基礎設施有限嘅企業尤其重要。
不過,SLMs嘅限制亦提醒企業需慎重評估應用範圍,避免過度依賴而影響用戶體驗。大型模型仍有不可取代嘅通用性同創造力,未來或可透過混合模型架構,結合SLMs嘅專精同LLMs嘅廣泛能力,達至最佳平衡。
總括而言,企業喺AI投資上,要跳出「大即係好」嘅思維,將技術同業務目標緊密結合,制定多元策略。SLMs係一個值得關注嘅方向,但成功關鍵係「用得啱、用得精」,而唔係盲目追求規模或流行。對香港企業尤其重要,因為本地IT環境同資源限制更需靈活應用AI技術,才能保持競爭力。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。