企業私有RAG部署 教你零碼打造安全智能助手

🎬 YouTube Premium 家庭 Plan成員一位 只需
HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放


立即升級 🔗

企業級本地RAG解決方案全攻略:用Ollama、PostgreSQL及BladePipe打造私有智能問答系統

隨着企業對AI智能應用需求不斷增加,Retrieval-Augmented Generation(RAG)已經成為企業級應用的重要一環。不過,企業對數據安全、可控性、可擴展性及合規性的要求遠高於一般個人或小型Q&A系統。尤其在法律、金融等高度敏感行業,將內部數據傳送到公有雲端服務或第三方向量數據庫,往往會構成致命的資訊外洩風險。

為了解決這些痛點,BladePipe現已支援結合Ollama,讓企業能夠完全在本地部署RAG服務。本文將以零代碼方式,逐步示範如何建構一個真正「全私有、可投入生產」的RAG應用。

什麼是企業級RAG服務?

企業級RAG不僅僅是「聰明的問答」,更強調數據全流程整合、嚴格控制及與業務系統深度對接,帶來真正的自動化與智能化價值。與個人或研究型RAG不同,企業級方案有以下四大特點:

全私有堆疊:所有組件必須在本地或私有雲運行,數據絕不離開企業邊界。
多元數據源:不再局限於純文字檔,支援數據庫等多種格式。
增量同步:業務數據隨時更新,向量索引需自動保持同步。
工具調用整合(類MCP能力):不只檢索與生成,還能調用SQL查詢、函數、工作流等業務工具。

BladePipe RagApi簡介

BladePipe的RagApi整合了向量檢索與LLM問答能力,並支援MCP協議,幫助用戶快速啟動自家RAG服務。相比傳統自建方式,RagApi有以下優勢:

兩步DataJob即建RAG服務:一個導入文件,一個發布API。
零代碼部署:全程可配置,無需寫程式。
參數靈活調整:如向量top-K、匹配閾值、prompt模板、模型溫度等。
多模型多平台支援:如阿里雲DashScope、OpenAI、DeepSeek等。
OpenAI兼容API:可與現有聊天UI或工具鏈無縫對接。

實戰示範:全私有、安全的RAG服務搭建

本地RAG方案組件如下:

Ollama:本地模型推理及embedding。
PostgreSQL:本地向量存儲。
BladePipe RagApi:RAG服務構建與管理。

本地RAG架構流程圖

準備工作

1. 本地運行Ollama
– 下載Ollama後,執行 `ollama run deepseek-r1`,即可拉取並運行適合embedding及推理的模型(請注意大型模型對硬件資源要求較高)。
Ollama運行界面

2. 設置PGVector
– 安裝Docker(視乎系統選用不同安裝方式)。
– 啟動PostgreSQL+pgvector容器服務,一鍵部署並自動啟用pgvector擴展,確保embedding數據可安全本地存儲。

3. 部署BladePipe(企業版)
– 下載並根據指引修改docker-compose配置,開放所需端口,然後啟動服務。

RAG構建流程

1. 添加數據源
文件(SshFile):設定伺服器IP、帳號密碼及文件路徑,支援多種文件格式。
添加文件數據源
向量數據庫(PostgreSQL):配置本地端口、帳號密碼。
配置向量數據庫
LLM(Ollama):設置本地地址及embedding/chat參數。
設置Ollama
RagApi服務(BladePipe):設置本地端口及API Key。
設置RagApi

2. DataJob 1:文件向量化
– 選擇SshFile為來源,PostgreSQL為目標。
– 選取要處理的markdown文件,統一表名如`knowledge_base`,指定Ollama作embedding模型。
– 在數據處理頁選擇要embedding的字段,一鍵批量設置。
選擇文件
設置embedding欄位

3. DataJob 2:構建RagApi服務
– 選擇PostgreSQL為來源,RagApi為目標。
– 選擇向量表,指定Ollama作embedding及chat模型,完成後一鍵創建。
設置RagApi

4. 測試API
– 可用curl或CherryStudio等工具測試OpenAI兼容API,驗證RagApi已可正常回應查詢。
CherryStudio設置
RagApi問答效果

總結與評論

企業級RAG服務的核心價值,在於數據安全、可控性及與業務流程的深度整合。BladePipe聯手Ollama,為企業提供了一條低門檻、高彈性的本地RAG部署路徑,既能保障數據永不外洩,亦方便與現有系統無縫對接。

從技術層面看,這種方案最大亮點在於:
– 以「零代碼」方式降低部署門檻,讓IT部門甚至業務部門都能主導AI應用落地。
– 支援多數據源、增量同步,確保知識庫能隨業務變化自動更新。
– OpenAI兼容API設計,方便快速接入各類前端聊天或自動化工具。

值得深思的是,隨着AI大模型逐步走向本地化、私有化,企業將更有能力把AI能力內嵌於自身業務核心。這不單是安全合規的需求,更是企業數字化轉型的新起點。未來,RAG不再只是「問答」工具,而會成為企業知識管理、流程自動化、決策支持的基石。香港企業若能及早佈局,未來在AI時代的競爭力將大大提升。

BladePipe Logo

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
Edit the uploaded photo (face based on the reference photo). Ensure the face remains consistent with the person in the uploaded image, without changing facial structure, skin tone . Create a Create an 8K ultra-realistic image of woman dancing joyfully in the rain at night, wearing a white sleeveless dress that flares out as she twirls. She has a bright, happy expression on her face. The background features softly glowing streetlights reflecting on a wet surface, creating a warm, shimmering ambiance. The rain is falling steadily, adding a dynamic and lively atmosphere to the scene.Using a Canon EOS R camera with a 50mm f/1.8 lens, f/2.2 aperture, shutter speed 1/200s, ISO 100 and natural light, Full Body, Hyper Realistic Photography, Cinematic, Cinema, Hyper detail, Ultra hd, Color Correction, ultra hd, hdr , color grading, 8k. 一隻在香港茶餐的喝奶茶的貓 A futuristic humanoid male with eyes closed, illuminated by glowing turquoise bio-energy lines flowing across his face, hair, and upper body. Ultra-detailed anatomical light patterns resembling neural circuits and energy veins. Soft volumetric rim-lighting, dark sci-fi background, ethereal glow, hyper-realistic skin texture, holographic aura. High-definition digital art, surreal yet serene expression, sleek hair highlighted by luminous strands. Cinematic lighting, 8K resolution, ultra-sharp, moody and atmospheric composition.