MCP Local Rag
M

MCP Local Rag

一個完全在本地運行的隱私優先文檔搜索服務器,通過MCP協議為AI編程工具提供語義搜索功能,無需API密鑰或雲端服務,所有數據處理均在用戶計算機上完成。
2.5分
0

什麼是MCP Local RAG?

MCP Local RAG是一個本地文檔智能搜索系統,它使用AI技術理解您文檔的內容含義,而不僅僅是關鍵詞匹配。您可以將PDF、Word文檔、文本文件等上傳到系統中,然後使用自然語言提問,系統會找到最相關的文檔片段並返回給您。所有處理都在您的計算機上完成,確保數據隱私和安全。

如何使用MCP Local RAG?

使用過程分為三個簡單步驟:1) 配置MCP服務器到您的AI工具(Cursor/Codex/Claude Code);2) 上傳您的文檔到系統中;3) 使用自然語言搜索文檔內容。系統會自動處理文檔分割、語義理解和智能檢索。

適用場景

特別適合需要處理敏感或機密文檔的場景,如:企業內部技術文檔、客戶合同、研究論文、個人筆記、法律文件等。當您需要快速查找文檔中的特定信息,但又不能將文檔上傳到雲端服務時,這是理想的選擇。

主要功能

文檔上傳與處理
支持PDF、DOCX、TXT和Markdown格式。自動提取文本內容,智能分割成可搜索的片段,並生成語義向量。重新上傳同一文件時會自動替換舊版本,避免數據重複。
語義搜索
使用自然語言進行語義搜索,理解查詢的深層含義而非簡單關鍵詞匹配。例如搜索'身份驗證流程'也能找到包含'登錄方法'或'憑證驗證'的相關內容。
文件管理
查看所有已上傳的文件列表,包括文件路徑、處理時間和生成的片段數量。幫助您瞭解系統中已索引的內容。
文件刪除
從系統中永久刪除文檔及其所有相關數據。當文檔過時或包含敏感信息需要移除時使用此功能。
系統狀態監控
查看系統運行狀態,包括文檔總數、片段總數、內存使用情況和運行時間。幫助監控性能和排查問題。
完全離線運行
首次使用時下載模型文件(約90MB)後,所有操作都在本地完成,無需網絡連接。確保數據隱私和隨時可用性。
優勢
🔒 完全隱私保護:所有數據處理都在本地進行,文檔永遠不會離開您的計算機
💰 零使用成本:沒有API調用費用,無限次搜索不產生額外成本
🌐 離線可用:下載模型後無需網絡連接即可使用
⚡ 快速響應:查詢通常在3秒內返回結果,即使有數千個文檔片段
🔄 自動更新:重新上傳文檔時自動替換舊版本,保持數據最新
侷限性
📁 文件格式有限:目前僅支持PDF、DOCX、TXT、MD格式,不支持Excel、PPT或圖像OCR
💾 本地存儲需求:需要足夠的磁盤空間存儲模型文件(~120MB)和向量數據庫
⚙️ 配置步驟:需要在AI工具中配置MCP服務器,對非技術用戶可能有一定學習成本
🔍 搜索精度:本地模型精度可能略低於大型雲服務,但對大多數文檔搜索足夠
🌍 語言支持:默認模型針對英語優化,其他語言可能需要更換模型

如何使用

配置MCP服務器
根據您使用的AI工具,將MCP Local RAG添加到配置文件中。需要指定文檔存儲的基本目錄(BASE_DIR)。
重啟AI工具
保存配置文件後,完全退出並重新啟動您的AI工具(Cursor/Codex/Claude Code),使配置生效。
上傳文檔
使用自然語言命令上傳您的第一個文檔。系統會自動下載所需模型(首次使用時約1-2分鐘)。
開始搜索
文檔處理完成後,使用自然語言提問來搜索文檔內容。系統會返回最相關的片段。

使用案例

技術文檔搜索
作為開發人員,您有大量的API文檔和技術規範需要經常查閱。使用MCP Local RAG可以快速找到特定功能或錯誤的解決方法。
研究論文整理
研究人員需要查閱多篇PDF格式的研究論文。使用語義搜索可以找到涉及特定理論或方法的所有論文,即使它們使用不同的術語。
企業內部文檔管理
公司有大量的內部文檔(政策、流程、會議記錄),員工需要快速查找相關信息。由於文檔敏感,不能使用雲服務。
個人知識庫
個人用戶收集了大量的筆記、書籤和參考資料。使用MCP Local RAG可以建立一個私人的智能搜索系統。

常見問題

我的文檔真的不會離開我的計算機嗎?
支持哪些文件格式?
第一次使用時為什麼需要等待?
可以搜索中文文檔嗎?
如何備份我的數據?
搜索沒有返回結果怎麼辦?
可以多人共享同一個數據庫嗎?
文檔太大無法上傳怎麼辦?

相關資源

GitHub倉庫
項目源代碼、問題反饋和貢獻指南
Model Context Protocol官網
瞭解MCP協議的技術細節和規範
HuggingFace模型頁面
查看使用的嵌入模型的技術細節和性能指標
LanceDB文檔
瞭解向量數據庫的技術原理和使用方法
Transformers.js
瀏覽器和Node.js中的Transformer模型運行庫

安裝

複製以下命令到你的Client進行配置
{
  "mcpServers": {
    "local-rag": {
      "command": "npx",
      "args": ["-y", "mcp-local-rag"],
      "env": {
        "BASE_DIR": "/path/to/your/documents"
      }
    }
  }
}

{
  "mcpServers": {
    "local-rag": {
      "command": "npx",
      "args": ["-y", "mcp-local-rag"],
      "env": {
        "BASE_DIR": "/path/to/your/documents",
        "DB_PATH": "./lancedb",
        "CACHE_DIR": "./models"
      }
    }
  }
}
注意:您的密鑰屬於敏感信息,請勿與任何人分享。
M
Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
23.6K
5分
B
Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
31.2K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
84.9K
5分
S
Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
25.1K
4.5分
N
Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
14.1K
4.5分
M
Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
16.2K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
18.9K
4.8分
C
Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
57.1K
4.7分
AIBase
智啟未來,您的人工智慧解決方案智庫
© 2025AIBase