MCP Local Rag

一個完全在本地運行的隱私優先文檔搜索服務器，通過MCP協議為AI編程工具提供語義搜索功能，無需API密鑰或雲端服務，所有數據處理均在用戶計算機上完成。

搜索工具知識管理與記憶 #本地搜索 #隱私保護 #文檔檢索 #語義搜索 .TypeScript

評分 : 2.5分

下載量 : 8.5K

更新時間 : 2025-12-12

打開站點

什麼是MCP Local RAG?

MCP Local RAG是一個本地文檔智能搜索系統，它使用AI技術理解您文檔的內容含義，而不僅僅是關鍵詞匹配。您可以將PDF、Word文檔、文本文件等上傳到系統中，然後使用自然語言提問，系統會找到最相關的文檔片段並返回給您。所有處理都在您的計算機上完成，確保數據隱私和安全。

如何使用MCP Local RAG?

使用過程分為三個簡單步驟：1) 配置MCP服務器到您的AI工具（Cursor/Codex/Claude Code）；2) 上傳您的文檔到系統中；3) 使用自然語言搜索文檔內容。系統會自動處理文檔分割、語義理解和智能檢索。

適用場景

特別適合需要處理敏感或機密文檔的場景，如：企業內部技術文檔、客戶合同、研究論文、個人筆記、法律文件等。當您需要快速查找文檔中的特定信息，但又不能將文檔上傳到雲端服務時，這是理想的選擇。

主要功能

文檔上傳與處理

支持PDF、DOCX、TXT和Markdown格式。自動提取文本內容，智能分割成可搜索的片段，並生成語義向量。重新上傳同一文件時會自動替換舊版本，避免數據重複。

語義搜索

使用自然語言進行語義搜索，理解查詢的深層含義而非簡單關鍵詞匹配。例如搜索'身份驗證流程'也能找到包含'登錄方法'或'憑證驗證'的相關內容。

文件管理

查看所有已上傳的文件列表，包括文件路徑、處理時間和生成的片段數量。幫助您瞭解系統中已索引的內容。

文件刪除

從系統中永久刪除文檔及其所有相關數據。當文檔過時或包含敏感信息需要移除時使用此功能。

系統狀態監控

查看系統運行狀態，包括文檔總數、片段總數、內存使用情況和運行時間。幫助監控性能和排查問題。

完全離線運行

首次使用時下載模型文件（約90MB）後，所有操作都在本地完成，無需網絡連接。確保數據隱私和隨時可用性。

優勢

🔒 完全隱私保護：所有數據處理都在本地進行，文檔永遠不會離開您的計算機

💰 零使用成本：沒有API調用費用，無限次搜索不產生額外成本

🌐 離線可用：下載模型後無需網絡連接即可使用

⚡ 快速響應：查詢通常在3秒內返回結果，即使有數千個文檔片段

🔄 自動更新：重新上傳文檔時自動替換舊版本，保持數據最新

侷限性

📁 文件格式有限：目前僅支持PDF、DOCX、TXT、MD格式，不支持Excel、PPT或圖像OCR

💾 本地存儲需求：需要足夠的磁盤空間存儲模型文件（~120MB）和向量數據庫

⚙️ 配置步驟：需要在AI工具中配置MCP服務器，對非技術用戶可能有一定學習成本

🔍 搜索精度：本地模型精度可能略低於大型雲服務，但對大多數文檔搜索足夠

🌍 語言支持：默認模型針對英語優化，其他語言可能需要更換模型

如何使用

配置MCP服務器

根據您使用的AI工具，將MCP Local RAG添加到配置文件中。需要指定文檔存儲的基本目錄(BASE_DIR)。

重啟AI工具

保存配置文件後，完全退出並重新啟動您的AI工具（Cursor/Codex/Claude Code），使配置生效。

上傳文檔

使用自然語言命令上傳您的第一個文檔。系統會自動下載所需模型（首次使用時約1-2分鐘）。

開始搜索

文檔處理完成後，使用自然語言提問來搜索文檔內容。系統會返回最相關的片段。

使用案例

技術文檔搜索

作為開發人員，您有大量的API文檔和技術規範需要經常查閱。使用MCP Local RAG可以快速找到特定功能或錯誤的解決方法。

研究論文整理

研究人員需要查閱多篇PDF格式的研究論文。使用語義搜索可以找到涉及特定理論或方法的所有論文，即使它們使用不同的術語。

企業內部文檔管理

公司有大量的內部文檔（政策、流程、會議記錄），員工需要快速查找相關信息。由於文檔敏感，不能使用雲服務。

個人知識庫

個人用戶收集了大量的筆記、書籤和參考資料。使用MCP Local RAG可以建立一個私人的智能搜索系統。

常見問題

我的文檔真的不會離開我的計算機嗎？

支持哪些文件格式？

第一次使用時為什麼需要等待？

可以搜索中文文檔嗎？

如何備份我的數據？

搜索沒有返回結果怎麼辦？

可以多人共享同一個數據庫嗎？

文檔太大無法上傳怎麼辦？

🚀 MCP本地檢索增強生成（RAG）

這是一個注重隱私的文檔搜索服務器，可完全在本地機器上運行。無需API密鑰，不依賴雲服務，數據不會離開你的計算機。

該項目基於模型上下文協議（MCP）構建，允許你使用Cursor、Codex、Claude Code或任何MCP客戶端，通過語義搜索在本地文檔中進行搜索，而無需將任何內容發送到外部服務。

🚀 快速開始

將MCP服務器添加到你的AI編碼工具中。請選擇以下工具對應的操作：

Cursor

將以下內容添加到 ~/.cursor/mcp.json 文件中：

{
  "mcpServers": {
    "local-rag": {
      "command": "npx",
      "args": ["-y", "mcp-local-rag"],
      "env": {
        "BASE_DIR": "/path/to/your/documents"
      }
    }
  }
}

Codex

將以下內容添加到 ~/.codex/config.toml 文件中：

[mcp_servers.local-rag]
command = "npx"
args = ["-y", "mcp-local-rag"]

[mcp_servers.local-rag.env]
BASE_DIR = "/path/to/your/documents"

Claude Code

運行以下命令：

claude mcp add local-rag --scope user --env BASE_DIR=/path/to/your/documents -- npx -y mcp-local-rag

重啟你的工具，然後就可以開始使用了：

"Ingest api-spec.pdf"
"What does this document say about authentication?"

就是這麼簡單，無需安裝，無需使用Docker，也無需複雜的設置。

✨ 主要特性

解決痛點

你可能希望使用AI來搜索文檔，這些文檔可能是技術規範、研究論文、內部文檔或會議記錄。然而，大多數解決方案都需要將文件發送到外部API，這會帶來三個問題：

隱私問題：文檔可能包含敏感信息，如客戶數據、專有研究或個人筆記。將其發送給第三方服務意味著要將這些數據託付給他們。
大規模使用成本高：外部嵌入API按使用次數收費。對於大量文檔或頻繁搜索，成本會迅速增加。
網絡依賴性：如果離線或網絡連接受限，就無法搜索自己的文檔。

本項目通過在本地運行所有操作來解決這些問題，文檔不會離開你的機器。嵌入模型只需下載一次，之後即可離線使用，並且可以免費無限次使用。

提供的工具

服務器通過MCP提供了五個工具：

文檔攝入：支持處理PDF、DOCX、TXT和Markdown文件。指定一個文件後，它會提取文本，將其拆分為可搜索的塊，使用本地模型生成嵌入向量，並將所有內容存儲在本地向量數據庫中。如果再次攝入相同的文件，它會替換舊版本，不會產生重複數據。
語義搜索：允許使用自然語言進行查詢。它理解語義，而不是簡單的關鍵詞匹配。例如，詢問 “how does authentication work” 時，即使相關部分使用了 “login flow” 或 “credential validation” 等不同的表述，也能找到相關內容。
文件管理：顯示已攝入的文件及其攝入時間。你可以查看每個文件生成的塊數，並驗證所有內容是否已正確索引。
文件刪除：從向量數據庫中刪除已攝入的文檔。刪除文件時，其所有塊和嵌入向量將被永久刪除。這對於刪除過時的文檔或不再希望索引的敏感數據非常有用。
系統狀態：報告數據庫的相關信息，如文檔數量、總塊數和內存使用情況。有助於監控性能或調試問題。

技術選型

所有功能都基於以下技術：

LanceDB：用於向量存儲（基於文件，無需服務器）
Transformers.js：用於生成嵌入向量（在Node.js中運行，無需Python）
all-MiniLM-L6-v2 模型：384維，在速度和準確性之間取得了良好的平衡
RecursiveCharacterTextSplitter：用於智能文本分塊

性能表現

在標準筆記本電腦上，即使索引了數千個文檔塊，查詢響應通常也能在3秒內完成。

📦 安裝指南

本項目無需複雜的安裝過程，按照快速開始部分的步驟將MCP服務器添加到你的AI編碼工具中即可。

首次運行

服務器會立即啟動，但嵌入模型會在首次使用時（即首次攝入或搜索時）下載：

下載大小：約90MB（模型文件）
緩存後的磁盤使用量：約120MB（包括ONNX運行時緩存）
下載時間：在良好的網絡連接下需要1 - 2分鐘
首次操作延遲：首次攝入或搜索請求將等待模型下載完成

控制檯會顯示類似 “Initializing model (downloading ~90MB, may take 1 - 2 minutes)…” 的消息。模型會緩存在 CACHE_DIR（默認：./models/）中，以便離線使用。

延遲初始化的原因：這種方式允許服務器立即啟動，無需預先加載模型。只有在實際需要時才進行下載，使服務器在快速狀態檢查或文件管理操作時更具響應性。

離線模式：首次下載後，完全支持離線使用，無需網絡連接。

💻 使用示例

配置

服務器默認配置即可使用，但你可以通過環境變量進行自定義。

Codex

將以下內容添加到 ~/.codex/config.toml 文件中：

[mcp_servers.local-rag]
command = "npx"
args = ["-y", "mcp-local-rag"]

[mcp_servers.local-rag.env]
BASE_DIR = "/path/to/your/documents"
DB_PATH = "./lancedb"
CACHE_DIR = "./models"

注意：節名稱必須為 mcp_servers（使用下劃線）。使用 mcp-servers 或 mcpservers 會導致Codex忽略該配置。

Cursor

在Cursor設置中添加以下內容：

全局設置（所有項目）：~/.cursor/mcp.json
項目特定設置：項目根目錄下的 .cursor/mcp.json

{
  "mcpServers": {
    "local-rag": {
      "command": "npx",
      "args": ["-y", "mcp-local-rag"],
      "env": {
        "BASE_DIR": "/path/to/your/documents",
        "DB_PATH": "./lancedb",
        "CACHE_DIR": "./models"
      }
    }
  }
}

Claude Code

在項目目錄中運行以下命令以啟用該項目：

cd /path/to/your/project
claude mcp add local-rag --env BASE_DIR=/path/to/your/documents -- npx -y mcp-local-rag

或者為所有項目全局添加：

claude mcp add local-rag --scope user --env BASE_DIR=/path/to/your/documents -- npx -y mcp-local-rag

使用其他環境變量：

claude mcp add local-rag --scope user \
  --env BASE_DIR=/path/to/your/documents \
  --env DB_PATH=./lancedb \
  --env CACHE_DIR=./models \
  -- npx -y mcp-local-rag

環境變量說明

變量	默認值	描述	有效範圍
`BASE_DIR`	當前目錄	文檔根目錄。服務器僅訪問此路徑內的文件（防止意外訪問系統文件）	任何有效路徑
`DB_PATH`	`./lancedb/`	向量數據庫存儲位置。隨著文檔數量的增加，該目錄可能會變得很大	任何有效路徑
`CACHE_DIR`	`./models/`	模型緩存目錄。首次下載後，模型將保留在此處以便離線使用	任何有效路徑
`MODEL_NAME`	`Xenova/all-MiniLM-L6-v2`	HuggingFace模型標識符。必須與Transformers.js兼容。請參閱可用模型。注意：更改模型需要重新攝入所有文檔，因為不同模型的嵌入向量不兼容	HF模型ID
`MAX_FILE_SIZE`	`104857600`（100MB）	文件最大字節數。為防止內存問題，較大的文件將被拒絕	1MB - 500MB
`CHUNK_SIZE`	`512`	每個塊的字符數。值越大，上下文信息越多，但處理速度越慢	128 - 2048
`CHUNK_OVERLAP`	`100`	塊之間的重疊字符數。用於保留跨邊界的上下文信息	0 - (CHUNK_SIZE/2)

操作使用

配置後重啟客戶端

Cursor：完全退出並重新啟動（在Mac上使用Cmd + Q，而不僅僅是關閉窗口）
Codex：重啟IDE/擴展
Claude Code：無需重啟，更改將立即生效

服務器將作為可用工具顯示，供你的AI助手使用。

攝入文檔

Cursor：Composer Agent會在需要時自動使用MCP工具：

"Ingest the document at /Users/me/docs/api-spec.pdf"

Codex CLI：助手會在需要時自動使用配置好的MCP工具：

codex "Ingest the document at /Users/me/docs/api-spec.pdf into the RAG system"

Claude Code：直接自然提問即可：

"Ingest the document at /Users/me/docs/api-spec.pdf"

路徑要求：服務器要求使用文件的絕對路徑。你的AI助手通常會自動將自然語言請求轉換為絕對路徑。BASE_DIR 設置出於安全考慮，限制了對該目錄樹內文件的訪問，但你仍需提供完整路徑。

服務器會執行以下操作：

驗證文件是否存在且大小不超過100MB
提取文本（支持PDF/DOCX/TXT/MD格式）
將文本拆分為塊（每個塊512個字符，重疊100個字符）
為每個塊生成嵌入向量
將其存儲在向量數據庫中

在標準筆記本電腦上，每MB文件大約需要5 - 10秒。完成後會顯示確認信息，包括生成的塊數。

搜索文檔

使用自然語言提問：

"What does the API documentation say about authentication?"
"Find information about rate limiting"
"Search for error handling best practices"

服務器會執行以下操作：

將查詢轉換為嵌入向量
在向量數據庫中搜索相似的塊
返回前5個匹配結果，並顯示相似度得分

結果包括文本內容、文件來源和相關性得分。你的AI助手將使用這些結果回答你的問題。

你可以請求更多結果：

"Search for database optimization tips, return 10 results"

限制參數接受1 - 20個結果。

管理文件

查看已索引的文件：

"List all ingested files"

這將顯示每個文件的路徑、生成的塊數以及攝入時間。

從數據庫中刪除文件：

"Delete /Users/me/docs/old-spec.pdf from the RAG system"

這將從向量數據庫中永久刪除該文件及其所有塊。該操作是冪等的，即刪除不存在的文件不會報錯。

檢查系統狀態：

"Show the RAG server status"

這將報告總文檔數、總塊數、當前內存使用情況和運行時間。

重新攝入文件

如果你更新了文檔，請再次攝入：

"Re-ingest api-spec.pdf with the latest changes"

服務器會在添加新塊之前自動刪除該文件的舊塊，不會產生重複或過時的數據。

📚 詳細文檔

開發相關

從源代碼構建

git clone https://github.com/shinpr/mcp-local-rag.git
cd mcp-local-rag
npm install

運行測試

# 運行所有測試
npm test

# 運行測試並生成覆蓋率報告
npm run test:coverage

# 開發時的監視模式
npm run test:watch

測試套件包括：

每個組件的單元測試
完整攝入和搜索流程的集成測試
路徑遍歷保護的安全測試
驗證查詢速度目標的性能測試

代碼質量檢查

# 類型檢查
npm run type-check

# 代碼檢查和格式化
npm run check:fix

# 檢查循環依賴
npm run check:deps

# 全面質量檢查（運行所有檢查）
npm run check:all

項目結構

src/
  index.ts          # 入口點，啟動MCP服務器
  server/           # RAGServer類，MCP工具處理程序
  parser/           # 文檔解析（PDF、DOCX、TXT、MD）
  chunker/          # 文本拆分邏輯
  embedder/         # 使用Transformers.js生成嵌入向量
  vectordb/         # LanceDB操作
  __tests__/        # 測試套件

每個模塊都有明確的邊界：