MCP Local Rag
M

MCP Local Rag

一个完全在本地运行的隐私优先文档搜索服务器,通过MCP协议为AI编程工具提供语义搜索功能,无需API密钥或云端服务,所有数据处理均在用户计算机上完成。
2.5分
0

什么是MCP Local RAG?

MCP Local RAG是一个本地文档智能搜索系统,它使用AI技术理解您文档的内容含义,而不仅仅是关键词匹配。您可以将PDF、Word文档、文本文件等上传到系统中,然后使用自然语言提问,系统会找到最相关的文档片段并返回给您。所有处理都在您的计算机上完成,确保数据隐私和安全。

如何使用MCP Local RAG?

使用过程分为三个简单步骤:1) 配置MCP服务器到您的AI工具(Cursor/Codex/Claude Code);2) 上传您的文档到系统中;3) 使用自然语言搜索文档内容。系统会自动处理文档分割、语义理解和智能检索。

适用场景

特别适合需要处理敏感或机密文档的场景,如:企业内部技术文档、客户合同、研究论文、个人笔记、法律文件等。当您需要快速查找文档中的特定信息,但又不能将文档上传到云端服务时,这是理想的选择。

主要功能

文档上传与处理
支持PDF、DOCX、TXT和Markdown格式。自动提取文本内容,智能分割成可搜索的片段,并生成语义向量。重新上传同一文件时会自动替换旧版本,避免数据重复。
语义搜索
使用自然语言进行语义搜索,理解查询的深层含义而非简单关键词匹配。例如搜索'身份验证流程'也能找到包含'登录方法'或'凭证验证'的相关内容。
文件管理
查看所有已上传的文件列表,包括文件路径、处理时间和生成的片段数量。帮助您了解系统中已索引的内容。
文件删除
从系统中永久删除文档及其所有相关数据。当文档过时或包含敏感信息需要移除时使用此功能。
系统状态监控
查看系统运行状态,包括文档总数、片段总数、内存使用情况和运行时间。帮助监控性能和排查问题。
完全离线运行
首次使用时下载模型文件(约90MB)后,所有操作都在本地完成,无需网络连接。确保数据隐私和随时可用性。
优势
🔒 完全隐私保护:所有数据处理都在本地进行,文档永远不会离开您的计算机
💰 零使用成本:没有API调用费用,无限次搜索不产生额外成本
🌐 离线可用:下载模型后无需网络连接即可使用
⚡ 快速响应:查询通常在3秒内返回结果,即使有数千个文档片段
🔄 自动更新:重新上传文档时自动替换旧版本,保持数据最新
局限性
📁 文件格式有限:目前仅支持PDF、DOCX、TXT、MD格式,不支持Excel、PPT或图像OCR
💾 本地存储需求:需要足够的磁盘空间存储模型文件(~120MB)和向量数据库
⚙️ 配置步骤:需要在AI工具中配置MCP服务器,对非技术用户可能有一定学习成本
🔍 搜索精度:本地模型精度可能略低于大型云服务,但对大多数文档搜索足够
🌍 语言支持:默认模型针对英语优化,其他语言可能需要更换模型

如何使用

配置MCP服务器
根据您使用的AI工具,将MCP Local RAG添加到配置文件中。需要指定文档存储的基本目录(BASE_DIR)。
重启AI工具
保存配置文件后,完全退出并重新启动您的AI工具(Cursor/Codex/Claude Code),使配置生效。
上传文档
使用自然语言命令上传您的第一个文档。系统会自动下载所需模型(首次使用时约1-2分钟)。
开始搜索
文档处理完成后,使用自然语言提问来搜索文档内容。系统会返回最相关的片段。

使用案例

技术文档搜索
作为开发人员,您有大量的API文档和技术规范需要经常查阅。使用MCP Local RAG可以快速找到特定功能或错误的解决方法。
研究论文整理
研究人员需要查阅多篇PDF格式的研究论文。使用语义搜索可以找到涉及特定理论或方法的所有论文,即使它们使用不同的术语。
企业内部文档管理
公司有大量的内部文档(政策、流程、会议记录),员工需要快速查找相关信息。由于文档敏感,不能使用云服务。
个人知识库
个人用户收集了大量的笔记、书签和参考资料。使用MCP Local RAG可以建立一个私人的智能搜索系统。

常见问题

我的文档真的不会离开我的计算机吗?
支持哪些文件格式?
第一次使用时为什么需要等待?
可以搜索中文文档吗?
如何备份我的数据?
搜索没有返回结果怎么办?
可以多人共享同一个数据库吗?
文档太大无法上传怎么办?

相关资源

GitHub仓库
项目源代码、问题反馈和贡献指南
Model Context Protocol官网
了解MCP协议的技术细节和规范
HuggingFace模型页面
查看使用的嵌入模型的技术细节和性能指标
LanceDB文档
了解向量数据库的技术原理和使用方法
Transformers.js
浏览器和Node.js中的Transformer模型运行库

安装

复制以下命令到你的Client进行配置
{
  "mcpServers": {
    "local-rag": {
      "command": "npx",
      "args": ["-y", "mcp-local-rag"],
      "env": {
        "BASE_DIR": "/path/to/your/documents"
      }
    }
  }
}

{
  "mcpServers": {
    "local-rag": {
      "command": "npx",
      "args": ["-y", "mcp-local-rag"],
      "env": {
        "BASE_DIR": "/path/to/your/documents",
        "DB_PATH": "./lancedb",
        "CACHE_DIR": "./models"
      }
    }
  }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
61.6K
4.5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
68.7K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
117.5K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
27.0K
4.8分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
45.1K
5分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
42.7K
4.5分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
52.8K
4.8分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
84.3K
4.7分
AIBase
智启未来,您的人工智能解决方案智库
© 2025AIBase