MCP Rag
什么是MCP-RAG服务?
MCP-RAG是一个智能知识检索服务,它能够快速从您本地的知识库中查找相关信息。当您提出问题时,服务会从您上传的文档、资料中寻找最相关的答案,还可以根据需求生成简洁的摘要。如何使用MCP-RAG服务?
使用非常简单:1) 通过网页界面配置服务参数和上传文档;2) 在支持MCP协议的AI助手(如小智go)中直接提问;3) 服务会自动从您的知识库中检索相关信息并返回答案。适用场景
非常适合企业知识库查询、个人文档检索、技术支持问答、产品文档搜索等场景。特别适合需要快速访问特定领域知识的用户。主要功能
极速检索
检索响应时间小于100毫秒,提供近乎实时的知识查询体验
双模式检索
支持原始文档检索(raw模式)和智能摘要检索(summary模式),满足不同使用需求
智能摘要
集成多种AI模型(豆包、Ollama等),能够对检索结果进行智能总结和提炼
网页管理
提供友好的网页界面,方便进行服务配置、文档上传和管理操作
本地部署
支持完全本地化部署,确保数据安全和隐私保护
可扩展架构
模块化设计,支持后续添加重排序、缓存等高级功能
优势
响应速度快,检索延迟低于100ms
支持本地部署,数据完全可控
提供网页管理界面,操作简单直观
支持多种AI模型,灵活选择适合的摘要服务
模块化设计,便于功能扩展和定制
局限性
需要预先配置和上传知识文档
检索质量依赖于文档质量和向量化效果
智能摘要功能需要配置有效的AI模型API
首次使用需要一定的技术配置
如何使用
安装依赖
确保已安装Python 3.13及以上版本,使用uv包管理器安装项目依赖
配置服务
通过网页配置界面设置服务参数,包括AI模型、向量数据库等配置项
上传文档
在文档管理页面中上传您的知识文档,支持多种格式的文档文件
启动服务
启动MCP-RAG服务,开始提供知识检索功能
集成使用
在支持MCP协议的AI助手(如小智go)中配置并使用RAG服务
使用案例
企业政策查询
员工快速查询公司的人力资源政策、请假流程等信息
技术文档检索
开发人员查找API文档、技术规范或故障排除指南
产品信息查询
销售或客服人员快速获取产品规格、功能特点等信息
常见问题
MCP-RAG服务需要联网吗?
支持哪些文档格式?
raw模式和summary模式有什么区别?
如何提高检索的准确性?
服务首次启动时报错怎么办?
相关资源
MCP协议官方文档
了解Model Context Protocol的详细技术规范
小智go服务端
支持MCP协议的AI助手服务端
FastAPI框架
本项目使用的Web框架文档
ChromaDB向量数据库
本项目使用的向量数据库文档

Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
63.2K
4.3分

Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
58.1K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
107.9K
5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
27.0K
4.8分

Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
41.8K
5分

Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
40.2K
4.5分

Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
48.0K
4.8分

Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
78.8K
4.7分





