Rag Duckdb With MCP
R

Rag Duckdb With MCP

一個基於Python的文檔處理與檢索增強生成(RAG)服務器,使用DuckDB數據庫存儲嵌入向量,支持多種文件格式處理並提供Web界面和API接口。
2.5分
5.9K

什麼是MCP服務器?

MCP服務器是一個集成了文檔處理、文本分割、嵌入生成以及向量數據庫的系統,旨在為用戶提供高效、智能的文檔檢索與分析能力。它支持多種文件類型,並可以通過API或圖形界面進行交互。

如何使用MCP服務器?

用戶可以通過上傳文件或目錄,將文檔處理成可搜索的片段。然後,可以使用自然語言查詢來查找相關內容。同時,MCP服務器也提供了豐富的API接口供開發者調用。

適用場景

MCP服務器適用於需要快速檢索文檔內容的場景,如企業知識庫管理、技術文檔查詢、代碼檢索等。它特別適合需要對大量文本數據進行語義搜索的用戶。

主要功能

多格式支持
支持多種文件類型,包括文本、代碼、PDF、JSON、YAML等,確保用戶可以輕鬆處理各種文檔。
智能分塊
根據文件類型自動選擇合適的文本分割策略,確保每個片段都能保留上下文信息。
嵌入生成
使用先進的嵌入模型將文本轉換為向量表示,便於後續的語義相似性搜索。
高效搜索
基於DuckDB的向量相似性搜索功能,實現快速且準確的文檔檢索。
API接口
提供RESTful API,允許開發者以編程方式與MCP服務器交互。
Web界面
提供直觀的網頁界面,讓用戶無需編程即可上傳文件、搜索文檔。
優勢
支持多種文件格式,適用範圍廣
提供高效的語義搜索功能,提升檢索準確性
易於使用,提供圖形界面和API兩種交互方式
支持目錄上傳和文件過濾,提高處理效率
侷限性
不支持二進制文件(如圖片、視頻)
對於非常大的文件可能會出現內存問題
目前僅支持單用戶模式,不支持多用戶權限管理
部分高級功能(如圖譜檢索)尚未實現

如何使用

安裝與啟動
使用Docker容器化部署MCP服務器,確保所有依賴項已正確安裝。
上傳文件
通過網頁界面或API上傳文件,支持單個文件或整個目錄。
處理文檔
點擊“開始處理”按鈕,系統會自動提取文本、分塊並生成嵌入。
執行搜索
在搜索欄輸入自然語言查詢,系統會返回最相關的文檔片段。

使用案例

技術文檔查詢
用戶上傳了一個包含多個Python腳本的目錄,並希望找到有關如何處理JSON數據的示例代碼。
代碼片段檢索
用戶想查找某個特定函數的實現,例如在Java中如何實現排序算法。

常見問題

MCP服務器支持哪些文件格式?
如果文件太大怎麼辦?
如何訪問API?
是否支持中文搜索?
MCP服務器是否支持多用戶?

相關資源

官方文檔
詳細說明MCP服務器的功能和使用方法。
GitHub倉庫
項目源碼和開發指南。
教程視頻
演示MCP服務器的使用方法和功能。

安裝

複製以下命令到你的Client進行配置
注意:您的密鑰屬於敏感信息,請勿與任何人分享。

替代品

A
Airweave
Airweave是一個開源的人工智能代理和RAG系統的上下文檢索層,它連接並同步各種應用程序、工具和數據庫的數據,通過統一的搜索接口為AI代理提供相關、即時、多源的上下文信息。
Python
15.1K
5分
V
Vestige
Vestige是一個基於認知科學的AI記憶引擎,通過實現預測誤差門控、FSRS-6間隔重複、記憶夢境等29個神經科學模塊,為AI提供長期記憶能力。包含3D可視化儀表板和21個MCP工具,完全本地運行,無需雲端。
Rust
9.4K
4.5分
M
Moltbrain
MoltBrain是一個為OpenClaw、MoltBook和Claude Code設計的長期記憶層插件,能夠自動學習和回憶項目上下文,提供智能搜索、觀察記錄、分析統計和持久化存儲功能。
TypeScript
8.9K
4.5分
B
Better Icons
一個提供超過20萬圖標搜索和檢索的MCP服務器和CLI工具,支持150多個圖標庫,幫助AI助手和開發者快速獲取和使用圖標。
TypeScript
10.7K
4.5分
H
Haiku.rag
Haiku RAG是一個基於LanceDB、Pydantic AI和Docling構建的智能檢索增強生成系統,支持混合搜索、重排序、問答代理、多代理研究流程,並提供本地優先的文檔處理和MCP服務器集成。
Python
16.9K
5分
C
Claude Context
Claude Context是一個MCP插件,通過語義代碼搜索為AI編程助手提供整個代碼庫的深度上下文,支持多種嵌入模型和向量數據庫,實現高效代碼檢索。
TypeScript
31.5K
5分
A
Acemcp
Acemcp是一個代碼庫索引和語義搜索的MCP服務器,支持自動增量索引、多編碼文件處理、.gitignore集成和Web管理界面,幫助開發者快速搜索和理解代碼上下文。
Python
26.2K
5分
M
MCP
微軟官方MCP服務器,為AI助手提供最新微軟技術文檔的搜索和獲取功能
15.2K
5分
M
Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
34.0K
5分
B
Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
41.1K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
140.5K
5分
S
Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
34.1K
4.5分
N
Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
20.3K
4.5分
M
Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
22.2K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
25.7K
4.8分
C
Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
88.8K
4.7分
AIBase
智啟未來,您的人工智慧解決方案智庫
© 2026AIBase