mcp - kbdb - RAG - MCP：Python服務器多模式文本搜索，支持AI代理交互的可擴展MCP工具

探索

MCP Kbdb

rag-mcp是一個過度設計的檢索增強生成系統，通過Python服務器提供多種文本搜索模式（語義搜索、問答搜索、風格搜索），使用PostgreSQL和pgvector存儲文本嵌入向量，支持與AI代理交互，架構複雜但可擴展。

知識管理與記憶搜索工具 #文本檢索 #向量數據庫 #AI工具 #複雜系統 .Python

評分 : 2.5分

下載量 : 9.4K

更新時間 : 2025-08-19

打開站點

什麼是RAG-MCP?

RAG-MCP是一個智能知識檢索系統，它採用先進的AI技術將文本轉化為數學向量，使計算機能夠理解文本的深層含義。系統提供三種獨特的搜索方式，滿足不同場景下的信息檢索需求。

如何使用RAG-MCP?

只需啟動服務器，通過標準接口發送搜索請求即可。系統支持多種客戶端接入方式，包括編程調用和可視化界面操作。

適用場景

適用於知識管理、內容推薦、智能客服、學術研究等需要高效檢索和理解大量文本的場景。特別適合處理專業性強、語義複雜的文檔內容。

主要功能

語義搜索

根據查詢內容的深層含義而非簡單關鍵詞匹配來查找相關文檔，能夠理解同義詞和概念關聯。

問答搜索

直接回答用戶提出的問題，從知識庫中提取最相關的信息片段作為答案。

風格搜索

根據文本的寫作風格、語氣和表達方式進行匹配，找到風格相似的文檔內容。

優勢

多模態搜索滿足不同需求場景

基於向量技術實現深層語義理解

可擴展架構支持自定義搜索模式

高性能索引確保快速響應

侷限性

需要預先構建知識庫和向量索引

對計算資源要求較高

初始配置較為複雜

依賴外部AI模型生成向量

如何使用

環境準備

確保已安裝Python 3.x和PostgreSQL數據庫，並啟用pgvector擴展。

安裝依賴

使用pip安裝所需的Python依賴包。

配置環境變量

設置數據庫連接和AI模型API的相關配置。

啟動服務器

運行主程序啟動RAG-MCP服務。

使用案例

學術研究輔助

研究人員可以快速找到與特定理論相關的研究論文和資料

內容創作靈感

作家可以尋找特定風格或主題的文本作為創作參考

常見問題

需要什麼樣的硬件配置?

支持哪些語言?

如何擴展新的搜索模式?

🚀 rag - mcp：一個過度設計的檢索系統

rag - mcp 是一個旨在回答古老問題的項目：“如果我們把一個原本不錯的想法——檢索增強生成，變得極其複雜，使其成為我們自負的象徵，會怎樣？” 這是一個模型上下文協議（MCP）服務器，它像嗑了藥的游擊手一樣處理文本嵌入，使用 PostgreSQL 和 pgvector 擴展，說實話，誰還需要簡單性呢？

這個項目是為真正的 “怪人” 準備的，那些看到問題會想 “我本可以用一個簡單的腳本解決，但如果我構建一個由相互關聯的部分組成的複雜系統，維護起來會是一場噩夢，那會怎樣？” 的人。你們就是我的 “同道中人”。

🚀 快速開始

準備工作

安裝 Python 3.x 版本（能正常運行即可）。
安裝 PostgreSQL 並啟用 pgvector 擴展。若不知如何操作，請自行谷歌搜索。

安裝步驟

克隆倉庫：

git clone [倉庫地址]

安裝 Python 依賴：

pip install -r requirements.txt

配置數據庫：連接到你的 PostgreSQL 實例，運行 create_tables.pgsql 腳本，它會創建所需的表和用於快速向量搜索的 HNSW 索引。
設置環境變量：創建 .env 文件或直接設置環境變量，內容如下：

# 數據庫相關
rm_db_host=localhost
rm_db_port=5432
rm_db_name=your_db_name
rm_db_user=your_db_user
rm_db_password=your_super_secret_password

# 嵌入模型相關
rm_openai_api_key=your_api_key
rm_openai_endpoint=your_model_endpoint_url

啟動服務

python rag_mcp_server.py

若服務未崩潰，它將開始監聽並向外界暴露 MCP 工具。你可以從任何 MCP 客戶端調用 search_style、search_qa 和 search_semantic_similarity 等工具。

客戶端連接

若你使用 VSCode 中的 AI 助手或 Claude 桌面版等，需要告知它們如何找到我們的服務器。你可能需要編輯一些 JSON 設置文件，找到 mcpServers 部分並添加如下內容：

{
  "mcpServers": {
    "RAG - MCP Knoledge Base Server": {
      "command": "uv",
      "args": [
        "run",
        "--with",
        "fastmcp",
        "fastmcp",
        "run",
        "/location/of/the/script/rag_mcp_server.py:mcp"
      ],
      "env": {
        "RM_DB_HOST": "localhost",
        "RM_DB_PORT": "5432",
        "RM_DB_NAME": "your_db_name",
        "RM_DB_USER": "your_db_user",
        "RM_DB_PASSWORD": "your_super_secret_password",
        "RM_OPENAI_API_KEY": "your_api_key",
        "RM_OPENAI_ENDPOINT": "your_model_endpoint_url"
      },
      "transport": "stdio",
      "type": null,
      "cwd": null,
      "timeout": null,
      "description": null,
      "icon": null,
      "authentication": null
    }
  }
}

請將 /location/of/the/script/rag_mcp_server.py:mcp 替換為實際的腳本路徑，並填寫 env 中的密鑰信息。

✨ 主要特性

搜索模態多樣

rag - mcp 是一個 Python 服務器，提供了一套用於搜索文本知識庫的工具。它擁有多種搜索模態，每種模態就像不同口味的搜索方式，針對特定任務進行了優化：

語義搜索：當你想找到與查詢 “氛圍” 相符的內容時使用。
問答搜索：你提出問題，它假裝能給出答案，經典實用。
風格搜索：找到 “感覺” 相似的內容，就像文本的品酒師，既做作又實用。

基於 `fastmcp` 框架

該系統基於 fastmcp 框架構建，這意味著你可以通過其他 AI 代理與之交互，形成一個荒謬且自引用的代碼循環。

📦 安裝指南

克隆倉庫

git clone [倉庫地址]

安裝依賴

pip install -r requirements.txt

數據庫設置

運行 create_tables.pgsql 腳本創建數據庫表和索引：

-- 運行 create_tables.pgsql 腳本
psql -U your_user -d your_database -f create_tables.pgsql

環境變量設置

創建 .env 文件並設置以下環境變量：

# 數據庫相關
rm_db_host=localhost
rm_db_port=5432
rm_db_name=your_db_name
rm_db_user=your_db_user
rm_db_password=your_super_secret_password

# 嵌入模型相關
rm_openai_api_key=your_api_key
rm_openai_endpoint=your_model_endpoint_url

💻 使用示例

基礎用法

啟動服務器：

python rag_mcp_server.py

從 MCP 客戶端調用搜索工具：

# 假設存在一個 MCP 客戶端類
from mcp_client import MCPClient

client = MCPClient()
result = client.call('search_semantic_similarity', query='your_query')
print(result)

高級用法

若要使用不同的搜索模態，可根據需求調用相應的工具：

# 調用問答搜索
result = client.call('search_qa', question='your_question')
print(result)

# 調用風格搜索
result = client.call('search_style', style='your_style')
print(result)

📚 詳細文檔

系統架構

這是一個複雜而有序的系統，其架構如下：

服務器 (rag_mcp_server.py)：這是整個系統的核心，負責處理傳入的請求、與數據庫通信並保持穩定運行。
數據庫 (postgresql + pgvector)：用於存儲所有文本及其對應的向量嵌入。create_tables.pgsql 腳本定義了整個數據庫架構，包括 documents、document_chunks 和 embeddings 表，它們相互關聯，結構合理。
嵌入引擎（OpenAI 兼容）：將文本轉換為向量。服務器會調用與 OpenAI 兼容的 API 來生成嵌入向量，你可以提供自己的 API 端點，使用任何自定義模型。
工具：服務器將搜索模態作為 MCP 工具暴露出來，目前有 search_semantic_similarity、search_qa 和 search_style 等工具。

系統擴展

你可以輕鬆擴展這個系統，添加自己的搜索模態。詳細的操作指南請參考 manual.md，它會指導你如何添加新的模型、任務和工具函數。

🔧 技術細節

數據庫設計

數據庫使用 PostgreSQL 並結合 pgvector 擴展，通過 create_tables.pgsql 腳本創建了 documents、document_chunks 和 embeddings 表，這些表通過外鍵關聯，用於存儲文本及其向量嵌入。使用 HNSW 索引加速向量搜索。