Deeprepo

DeepRepo是一個生產級的本地RAG引擎Python庫，支持多種AI提供商，提供向量存儲、MCP服務器集成和RESTful API，無需外部向量數據庫或重型框架。

開發者工具知識管理與記憶 #本地RAG #多AI支持 #MCP集成 #向量檢索 .Python

評分 : 2分

下載量 : 7.6K

更新時間 : 2026-03-12

打開站點

什麼是DeepRepo MCP服務器？

DeepRepo MCP服務器是一個橋樑，它將您的本地代碼庫與AI助手連接起來。通過Model Context Protocol（MCP），您可以讓AI助手（如Cursor、Claude Desktop）訪問和理解您的代碼庫，從而獲得更準確、更相關的編程幫助。

如何使用DeepRepo MCP服務器？

使用非常簡單：1) 安裝DeepRepo和MCP依賴，2) 配置您的AI助手（如Cursor）連接到MCP服務器，3) 讓AI助手分析您的代碼庫，4) 開始提問並獲得基於您代碼的智能回答。

適用場景

當您需要AI助手理解特定項目代碼時非常有用，例如：新成員加入項目需要了解代碼結構、重構大型代碼庫時尋求建議、調試複雜問題時需要上下文、學習他人代碼庫時獲得解釋。

主要功能

多AI助手支持

支持Cursor、Claude Desktop、Antigravity等主流AI助手，讓您可以在熟悉的工具中使用代碼庫知識。

靈活的AI提供商選擇

可以使用Ollama（免費本地運行）、OpenAI、Anthropic、HuggingFace等多種AI服務，甚至可以為嵌入和生成選擇不同的提供商。

代碼庫智能分析

自動掃描、分析和索引您的代碼庫，創建可搜索的知識庫，AI助手可以基於此提供準確的代碼解釋和建議。

即時查詢與搜索

提供多種查詢工具：智能問答、相似代碼搜索、代碼庫統計等，滿足不同的使用需求。

簡單配置

通過環境變量或配置文件即可完成設置，無需複雜的部署流程，幾分鐘內即可開始使用。

優勢

無縫集成：與您現有的AI助手工作流完美融合

隱私保護：使用Ollama時所有數據處理都在本地，代碼不會上傳到雲端

成本靈活：支持從免費（Ollama）到付費（OpenAI）的各種選項

上下文感知：AI回答基於您的實際代碼，而不是通用知識

易於使用：配置簡單，無需深度學習或向量數據庫專業知識

侷限性

需要初始設置：首次使用需要配置MCP連接

代碼庫大小限制：非常大的代碼庫可能需要更多內存和時間處理

AI提供商限制：某些提供商（如Anthropic）沒有嵌入API，需要搭配其他提供商使用

本地資源需求：使用Ollama時需要足夠的磁盤空間（約4GB）來存儲模型

如何使用

安裝DeepRepo和MCP依賴

確保已安裝DeepRepo核心庫，然後安裝MCP額外依賴包。

配置AI助手連接

根據您使用的AI助手，編輯配置文件以添加DeepRepo MCP服務器。

設置環境變量

配置您選擇的AI提供商，例如使用免費的Ollama或設置API密鑰。

啟動MCP服務器

運行MCP服務器，AI助手將自動連接。

在AI助手中使用

在Cursor、Claude Desktop等工具中，您現在可以詢問關於代碼庫的問題了。

使用案例

新項目上手

剛加入一個新項目，需要快速理解代碼結構和主要功能。

代碼重構建議

想要重構某個功能，但不確定最佳實踐和現有模式。

調試幫助

遇到一個bug，需要理解相關代碼的上下文。

學習代碼模式

想學習項目中使用的特定設計模式或架構風格。

常見問題

MCP服務器需要一直運行嗎？

使用Ollama需要付費嗎？

我的代碼會被上傳到雲端嗎？

支持哪些編程語言？

代碼庫更新後需要重新處理嗎？

可以同時連接多個AI助手嗎？

🚀 DeepRepo - 本地RAG引擎

DeepRepo 是一個生產級的 Python 庫，支持在本地代碼庫上執行 RAG（檢索增強生成），並支持多種 AI 供應商。

🚀 快速開始

安裝

cd deeprepo_core
pip install -e .

詳細的各供應商設置說明請參閱 INSTALLATION.md。

基本用法

from deeprepo import DeepRepoClient

# 使用 Ollama (免費，本地) 進行初始化 - 嵌入和大語言模型使用同一供應商
client = DeepRepoClient(provider_name="ollama")

# 或者為嵌入和大語言模型使用不同的供應商
# 示例：使用 OpenAI 進行嵌入，Anthropic 進行大語言模型
client = DeepRepoClient(
    embedding_provider_name="openai",
    llm_provider_name="anthropic"
)

# 攝入文檔
result = client.ingest("/path/to/your/code")
print(f"已攝入 {result['chunks_processed']} 個塊")

# 使用 RAG 進行查詢
response = client.query("身份驗證是如何工作的？")
print(response['answer'])
print(f"來源: {response['sources']}")

✨ 主要特性

純 Python 實現：無需使用大型框架（如 LangChain/LlamaIndex），也無需外部向量數據庫。
多 AI 供應商支持：支持 Ollama（本地）、HuggingFace、OpenAI、Anthropic 和 Gemini。
MCP 服務器支持：可與 Cursor、Claude Desktop、Antigravity 等 MCP 客戶端集成。
基於裝飾器的插件系統：便於供應商註冊和擴展。
向量存儲：使用 NumPy 實現餘弦相似度，並以 JSON 格式持久化。
RESTful API：提供 FastAPI 服務，便於集成。
支持 Docker：可進行完整的容器化部署。

📦 安裝指南

安裝 MCP 依賴

pip install deeprepo[mcp]

啟動 MCP 服務器

# 使用 CLI 命令
deeprepo-mcp

# 或者作為 Python 模塊運行
python -m deeprepo.mcp.server

配置 Cursor

創建或編輯 ~/.cursor/mcp.json：

{
  "mcpServers": {
    "deeprepo": {
      "command": "python",
      "args": ["-m", "deeprepo.mcp.server"],
      "env": {
        "LLM_PROVIDER": "ollama"
      }
    }
  }
}

使用不同的供應商：

{
  "mcpServers": {
    "deeprepo": {
      "command": "python",
      "args": ["-m", "deeprepo.mcp.server"],
      "env": {
        "EMBEDDING_PROVIDER": "openai",
        "LLM_PROVIDER": "anthropic",
        "OPENAI_API_KEY": "sk-...",
        "ANTHROPIC_API_KEY": "sk-ant-..."
      }
    }
  }
}

啟動 FastAPI 服務器

export OPENAI_API_KEY=your-key  # 或者使用 Ollama（無需密鑰）
uvicorn web_app.main:app --reload

Docker 部署

docker-compose up --build

服務將在 http://localhost:8000 上可用。

💻 使用示例

基礎用法

# 使用 Ollama 進行初始化
client = DeepRepoClient(provider_name="ollama")

# 攝入文檔
result = client.ingest("/path/to/your/code")
print(f"已攝入 {result['chunks_processed']} 個塊")

# 使用 RAG 進行查詢
response = client.query("身份驗證是如何工作的？")
print(response['answer'])
print(f"來源: {response['sources']}")

高級用法

# 使用不同的供應商進行嵌入和大語言模型
client = DeepRepoClient(
    embedding_provider_name="openai",
    llm_provider_name="anthropic"
)

# 攝入文檔
result = client.ingest("/path/to/your/code")
print(f"已攝入 {result['chunks_processed']} 個塊")

# 使用 RAG 進行查詢
response = client.query("身份驗證是如何工作的？")
print(response['answer'])
print(f"來源: {response['sources']}")

📚 詳細文檔

支持的 AI 供應商

供應商	成本	速度	適用場景
Ollama	免費	快速	本地開發、注重隱私、離線工作
HuggingFace	免費*	中等	基於雲的應用，無需本地設置
OpenAI	付費	非常快	生產環境，追求最佳質量
Anthropic	付費	非常快	生產環境，推理能力出色
Gemini	免費*	中等	測試，適用於 Google 生態系統

*免費套餐有使用限制

供應商示例

# 嵌入和大語言模型使用同一供應商
# Ollama（推薦 - 免費且無限制）
client = DeepRepoClient(provider_name="ollama")

# HuggingFace（免費套餐）
client = DeepRepoClient(provider_name="huggingface")

# OpenAI（付費，質量最佳）
client = DeepRepoClient(provider_name="openai")

# Anthropic（付費，推理能力出色）
# 注意：Anthropic 沒有嵌入 API，因此需要與其他供應商配合使用
client = DeepRepoClient(
    embedding_provider_name="openai",  # 使用 OpenAI 進行嵌入
    llm_provider_name="anthropic"     # 使用 Anthropic 進行大語言模型
)

# Gemini（免費套餐，有使用限制）
client = DeepRepoClient(provider_name="gemini")

# 混合使用供應商
# 示例：使用免費的 HuggingFace 進行嵌入，付費的 OpenAI 進行大語言模型
client = DeepRepoClient(
    embedding_provider_name="huggingface",
    llm_provider_name="openai"
)

API 端點

方法	端點	描述
GET	`/`	健康檢查
GET	`/stats`	獲取向量存儲統計信息
POST	`/ingest`	從目錄中攝入文檔
POST	`/chat`	使用 RAG 進行查詢
POST	`/clear-history`	清除對話歷史

API 示例

# 攝入文檔
curl -X POST http://localhost:8000/ingest \
  -H "Content-Type: application/json" \
  -d '{"path": "/path/to/code"}'

# 查詢
curl -X POST http://localhost:8000/chat \
  -H "Content-Type: application/json" \
  -d '{"query": "這段代碼是做什麼的？"}'

可用的 MCP 工具

工具	描述
`ingest_codebase`	將目錄攝入到向量存儲中
`query_codebase`	使用 RAG 查詢知識庫
`search_similar`	查找相似代碼，無需大語言模型
`get_stats`	獲取向量存儲統計信息
`clear_history`	清除對話歷史

詳細的 MCP 配置請參閱 deeprepo_core/src/deeprepo/mcp/README.md。

配置

環境變量

變量	描述	必需的供應商
`HUGGINGFACE_API_KEY` 或 `HF_TOKEN`	HuggingFace API 令牌	HuggingFace 供應商
`OPENAI_API_KEY`	OpenAI API 密鑰	OpenAI 供應商
`ANTHROPIC_API_KEY`	Anthropic API 密鑰	Anthropic 供應商
`GEMINI_API_KEY`	Google Gemini API 密鑰	Gemini 供應商

切換供應商

# 嵌入和大語言模型使用同一供應商（向後兼容）
client = DeepRepoClient(
    provider_name="ollama",  # 或 "huggingface", "openai", "anthropic", "gemini"
    storage_path="vectors.json"
)

# 嵌入和大語言模型使用不同的供應商
client = DeepRepoClient(
    embedding_provider_name="openai",    # 嵌入供應商
    llm_provider_name="anthropic",      # 大語言模型供應商
    storage_path="vectors.json"
)

或者使用環境變量：

# 單一供應商（向後兼容）
export LLM_PROVIDER=ollama
python your_script.py

# 不同的供應商
export EMBEDDING_PROVIDER=openai
export LLM_PROVIDER=anthropic
python your_script.py

常見用例：

使用 Anthropic 進行大語言模型：由於 Anthropic 沒有嵌入 API，建議與 OpenAI 或 HuggingFace 配合使用。
成本優化：使用免費的 HuggingFace 進行嵌入，付費的 OpenAI 進行大語言模型。
性能優化：使用快速的 OpenAI 進行嵌入，強大的 Anthropic 進行大語言模型。

測試

快速開始

# 運行所有單元測試（快速，無需 API 密鑰）
pytest tests/unit/ -v

# 運行測試並生成覆蓋率報告
pytest tests/unit/ --cov=deeprepo --cov-report=html

# 運行所有測試，包括集成測試
pytest tests/ -v

測試結構

單元測試 (tests/unit/) - 快速、獨立，無外部依賴
- test_storage.py - 向量存儲和餘弦相似度
- test_ingestion.py - 文件掃描和文本分塊
- test_client.py - 客戶端接口和初始化
集成測試 (tests/integration/) - 端到端測試
- test_document.py - 文檔處理流程
- test_all_providers.py - 手動驗證供應商

手動測試供應商

# 測試特定供應商
python tests/integration/test_all_providers.py ollama
python tests/integration/test_all_providers.py huggingface openai

詳細的測試文檔請參閱 tests/README.md。

開發

添加新的供應商

在 src/deeprepo/providers/ 中創建一個新文件。
實現 EmbeddingProvider 和 LLMProvider 接口。
使用 @register_embedding 和 @register_llm 裝飾器。
供應商將自動被發現！

示例：

from deeprepo.interfaces import EmbeddingProvider, LLMProvider
from deeprepo.registry import register_embedding, register_llm

@register_embedding("my_provider")
class MyEmbeddingProvider(EmbeddingProvider):
    def embed(self, text: str) -> list[float]:
        # 你的實現
        pass

@register_llm("my_provider")
class MyLLM(LLMProvider):
    def generate(self, prompt: str, context: str = None) -> str:
        # 你的實現
        pass

🔧 技術細節

架構

deeprepo_core/
├── src/deeprepo/
│   ├── client.py       # 主門面
│   ├── storage.py      # 向量存儲 (JSON + NumPy)
│   ├── ingestion.py    # 文件掃描和分塊
│   ├── interfaces.py   # 抽象基類
│   ├── registry.py     # 基於裝飾器的註冊表
│   ├── mcp/            # 用於 AI 助手的 MCP 服務器
│   │   ├── server.py       # FastMCP 服務器
│   │   └── README.md       # MCP 文檔
│   └── providers/
│       ├── ollama_v.py      # Ollama (本地，免費)
│       ├── huggingface_v.py # HuggingFace (雲，免費)
│       ├── openai_v.py      # OpenAI (付費)
│       ├── anthropic_v.py   # Anthropic (付費)
│       └── gemini_v.py      # Gemini (免費套餐)