Repo Graphrag MCP

Repo GraphRAG MCP Server 是一個基於 MCP 協議的服務，利用 LightRAG 和 Tree-sitter 從代碼和文本文檔中構建知識圖譜，並提供問答、實現規劃等功能。

開發者工具知識管理與記憶 #知識圖譜 #代碼分析 #智能問答 #實現規劃 .Python

評分 : 2.5分

下載量 : 10.2K

更新時間 : 2025-12-12

打開站點

什麼是Repo GraphRAG MCP Server?

Repo GraphRAG是一個基於知識圖譜的代碼分析工具。它能夠自動掃描您的代碼庫，理解代碼結構、函數關係和技術文檔，然後構建一個智能的知識圖譜。基於這個圖譜，您可以： • 詢問項目相關問題，獲得準確的技術答案 • 規劃新功能的實現步驟 • 理解複雜的代碼架構它支持13種編程語言，包括Python、JavaScript、Java、Go等主流語言。

如何使用Repo GraphRAG?

使用Repo GraphRAG非常簡單，只需三個步驟： 1. **安裝配置**：安裝必要的依賴並配置API密鑰 2. **構建圖譜**：讓工具掃描您的代碼庫並構建知識圖譜 3. **開始使用**：通過自然語言提問或請求功能規劃工具會自動處理代碼解析、關係提取和知識組織，您只需要關注業務需求。

適用場景

Repo GraphRAG特別適合以下場景： • **新成員入職**：快速瞭解大型代碼庫的結構和設計 • **功能開發**：規劃新功能的實現步驟和影響範圍 • **代碼審查**：理解代碼依賴關係和潛在風險 • **技術文檔**：基於代碼生成準確的技術說明 • **重構規劃**：評估代碼修改的影響和實施方案

主要功能

智能知識圖譜構建

自動分析代碼庫，提取實體（類、函數、變量等）和它們之間的關係，構建結構化的知識圖譜。支持增量更新，只重新分析有變動的文件。

智能問答系統

基於構建的知識圖譜，回答關於代碼庫的技術問題。可以詢問項目結構、設計模式、API接口等任何技術細節。

實現規劃助手

當您需要添加新功能或修改現有代碼時，提供詳細的實現步驟和注意事項。幫助您理解需要修改哪些文件，以及如何組織代碼。

多語言支持

支持13種編程語言，包括Python、JavaScript/TypeScript、Java/Kotlin、C/C++、Go、Rust、C#、Ruby、HTML/CSS等主流語言。

智能實體合併

自動識別代碼和文檔中提到的相同實體，將它們合併為統一的表示。確保知識圖譜的一致性和準確性。

靈活的LLM集成

支持多種AI模型提供商，包括Anthropic Claude、OpenAI GPT、Google Gemini和Azure OpenAI。可以根據需求選擇最適合的模型。

優勢

智能理解代碼上下文，提供準確的答案和建議

支持增量更新，後續分析速度更快

無需手動編寫文檔，自動從代碼中提取知識

支持多種AI模型，靈活適應不同需求

開源免費，可以自定義和擴展功能

侷限性

首次構建知識圖譜需要較長時間（特別是大型項目）

不支持二進制文件（如PDF、Word、Excel）的解析

需要配置API密鑰才能使用AI功能

對非常規代碼結構的識別可能有限

需要一定的學習成本來掌握最佳使用方式

如何使用

安裝準備

確保您的系統已安裝Python 3.10+和uv包管理器。然後克隆項目倉庫並安裝依賴。

環境配置

複製環境配置文件，並根據您選擇的AI服務商設置API密鑰。

配置MCP客戶端

根據您使用的客戶端（如Claude Desktop、VS Code Copilot等）配置MCP服務器連接。

構建知識圖譜

首次使用時，需要讓工具掃描您的代碼庫並構建知識圖譜。

開始使用

現在您可以開始提問或請求功能規劃了。所有命令都以'graph:'開頭。

使用案例

新成員瞭解項目

剛加入項目團隊，需要快速瞭解代碼庫的整體結構和主要組件。

規劃新功能實現

需要在現有項目中添加用戶認證功能，但不確定從哪裡開始和需要修改哪些文件。

代碼審查輔助

需要理解一個複雜函數的調用鏈和依賴關係，以便進行代碼審查。

技術債務評估

想要了解項目中哪些部分需要重構或存在技術債務。

常見問題

Repo GraphRAG支持哪些編程語言？

構建知識圖譜需要多長時間？

是否需要互聯網連接？

可以處理多大的代碼庫？

如何更新已構建的知識圖譜？

支持哪些AI模型提供商？

數據安全如何保障？

出現錯誤如何調試？

🚀 Repo GraphRAG MCP 服務器

Repo GraphRAG MCP 服務器是一個 MCP（模型上下文協議）服務器，它使用 LightRAG 和 Tree-sitter 從倉庫或目錄中的代碼和基於文本的文檔（僅文本，不解析 PDF/Word/Excel 文件）構建知識圖譜，並利用該圖譜進行問答和實現規劃。它提供了用於圖譜構建（graph_create）、實現規劃（graph_plan）和問答（graph_query）的工具。

📊 知識圖譜創建（graph_create）：分析代碼/文檔以構建知識圖譜和嵌入索引（支持增量更新）
🔧 實現規劃（graph_plan）：根據知識圖譜（可選地結合向量搜索）為修改/添加請求輸出實現計劃和具體的更改步驟
🔍 問答（graph_query）：根據知識圖譜（可選地結合向量搜索）回答問題

🚀 快速開始

前提條件

Python 3.10 及以上版本
uv 包管理器
所選大語言模型（LLM）提供商的憑證（設置所需的環境變量；請參閱下面的 LLM 提供商部分）

1. 安裝

# 從 GitHub 克隆倉庫
git clone https://github.com/yumeiriowl/repo-graphrag-mcp.git
cd repo-graphrag-mcp

# 安裝依賴項
uv sync

2. 環境設置

# 複製設置文件
cp .env.example .env

# 編輯設置文件
nano .env  # 或使用其他編輯器

3. 環境變量（LLM 設置）

在 .env 文件中配置設置：

示例：使用 Anthropic 模型

# 用於圖譜創建的 LLM 提供商
GRAPH_CREATE_PROVIDER=anthropic  # 也可以是 openai、gemini、azure_openai

# 用於規劃和問答的提供商
GRAPH_ANALYSIS_PROVIDER=anthropic # 也可以是 openai、gemini、azure_openai

# API 密鑰（設置與所選提供商對應的變量）
ANTHROPIC_API_KEY=your_anthropic_api_key # 或 openai、gemini、azure_openai

# AZURE_OPENAI_API_KEY=your_azure_openai_api_key
# AZURE_OPENAI_ENDPOINT=https://your-resource.openai.azure.com/
# AZURE_API_VERSION=azure_openai_api_version

# OPENAI_API_KEY=your_openai_api_key
# OPENAI_BASE_URL=http://localhost:1234/v1  # 適用於 LM Studio 或其他兼容 OpenAI 的本地服務器

# GEMINI_API_KEY=your_gemini_api_key

# 用於圖譜創建的 LLM 模型
GRAPH_CREATE_MODEL_NAME=claude-3-5-haiku-20241022

# 用於規劃和問答的 LLM 模型
GRAPH_ANALYSIS_MODEL_NAME=claude-sonnet-4-20250514

4. MCP 客戶端設置

Claude Code

claude mcp add repo-graphrag \
-- uv --directory /absolute/path/to/repo-graphrag-mcp run server.py

VS Code GitHub Copilot 擴展

mcp.json：

{
  "servers": {
    "repo-graphrag-server": {
      "type": "stdio",
      "command": "uv",
      "args": [
        "--directory",
        "/absolute/path/to/repo-graphrag-mcp",
        "run",
        "server.py"
      ]
    }
  }
}

其他 MCP 客戶端

任何支持 MCP 協議的客戶端都可以使用。

5. 使用方法

以下工具可在 MCP 客戶端中使用。所有命令必須以 graph: 開頭。

`graph_create` - 構建/更新知識圖譜

分析目標倉庫/目錄並構建知識圖譜和向量嵌入索引（支持增量更新）。使用 GRAPH_CREATE_PROVIDER 和 GRAPH_CREATE_MODEL_NAME。

要素：

graph:（必需）
要分析的目錄路徑（建議使用絕對路徑）
要創建的存儲名稱（默認："storage"）

示例：

graph: /absolute/path/to/your/repository my_project
graph: /absolute/path/to/your/repository my_project graphify
graph: C:\\projects\\myapp webapp_storage please create storage

關於增量更新：當您使用現有的存儲名稱再次運行 graph_create 時，僅重新分析更改/添加/刪除的文件；其他文件將被跳過。如果您想在更改嵌入模型或提取設置（DOC_DEFINITION_LIST、NO_PROCESS_LIST、目標擴展名等）後重建，請刪除現有的存儲或指定新的存儲名稱，並使用 graph_create 或 standalone_graph_creator.py 重新創建。

注意（性能）：首次創建圖譜時，隨著文件數量的增加，所需時間會更長。作為參考，如果文件數量超過 1000 個，建議縮小目標目錄範圍（處理時間取決於環境和文件大小）。增量更新僅重新分析差異部分，因此上述參考不一定適用於更新操作。

注意（首次下載）：如果指定的嵌入模型在首次創建圖譜時未緩存，將自動下載（後續運行將使用緩存）。

`graph_plan` - 實現支持

根據知識圖譜（可選地結合向量搜索），提供詳細的實現計劃和說明，以便 MCP 客戶端（代理）可以執行實際工作。使用 GRAPH_ANALYSIS_PROVIDER 和 GRAPH_ANALYSIS_MODEL_NAME。

要素：

graph:（必需）
實現/修改請求
存儲名稱（默認："storage"）

示例：

graph: I want to add user authentication my_project
graph: my_project Add GraphQL support to the REST API
graph: Improve API performance under high load webapp_storage

`graph_query` - 問答

根據知識圖譜（可選地結合向量搜索），回答有關目標倉庫/目錄的問題。使用 GRAPH_ANALYSIS_PROVIDER 和 GRAPH_ANALYSIS_MODEL_NAME。

要素：

graph:（必需）
問題內容
存儲名稱（默認："storage"）

示例：

graph: Tell me about this project's API endpoints my_project
graph: my_project Explain the main classes and their roles
graph: About the database design webapp_storage

⚙️ 配置選項

LLM 提供商

支持的提供商和所需的環境變量

屬性	詳情
提供商	Anthropic Claude、OpenAI GPT、Google Gemini、Azure OpenAI
標識符	`anthropic`、`openai`、`gemini`、`azure_openai`
所需環境變量	`ANTHROPIC_API_KEY`、`OPENAI_API_KEY`、`GEMINI_API_KEY`、`AZURE_OPENAI_API_KEY`、`AZURE_OPENAI_ENDPOINT`、`AZURE_API_VERSION`

在 .env 文件中，將標識符指定為 GRAPH_CREATE_PROVIDER / GRAPH_ANALYSIS_PROVIDER。

嵌入模型

默認值：BAAI/bge-m3
兼容性：支持與 Hugging Face sentence-transformers 兼容的模型
首次運行：如果指定的嵌入模型未緩存，將自動下載。緩存位置取決於環境/設置。下載時間和磁盤空間取決於模型大小。
需認證的模型：對於需要認證的 Hugging Face 模型，請在 .env 文件中設置 HUGGINGFACE_HUB_TOKEN。

HUGGINGFACE_HUB_TOKEN=your_hf_token

`graph_plan` 和 `graph_query` 的規劃/查詢設置

實現說明：本節中的設置將直接傳遞給 LightRAG 的內置 QueryParam。此 MCP 不實現自定義檢索或令牌預算邏輯，而是直接複用 LightRAG 的行為。

檢索/搜索模式

搜索模式遵循 LightRAG。在 .env 文件的 SEARCH_MODE 中設置以下選項之一。

mix：向量搜索和知識圖譜搜索的組合（推薦）
hybrid：本地搜索和全局搜索的組合
naive：簡單向量搜索
local：基於社區的搜索
global：全局社區搜索

令牌預算（輸入側）

輸入側令牌預算控制為規劃和問答組裝的上下文量（LightRAG QueryParam）。這些與模型輸出令牌限制無關。

MAX_TOTAL_TOKENS：每個查詢的總體輸入上下文預算（實體 + 關係 + 檢索到的塊 + 系統提示）。默認值：30000。
MAX_ENTITY_TOKENS：實體上下文的預算（輸入側）。默認值：6000。
MAX_RELATION_TOKENS：關係上下文的預算（輸入側）。默認值：8000。

注意：輸出令牌限制通過 GRAPH_ANALYSIS_MAX_TOKEN_SIZE（用於規劃/問答）和 GRAPH_CREATE_MAX_TOKEN_SIZE（用於圖譜創建任務）分別控制。如果顯著增加輸入預算，請確保您的模型的總上下文窗口能夠容納輸入和輸出。

實體合併

此 MCP 可以根據語義相似度將從文檔中提取的實體與從代碼中提取的實體進行合併。目標是將引用（例如，代碼中定義並在文檔中提及的類或函數）統一為一個合併後的實體。

工作原理：名稱通過排除規則進行規範化和過濾；文檔實體和當前遍代碼實體進行嵌入，並使用餘弦相似度（FAISS）進行比較。超過閾值的實體對將被合併，合併描述和文件路徑。
控制選項：
- MERGE_ENABLED（默認：true）：啟用/禁用實體合併。
- MERGE_SCORE_THRESHOLD（默認：0.95）：合併的餘弦相似度閾值。
- 排除設置：MERGE_EXCLUDE_* 列表、私有名稱排除、名稱長度限制和自定義模式。
執行方式：
- 啟用後，合併操作在圖譜創建/更新流程中（實體提取後）運行。
- 您也可以運行獨立工具：uv run standalone_entity_merger.py <storage_dir_path>

詳細環境變量

所有環境變量和默認值可以通過將 .env.example 複製到 .env 進行配置。

屬性	詳情
`GRAPH_CREATE_PROVIDER`	用於圖譜創建的 LLM 提供商
`GRAPH_ANALYSIS_PROVIDER`	用於規劃/問答的 LLM 提供商
`ANTHROPIC_API_KEY`	Anthropic API 密鑰
`AZURE_OPENAI_API_KEY`	Azure OpenAI API 密鑰
`AZURE_OPENAI_ENDPOINT`	Azure OpenAI 端點 URL
`AZURE_API_VERSION`	Azure OpenAI API 版本
`OPENAI_API_KEY`	OpenAI API 密鑰
`OPENAI_BASE_URL`	兼容 OpenAI 的端點基礎 URL（例如 LM Studio http://localhost:1234/v1）
`GEMINI_API_KEY`	Google Gemini API 密鑰
`GRAPH_CREATE_MODEL_NAME`	用於圖譜創建的 LLM 模型名稱
`GRAPH_ANALYSIS_MODEL_NAME`	用於規劃/問答的 LLM 模型名稱
`GRAPH_CREATE_MAX_TOKEN_SIZE`	圖譜創建期間 LLM 的最大輸出令牌數
`GRAPH_ANALYSIS_MAX_TOKEN_SIZE`	規劃/問答期間 LLM 的最大輸出令牌數
`MAX_TOTAL_TOKENS`	每個規劃/查詢的總體輸入側令牌預算（實體 + 關係 + 塊 + 系統）
`MAX_ENTITY_TOKENS`	實體上下文的輸入側令牌預算
`MAX_RELATION_TOKENS`	關係上下文的輸入側令牌預算
`EMBEDDING_MODEL_NAME`	嵌入模型名稱（Hugging Face）
`EMBEDDING_DIM`	嵌入向量維度
`EMBEDDING_MAX_TOKEN_SIZE`	嵌入的最大令牌長度
`HUGGINGFACE_HUB_TOKEN`	HF 認證令牌（可選）
`PARALLEL_NUM`	並行度（併發 LLM/嵌入任務）
`CHUNK_MAX_TOKENS`	每個塊的最大令牌數
`MAX_DEPTH`	Tree-sitter 遍歷的最大深度
`RATE_LIMIT_MIN_INTERVAL`	API 調用之間的最小間隔（秒）
`RATE_LIMIT_ERROR_WAIT_TIME`	速率限制錯誤時的等待時間（秒）
`SEARCH_TOP_K`	搜索中要檢索的結果數量
`SEARCH_MODE`	搜索模式（`naive`/`local`/`global`/`hybrid`/`mix`）
`DOC_EXT_TEXT_FILES`	視為文檔（文本）文件的擴展名（逗號分隔）
`DOC_EXT_SPECIAL_FILES`	無擴展名的特殊文件名（文本）（逗號分隔）
`DOC_DEFINITION_LIST`	從文檔中提取的實體類型
`NO_PROCESS_LIST`	要排除的文件/目錄（逗號分隔）
`MERGE_ENABLED`	啟用實體合併（true/false）
`MERGE_SCORE_THRESHOLD`	合併的餘弦相似度閾值
`MERGE_EXCLUDE_MAGIC_METHODS`	魔術方法的排除列表
`MERGE_EXCLUDE_GENERIC_TERMS`	通用術語的排除列表
`MERGE_EXCLUDE_TEST_RELATED`	與測試相關的術語的排除列表
`MERGE_EXCLUDE_PRIVATE_ENTITIES_ENABLED`	排除私有實體（前導下劃線）（true/false）
`MERGE_EXCLUDE_CUSTOM_PATTERNS`	額外的排除模式（允許通配符）
`MERGE_MIN_NAME_LENGTH`	合併時實體名稱的最小長度
`MERGE_MAX_NAME_LENGTH`	合併時實體名稱的最大長度

🧬 支持的語言 (v0.2.2)

支持以下 13 種語言：

Python
C
C++
Rust
C#
Go
Ruby
Java
Kotlin
JavaScript
TypeScript
HTML
CSS

🏗️ MCP 結構

repo-graphrag-mcp/
├── README.md
├── CHANGELOG.md              # 變更日誌
├── LICENSE                   # 許可證 (MIT)
├── pyproject.toml            # 包設置
├── server.py                 # MCP 服務器入口點
├── .env.example              # 環境變量模板
├── standalone_graph_creator.py   # 獨立圖譜構建器
├── standalone_entity_merger.py   # 獨立實體合併器
├── repo_graphrag/            # 包
│   ├── config/               # 配置
│   ├── initialization/       # 初始化
│   ├── llm/                  # LLM 客戶端
│   ├── processors/           # 分析/圖譜構建
│   ├── utils/                # 實用工具
│   ├── graph_storage_creator.py  # 存儲創建
│   └── prompts.py            # 提示信息
└── logs/                     # 日誌輸出

🛠️ 獨立執行

您也可以在不使用 MCP 客戶端的情況下運行：

standalone_graph_creator.py - 構建知識圖譜

分析倉庫並創建知識圖譜：

uv run standalone_graph_creator.py <read_dir_path> <storage_name>

示例：

uv run standalone_graph_creator.py /home/user/myproject my_storage
uv run standalone_graph_creator.py C:\\projects\\webapp webapp_storage

standalone_entity_merger.py - 實體合併

合併現有存儲中的實體：

uv run standalone_entity_merger.py <storage_dir_path>

示例：

uv run standalone_entity_merger.py /home/user/myproject/my_storage
uv run standalone_entity_merger.py C:\\projects\\webapp/webapp_storage

注意：

存儲目錄必須事先通過 graph_create 或 standalone_graph_creator.py 創建。

🙏 致謝

此 MCP 基於以下庫構建：

LightRAG - GraphRAG 實現
Tree-sitter - 代碼解析

📄 許可證

此 MCP 根據 MIT 許可證發佈。有關詳細信息，請參閱 LICENSE 文件。

Markdownify MCP

Markdownify是一個多功能文件轉換服務，支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。

百度地圖MCP Server是國內首個兼容MCP協議的地圖服務，提供地理編碼、路線規劃等10個標準化API接口，支持Python和Typescript快速接入，賦能智能體實現地圖相關功能。

Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器，提供豐富的網頁抓取、搜索和內容提取功能。

TypeScript

155.9K

5分

Sequential Thinking MCP Server

一個基於MCP協議的結構化思維服務器，通過定義思考階段幫助分解複雜問題並生成總結

Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具，通過自然語言描述幫助開發者快速創建現代化UI組件，支持多種IDE集成。

JavaScript

25.4K

5分

Edgeone Pages MCP Server

EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務

一個基於Python的MCP服務器，通過Notion API提供高級待辦事項管理和內容組織功能，實現AI模型與Notion的無縫集成。

Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務，通過Model Context Protocol直接集成到提示中，解決LLM使用過時信息的問題。

智啟未來，您的人工智慧解決方案智庫

Repo Graphrag MCP

概述

工具列表

內容詳情

替代品

什麼是Repo GraphRAG MCP Server?

如何使用Repo GraphRAG?

適用場景

主要功能

如何使用

使用案例

常見問題

相關資源

安裝

🚀 Repo GraphRAG MCP 服務器

🚀 快速開始

前提條件

1. 安裝

2. 環境設置

3. 環境變量（LLM 設置）

示例：使用 Anthropic 模型

4. MCP 客戶端設置

Claude Code

VS Code GitHub Copilot 擴展

其他 MCP 客戶端

5. 使用方法

graph_create - 構建/更新知識圖譜

graph_plan - 實現支持

graph_query - 問答

⚙️ 配置選項

LLM 提供商

嵌入模型

graph_plan 和 graph_query 的規劃/查詢設置

檢索/搜索模式

令牌預算（輸入側）

實體合併

詳細環境變量

🧬 支持的語言 (v0.2.2)

🏗️ MCP 結構

🛠️ 獨立執行

standalone_graph_creator.py - 構建知識圖譜

standalone_entity_merger.py - 實體合併

🙏 致謝

📄 許可證

替代品

`graph_create` - 構建/更新知識圖譜

`graph_plan` - 實現支持

`graph_query` - 問答

`graph_plan` 和 `graph_query` 的規劃/查詢設置