Debate Agent MCP

一個基於MCP協議的多智能體辯論框架，用於代碼審查和辯論規劃，通過並行執行多個AI代理（如Claude、Codex）進行代碼評審，採用確定性評分系統（P0/P1/P2嚴重性分級）和平臺特定規則，最終合併結果生成評審報告。

開發者工具人工智能聊天機器人 #代碼審查 #多智能體 #辯論框架 #MCP服務 .TypeScript

評分 : 2.5分

下載量 : 8.7K

更新時間 : 2025-12-12

打開站點

什麼是Debate Agent MCP?

Debate Agent MCP是一個創新的代碼審查工具，它通過同時運行多個AI模型（如Claude和Codex）來並行分析您的代碼變更。每個AI模型獨立審查代碼，然後系統通過確定性評分規則合併它們的結果，提供更全面、更可靠的代碼審查建議。

如何使用Debate Agent MCP?

您只需在本地安裝並配置好AI模型的命令行工具（如Claude CLI和Codex CLI），然後通過MCP協議將Debate Agent連接到您的AI助手（如Claude Desktop或VS Code）。系統會自動讀取您的代碼變更，並行運行多個AI模型進行審查，並返回綜合評分和建議。

適用場景

Debate Agent MCP特別適合以下場景： 1. 代碼合併前的深度審查 2. 安全關鍵代碼的多次驗證 3. 複雜邏輯的交叉檢查 4. 團隊代碼質量標準的統一執行 5. 新開發者代碼的自動化指導

主要功能

多智能體並行審查

同時運行多個AI模型（Claude、Codex等）獨立審查同一份代碼，獲取不同視角的分析結果

確定性評分系統

基於規則的客觀評分系統，不依賴AI主觀判斷，確保評分的一致性和可解釋性

P0/P1/P2嚴重性分級

將發現問題按嚴重程度分為三級：P0（嚴重缺陷）、P1（重要問題）、P2（次要問題），幫助優先處理

平臺特定規則

針對不同開發平臺（Flutter、Android、iOS、後端等）提供專門的審查規則和最佳實踐檢查

無需額外認證

複用您本地已配置的AI工具認證，無需在MCP中重複配置API密鑰

Git變更集成

自動讀取未提交的Git差異，僅審查實際變更的代碼部分，提高審查效率

優勢

多模型驗證減少單一AI的偏見和遺漏

確定性評分確保結果一致性和可重複性

複用現有AI工具配置，無需額外認證

平臺特定規則提供針對性審查

開源框架，可自定義和擴展

侷限性

需要本地安裝和配置多個AI命令行工具

目前僅支持單輪審查，未來版本將支持多輪交叉驗證

長代碼變更可能導致超時（默認180秒）

實驗性階段，API可能發生變化

依賴本地AI工具的穩定性和響應時間

如何使用

安裝前提條件

確保您的系統已安裝並配置好所需的AI命令行工具。檢查Claude CLI和Codex CLI是否已正確安裝和認證。

安裝Debate Agent MCP

通過npm全局安裝MCP服務器，或使用npx直接運行。

配置AI助手

將MCP服務器添加到您的AI助手（如Claude Desktop或VS Code）中。

開始使用

在您的AI助手中使用提供的工具進行代碼審查或辯論規劃。

使用案例

Flutter應用代碼審查

審查Flutter應用中的異步代碼，檢查常見的內存洩漏和狀態管理問題

後端API安全審查

檢查後端API代碼中的安全漏洞和最佳實踐違反

技術方案辯論規劃

為選擇緩存策略創建結構化辯論計劃，收集不同AI模型的視角

常見問題

Debate Agent MCP需要額外的API密鑰嗎？

P0/P1/P2嚴重性等級具體指什麼？

可以添加自定義的AI代理嗎？

審查過程超時怎麼辦？

如何確保審查結果的準確性？

支持哪些開發平臺？

🚀 Debate Agent MCP

Debate Agent MCP 是一個多智能體辯論框架，主要用於代碼審查和辯論規劃，並具備 P0/P1/P2 嚴重程度評分功能。

⚠️ 重要提示

本項目正在積極開發中，API 和功能可能會在未事先通知的情況下發生變化。在生產環境中使用時，請自行承擔風險。

🚀 快速開始

前提條件

你必須安裝並認證智能體 CLI：

# 檢查 Claude CLI
claude --version
claude auth status  # 應顯示已登錄

# 檢查 Codex CLI
codex --version
# 應通過 OpenAI 進行認證

# MCP 將調用這些工具，無需額外認證

命令行界面 (CLI) 用戶

# 全局安裝
npm install -g @debate-agent/mcp-server

# 啟動 MCP 服務器
debate-agent

# 或者直接運行
npx @debate-agent/mcp-server

Claude Code 用戶

# 將 MCP 添加到 Claude Code
claude mcp add debate-reviewer -- node /path/to/packages/mcp-server/dist/index.js

# 驗證連接
claude mcp list
# 應顯示：debate-reviewer: ✓ Connected

SDK 用戶

npm install @debate-agent/core

import { runDebate, createDebatePlan } from '@debate-agent/core';

// 運行代碼審查辯論
const result = await runDebate({
  question: 'Review this code for security issues',
  agents: ['codex', 'claude'],
  platform: 'backend',
});

// 創建辯論計劃
const plan = createDebatePlan('Best caching strategy', ['codex', 'claude'], 'collaborative', 2);

✨ 主要特性

多智能體辯論框架，可用於代碼審查和辯論規劃。
支持 P0/P1/P2 嚴重程度評分，能對問題進行細緻分級。
無需 API 密鑰或認證，通過調用本地安裝的 CLI 工具實現功能。
提供多種工具，如列出智能體、讀取未提交的 git diff 等。
具備確定性的評分系統，基於規則進行評估。
支持多種辯論模式，包括對抗性、共識性和協作性。

📦 安裝指南

安裝相關包

包名	描述	安裝命令
	核心邏輯（與框架無關）	`npm i @debate-agent/core`
	面向 CLI 用戶的 MCP 服務器	`npm i -g @debate-agent/mcp-server`
	VS Code 擴展	從市場安裝

💻 使用示例

基礎用法

import { runDebate, createDebatePlan } from '@debate-agent/core';

// 運行代碼審查辯論
const result = await runDebate({
  question: 'Review this code for security issues',
  agents: ['codex', 'claude'],
  platform: 'backend',
});

// 創建辯論計劃
const plan = createDebatePlan('Best caching strategy', ['codex', 'claude'], 'collaborative', 2);

📚 詳細文檔

架構概述

┌─────────────────────────────────────────────────────────────────────────────┐
│                           DEBATE AGENT MCP                                  │
│                                                                             │
│  ┌───────────────────────────────────────────────────────────────────────┐  │
│  │                         MCP SERVER LAYER                              │  │
│  │                    (Model Context Protocol)                           │  │
│  │                                                                       │  │
│  │   Exposes tools via stdio to Claude Code / AI assistants:            │  │
│  │   • list_agents    • read_diff    • run_agent                        │  │
│  │   • debate_review  • debate_plan                                     │  │
│  │                                                                       │  │
│  └───────────────────────────────────────────────────────────────────────┘  │
│                                    │                                        │
│                                    ▼                                        │
│  ┌───────────────────────────────────────────────────────────────────────┐  │
│  │                      ORCHESTRATOR LAYER                               │  │
│  │                     (@debate-agent/core)                              │  │
│  │                                                                       │  │
│  │   Pipeline:                                                          │  │
│  │   1. Read git diff ──► 2. Run agents in parallel (Promise.all)       │  │
│  │   3. Critique round ──► 4. Deterministic scoring ──► 5. Merge        │  │
│  │                                                                       │  │
│  └───────────────────────────────────────────────────────────────────────┘  │
│                                    │                                        │
│                    ┌───────────────┴───────────────┐                        │
│                    ▼                               ▼                        │
│  ┌──────────────────────────┐    ┌──────────────────────────┐              │
│  │      Claude CLI          │    │      Codex CLI           │              │
│  │  /opt/homebrew/bin/claude│    │  /opt/homebrew/bin/codex │              │
│  │                          │    │                          │              │
│  │  spawn() as subprocess   │    │  spawn() as subprocess   │              │
│  │  Uses YOUR credentials   │    │  Uses YOUR credentials   │              │
│  └──────────────────────────┘    └──────────────────────────┘              │
│                    │                               │                        │
│                    ▼                               ▼                        │
│              Anthropic API                   OpenAI API                     │
│           (auth via local CLI)            (auth via local CLI)              │
│                                                                             │
└─────────────────────────────────────────────────────────────────────────────┘

工作原理

無需認證

MCP 本身不需要 API 密鑰或認證，它會協調你本地安裝的 CLI 工具：

┌─────────────────────────────────────────────────────────────────┐
│  YOUR MACHINE                                                   │
│                                                                 │
│  ~/.claude/credentials  ──► claude CLI ──► Anthropic API       │
│  ~/.codex/credentials   ──► codex CLI  ──► OpenAI API          │
│                                                                 │
│  The MCP just runs: spawn("claude", ["--print", prompt])        │
│  Same as typing in your terminal!                               │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

執行流程

Step 1: Build Prompt
├── Combine review question + git diff + platform rules
├── Add P0/P1/P2 severity definitions
└── Request JSON output format

Step 2: Parallel Execution
├── spawn("/opt/homebrew/bin/claude", ["--print", prompt])
├── spawn("/opt/homebrew/bin/codex", ["exec", prompt])
└── Both run simultaneously via Promise.all()

Step 3: Capture Output
├── Read stdout from each CLI process
└── Parse JSON responses

Step 4: Deterministic Scoring (No AI)
├── Count P0/P1/P2 findings
├── Check file accuracy against diff
├── Penalize false positives
└── Score clarity and fix quality

Step 5: Merge & Report
├── Pick winner by highest score
├── Combine unique findings from all agents
└── Generate final recommendation

路線圖

當前 (v1.0) - 單輪審查

Claude ──┐
         ├──► Parallel Review ──► Score ──► Merge ──► Final Report
Codex  ──┘

未來目標 - 多輪交叉審查

通過對抗驗證消除幻覺問題

Round 1: Initial Review (Parallel)
┌─────────┐     ┌─────────┐
│ Claude  │     │ Codex   │
│ Review  │     │ Review  │
└────┬────┘     └────┬────┘
     │               │
     ▼               ▼
Round 2: Cross-Review (Each agent reviews the other's findings)
┌─────────────────────────────────────────┐
│ Claude reviews Codex's findings         │
│ "Is P0 about null pointer valid?"       │
│ "Did Codex miss the SQL injection?"     │
└─────────────────────────────────────────┘
┌─────────────────────────────────────────┐
│ Codex reviews Claude's findings         │
│ "Is the race condition real?"           │
│ "False positive on line 42?"            │
└─────────────────────────────────────────┘
     │               │
     ▼               ▼
Round 3: Consensus Building
┌─────────────────────────────────────────┐
│ Only findings validated by BOTH agents  │
│ Hallucinations eliminated               │
│ Disputed findings flagged for human     │
└─────────────────────────────────────────┘
     │
     ▼
Final: Validated Review
┌─────────────────────────────────────────┐
│ High-confidence findings (both agreed)  │
│ Disputed findings (need human review)   │
│ Eliminated findings (proven false)      │
│ Combined score from validation rounds   │
└─────────────────────────────────────────┘

目標：通過讓智能體相互審查工作，我們可以：

消除幻覺發現（一個智能體虛構出不存在的問題）。
捕捉遺漏的問題（一個智能體發現另一個智能體遺漏的問題）。
建立置信度分數（多個智能體驗證的發現更可靠）。
減少誤報（對抗性審查可以發現不正確的評估）。

MCP 工具

工具	描述
`list_agents`	列出所有配置的智能體
`read_diff`	讀取未提交的 git diff
`run_agent`	使用提示運行單個智能體
`debate_review`	多智能體 P0/P1/P2 代碼審查
`debate_plan`	創建結構化的辯論計劃

配置

在項目根目錄創建 debate-agent.config.json：

{
  "agents": {
    "codex": {
      "name": "codex",
      "path": "/opt/homebrew/bin/codex",
      "args": ["exec", "--skip-git-repo-check"],
      "timeout_seconds": 180
    },
    "claude": {
      "name": "claude",
      "path": "/opt/homebrew/bin/claude",
      "args": ["--print", "--dangerously-skip-permissions"],
      "timeout_seconds": 180
    },
    "gemini": {
      "name": "gemini",
      "path": "/opt/homebrew/bin/gemini",
      "args": ["--prompt"],
      "timeout_seconds": 180
    }
  },
  "debate": {
    "default_agents": ["codex", "claude"],
    "include_critique_round": true,
    "default_mode": "adversarial"
  }
}

嚴重程度級別

級別	標準
P0	嚴重缺陷、崩潰、數據丟失、安全/隱私問題、構建阻塞問題
P1	可能的錯誤/迴歸、邏輯錯誤、缺少錯誤處理、缺少測試
P2	小的正確性問題、小的邏輯漏洞、非阻塞測試漏洞

定義位置：packages/core/src/prompts/review-template.ts

特定平臺規則

平臺	關注領域
flutter	異步濫用、setState、dispose()、異步中的 BuildContext、Riverpod 洩漏
android	清單文件、權限、ProGuard、生命週期違規、上下文洩漏
ios	plist、ATS、鑰匙串、簽名、主線程 UI、保留週期
backend	DTO 不匹配、HTTP 代碼、SQL 注入、認證缺陷、速率限制
general	空指針、資源洩漏、競態條件、XSS、輸入驗證

定義位置：packages/core/src/prompts/platform-rules.ts

評分系統

評分是確定性的（不使用 AI），基於純規則進行評估：

標準	分數	最高分
P0 發現	+15	45
P1 發現	+8	32
P2 發現	+3	12
誤報	-10	-30
具體修復	+5	25
文件準確性	+2	10
清晰度	0 - 10	10

最高可能得分：134 最低可能得分：-30

定義位置：packages/core/src/engine/judge.ts

辯論模式

模式	描述
adversarial	智能體相互挑戰立場
consensus	智能體尋求共同點
collaborative	智能體基於彼此的想法進行構建

項目結構

debate-agent-mcp/
├── packages/
│   ├── core/                       # @debate-agent/core
│   │   ├── src/
│   │   │   ├── engine/
│   │   │   │   ├── debate.ts       # Orchestration (parallel execution)
│   │   │   │   ├── judge.ts        # Deterministic scoring rules
│   │   │   │   ├── merger.ts       # Combine findings from agents
│   │   │   │   └── planner.ts      # Debate plan generation
│   │   │   ├── prompts/
│   │   │   │   ├── review-template.ts   # P0/P1/P2 definitions
│   │   │   │   └── platform-rules.ts    # Platform-specific scrutiny
│   │   │   ├── tools/
│   │   │   │   ├── read-diff.ts    # Git diff reader
│   │   │   │   └── run-agent.ts    # CLI spawner (spawn())
│   │   │   ├── config.ts           # Config loader
│   │   │   ├── types.ts            # TypeScript types
│   │   │   └── index.ts            # Public exports
│   │   └── package.json
│   │
│   ├── mcp-server/                 # @debate-agent/mcp-server
│   │   ├── src/
│   │   │   ├── index.ts            # MCP server (stdio transport)
│   │   │   └── bin/cli.ts          # CLI entry point
│   │   └── package.json
│   │
│   └── vscode-extension/           # debate-agent-mcp (VS Code)
│       ├── src/
│       │   └── extension.ts
│       └── package.json
│
├── debate-agent.config.json        # Example config
├── package.json                    # Monorepo root
├── pnpm-workspace.yaml
└── README.md

集成

Claude Desktop

{
  "mcpServers": {
    "debate-agent": {
      "command": "node",
      "args": ["/path/to/packages/mcp-server/dist/index.js"]
    }
  }
}

Claude CLI

claude mcp add debate-agent -- node /path/to/packages/mcp-server/dist/index.js

VS Code / Cursor

安裝 VS Code 擴展，它會自動配置 MCP。

開發

# 克隆倉庫
git clone https://github.com/ferdiangunawan/debate-agent-mcp
cd debate-agent-mcp

# 安裝依賴
npm install

# 構建所有包
npm run build

# 構建特定包
npm run build:core
npm run build:server
npm run build:extension