Debate Agent MCP

一个基于MCP协议的多智能体辩论框架，用于代码审查和辩论规划，通过并行执行多个AI代理（如Claude、Codex）进行代码评审，采用确定性评分系统（P0/P1/P2严重性分级）和平台特定规则，最终合并结果生成评审报告。

开发者工具人工智能聊天机器人 #代码审查 #多智能体 #辩论框架 #MCP服务 .TypeScript

评分 : 2.5分

下载量 : 8.7K

更新时间 : 2025-12-12

打开站点

什么是Debate Agent MCP?

Debate Agent MCP是一个创新的代码审查工具，它通过同时运行多个AI模型（如Claude和Codex）来并行分析您的代码变更。每个AI模型独立审查代码，然后系统通过确定性评分规则合并它们的结果，提供更全面、更可靠的代码审查建议。

如何使用Debate Agent MCP?

您只需在本地安装并配置好AI模型的命令行工具（如Claude CLI和Codex CLI），然后通过MCP协议将Debate Agent连接到您的AI助手（如Claude Desktop或VS Code）。系统会自动读取您的代码变更，并行运行多个AI模型进行审查，并返回综合评分和建议。

适用场景

Debate Agent MCP特别适合以下场景： 1. 代码合并前的深度审查 2. 安全关键代码的多次验证 3. 复杂逻辑的交叉检查 4. 团队代码质量标准的统一执行 5. 新开发者代码的自动化指导

主要功能

多智能体并行审查

同时运行多个AI模型（Claude、Codex等）独立审查同一份代码，获取不同视角的分析结果

确定性评分系统

基于规则的客观评分系统，不依赖AI主观判断，确保评分的一致性和可解释性

P0/P1/P2严重性分级

将发现问题按严重程度分为三级：P0（严重缺陷）、P1（重要问题）、P2（次要问题），帮助优先处理

平台特定规则

针对不同开发平台（Flutter、Android、iOS、后端等）提供专门的审查规则和最佳实践检查

无需额外认证

复用您本地已配置的AI工具认证，无需在MCP中重复配置API密钥

Git变更集成

自动读取未提交的Git差异，仅审查实际变更的代码部分，提高审查效率

优势

多模型验证减少单一AI的偏见和遗漏

确定性评分确保结果一致性和可重复性

复用现有AI工具配置，无需额外认证

平台特定规则提供针对性审查

开源框架，可自定义和扩展

局限性

需要本地安装和配置多个AI命令行工具

目前仅支持单轮审查，未来版本将支持多轮交叉验证

长代码变更可能导致超时（默认180秒）

实验性阶段，API可能发生变化

依赖本地AI工具的稳定性和响应时间

如何使用

安装前提条件

确保您的系统已安装并配置好所需的AI命令行工具。检查Claude CLI和Codex CLI是否已正确安装和认证。

安装Debate Agent MCP

通过npm全局安装MCP服务器，或使用npx直接运行。

配置AI助手

将MCP服务器添加到您的AI助手（如Claude Desktop或VS Code）中。

开始使用

在您的AI助手中使用提供的工具进行代码审查或辩论规划。

使用案例

Flutter应用代码审查

审查Flutter应用中的异步代码，检查常见的内存泄漏和状态管理问题

后端API安全审查

检查后端API代码中的安全漏洞和最佳实践违反

技术方案辩论规划

为选择缓存策略创建结构化辩论计划，收集不同AI模型的视角

常见问题

Debate Agent MCP需要额外的API密钥吗？

P0/P1/P2严重性等级具体指什么？

可以添加自定义的AI代理吗？

审查过程超时怎么办？

如何确保审查结果的准确性？

支持哪些开发平台？

🚀 Debate Agent MCP

Debate Agent MCP 是一个多智能体辩论框架，主要用于代码审查和辩论规划，并具备 P0/P1/P2 严重程度评分功能。

⚠️ 重要提示

本项目正在积极开发中，API 和功能可能会在未事先通知的情况下发生变化。在生产环境中使用时，请自行承担风险。

🚀 快速开始

前提条件

你必须安装并认证智能体 CLI：

# 检查 Claude CLI
claude --version
claude auth status  # 应显示已登录

# 检查 Codex CLI
codex --version
# 应通过 OpenAI 进行认证

# MCP 将调用这些工具，无需额外认证

命令行界面 (CLI) 用户

# 全局安装
npm install -g @debate-agent/mcp-server

# 启动 MCP 服务器
debate-agent

# 或者直接运行
npx @debate-agent/mcp-server

Claude Code 用户

# 将 MCP 添加到 Claude Code
claude mcp add debate-reviewer -- node /path/to/packages/mcp-server/dist/index.js

# 验证连接
claude mcp list
# 应显示：debate-reviewer: ✓ Connected

SDK 用户

npm install @debate-agent/core

import { runDebate, createDebatePlan } from '@debate-agent/core';

// 运行代码审查辩论
const result = await runDebate({
  question: 'Review this code for security issues',
  agents: ['codex', 'claude'],
  platform: 'backend',
});

// 创建辩论计划
const plan = createDebatePlan('Best caching strategy', ['codex', 'claude'], 'collaborative', 2);

✨ 主要特性

多智能体辩论框架，可用于代码审查和辩论规划。
支持 P0/P1/P2 严重程度评分，能对问题进行细致分级。
无需 API 密钥或认证，通过调用本地安装的 CLI 工具实现功能。
提供多种工具，如列出智能体、读取未提交的 git diff 等。
具备确定性的评分系统，基于规则进行评估。
支持多种辩论模式，包括对抗性、共识性和协作性。

📦 安装指南

安装相关包

包名	描述	安装命令
	核心逻辑（与框架无关）	`npm i @debate-agent/core`
	面向 CLI 用户的 MCP 服务器	`npm i -g @debate-agent/mcp-server`
	VS Code 扩展	从市场安装

💻 使用示例

基础用法

import { runDebate, createDebatePlan } from '@debate-agent/core';

// 运行代码审查辩论
const result = await runDebate({
  question: 'Review this code for security issues',
  agents: ['codex', 'claude'],
  platform: 'backend',
});

// 创建辩论计划
const plan = createDebatePlan('Best caching strategy', ['codex', 'claude'], 'collaborative', 2);

📚 详细文档

架构概述

┌─────────────────────────────────────────────────────────────────────────────┐
│                           DEBATE AGENT MCP                                  │
│                                                                             │
│  ┌───────────────────────────────────────────────────────────────────────┐  │
│  │                         MCP SERVER LAYER                              │  │
│  │                    (Model Context Protocol)                           │  │
│  │                                                                       │  │
│  │   Exposes tools via stdio to Claude Code / AI assistants:            │  │
│  │   • list_agents    • read_diff    • run_agent                        │  │
│  │   • debate_review  • debate_plan                                     │  │
│  │                                                                       │  │
│  └───────────────────────────────────────────────────────────────────────┘  │
│                                    │                                        │
│                                    ▼                                        │
│  ┌───────────────────────────────────────────────────────────────────────┐  │
│  │                      ORCHESTRATOR LAYER                               │  │
│  │                     (@debate-agent/core)                              │  │
│  │                                                                       │  │
│  │   Pipeline:                                                          │  │
│  │   1. Read git diff ──► 2. Run agents in parallel (Promise.all)       │  │
│  │   3. Critique round ──► 4. Deterministic scoring ──► 5. Merge        │  │
│  │                                                                       │  │
│  └───────────────────────────────────────────────────────────────────────┘  │
│                                    │                                        │
│                    ┌───────────────┴───────────────┐                        │
│                    ▼                               ▼                        │
│  ┌──────────────────────────┐    ┌──────────────────────────┐              │
│  │      Claude CLI          │    │      Codex CLI           │              │
│  │  /opt/homebrew/bin/claude│    │  /opt/homebrew/bin/codex │              │
│  │                          │    │                          │              │
│  │  spawn() as subprocess   │    │  spawn() as subprocess   │              │
│  │  Uses YOUR credentials   │    │  Uses YOUR credentials   │              │
│  └──────────────────────────┘    └──────────────────────────┘              │
│                    │                               │                        │
│                    ▼                               ▼                        │
│              Anthropic API                   OpenAI API                     │
│           (auth via local CLI)            (auth via local CLI)              │
│                                                                             │
└─────────────────────────────────────────────────────────────────────────────┘

工作原理

无需认证

MCP 本身不需要 API 密钥或认证，它会协调你本地安装的 CLI 工具：

┌─────────────────────────────────────────────────────────────────┐
│  YOUR MACHINE                                                   │
│                                                                 │
│  ~/.claude/credentials  ──► claude CLI ──► Anthropic API       │
│  ~/.codex/credentials   ──► codex CLI  ──► OpenAI API          │
│                                                                 │
│  The MCP just runs: spawn("claude", ["--print", prompt])        │
│  Same as typing in your terminal!                               │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

执行流程

Step 1: Build Prompt
├── Combine review question + git diff + platform rules
├── Add P0/P1/P2 severity definitions
└── Request JSON output format

Step 2: Parallel Execution
├── spawn("/opt/homebrew/bin/claude", ["--print", prompt])
├── spawn("/opt/homebrew/bin/codex", ["exec", prompt])
└── Both run simultaneously via Promise.all()

Step 3: Capture Output
├── Read stdout from each CLI process
└── Parse JSON responses

Step 4: Deterministic Scoring (No AI)
├── Count P0/P1/P2 findings
├── Check file accuracy against diff
├── Penalize false positives
└── Score clarity and fix quality

Step 5: Merge & Report
├── Pick winner by highest score
├── Combine unique findings from all agents
└── Generate final recommendation

路线图

当前 (v1.0) - 单轮审查

Claude ──┐
         ├──► Parallel Review ──► Score ──► Merge ──► Final Report
Codex  ──┘

未来目标 - 多轮交叉审查

通过对抗验证消除幻觉问题

Round 1: Initial Review (Parallel)
┌─────────┐     ┌─────────┐
│ Claude  │     │ Codex   │
│ Review  │     │ Review  │
└────┬────┘     └────┬────┘
     │               │
     ▼               ▼
Round 2: Cross-Review (Each agent reviews the other's findings)
┌─────────────────────────────────────────┐
│ Claude reviews Codex's findings         │
│ "Is P0 about null pointer valid?"       │
│ "Did Codex miss the SQL injection?"     │
└─────────────────────────────────────────┘
┌─────────────────────────────────────────┐
│ Codex reviews Claude's findings         │
│ "Is the race condition real?"           │
│ "False positive on line 42?"            │
└─────────────────────────────────────────┘
     │               │
     ▼               ▼
Round 3: Consensus Building
┌─────────────────────────────────────────┐
│ Only findings validated by BOTH agents  │
│ Hallucinations eliminated               │
│ Disputed findings flagged for human     │
└─────────────────────────────────────────┘
     │
     ▼
Final: Validated Review
┌─────────────────────────────────────────┐
│ High-confidence findings (both agreed)  │
│ Disputed findings (need human review)   │
│ Eliminated findings (proven false)      │
│ Combined score from validation rounds   │
└─────────────────────────────────────────┘

目标：通过让智能体相互审查工作，我们可以：

消除幻觉发现（一个智能体虚构出不存在的问题）。
捕捉遗漏的问题（一个智能体发现另一个智能体遗漏的问题）。
建立置信度分数（多个智能体验证的发现更可靠）。
减少误报（对抗性审查可以发现不正确的评估）。

MCP 工具

工具	描述
`list_agents`	列出所有配置的智能体
`read_diff`	读取未提交的 git diff
`run_agent`	使用提示运行单个智能体
`debate_review`	多智能体 P0/P1/P2 代码审查
`debate_plan`	创建结构化的辩论计划

配置

在项目根目录创建 debate-agent.config.json：

{
  "agents": {
    "codex": {
      "name": "codex",
      "path": "/opt/homebrew/bin/codex",
      "args": ["exec", "--skip-git-repo-check"],
      "timeout_seconds": 180
    },
    "claude": {
      "name": "claude",
      "path": "/opt/homebrew/bin/claude",
      "args": ["--print", "--dangerously-skip-permissions"],
      "timeout_seconds": 180
    },
    "gemini": {
      "name": "gemini",
      "path": "/opt/homebrew/bin/gemini",
      "args": ["--prompt"],
      "timeout_seconds": 180
    }
  },
  "debate": {
    "default_agents": ["codex", "claude"],
    "include_critique_round": true,
    "default_mode": "adversarial"
  }
}

严重程度级别

级别	标准
P0	严重缺陷、崩溃、数据丢失、安全/隐私问题、构建阻塞问题
P1	可能的错误/回归、逻辑错误、缺少错误处理、缺少测试
P2	小的正确性问题、小的逻辑漏洞、非阻塞测试漏洞

定义位置：packages/core/src/prompts/review-template.ts

特定平台规则

平台	关注领域
flutter	异步滥用、setState、dispose()、异步中的 BuildContext、Riverpod 泄漏
android	清单文件、权限、ProGuard、生命周期违规、上下文泄漏
ios	plist、ATS、钥匙串、签名、主线程 UI、保留周期
backend	DTO 不匹配、HTTP 代码、SQL 注入、认证缺陷、速率限制
general	空指针、资源泄漏、竞态条件、XSS、输入验证

定义位置：packages/core/src/prompts/platform-rules.ts

评分系统

评分是确定性的（不使用 AI），基于纯规则进行评估：

标准	分数	最高分
P0 发现	+15	45
P1 发现	+8	32
P2 发现	+3	12
误报	-10	-30
具体修复	+5	25
文件准确性	+2	10
清晰度	0 - 10	10

最高可能得分：134 最低可能得分：-30

定义位置：packages/core/src/engine/judge.ts

辩论模式

模式	描述
adversarial	智能体相互挑战立场
consensus	智能体寻求共同点
collaborative	智能体基于彼此的想法进行构建

项目结构

debate-agent-mcp/
├── packages/
│   ├── core/                       # @debate-agent/core
│   │   ├── src/
│   │   │   ├── engine/
│   │   │   │   ├── debate.ts       # Orchestration (parallel execution)
│   │   │   │   ├── judge.ts        # Deterministic scoring rules
│   │   │   │   ├── merger.ts       # Combine findings from agents
│   │   │   │   └── planner.ts      # Debate plan generation
│   │   │   ├── prompts/
│   │   │   │   ├── review-template.ts   # P0/P1/P2 definitions
│   │   │   │   └── platform-rules.ts    # Platform-specific scrutiny
│   │   │   ├── tools/
│   │   │   │   ├── read-diff.ts    # Git diff reader
│   │   │   │   └── run-agent.ts    # CLI spawner (spawn())
│   │   │   ├── config.ts           # Config loader
│   │   │   ├── types.ts            # TypeScript types
│   │   │   └── index.ts            # Public exports
│   │   └── package.json
│   │
│   ├── mcp-server/                 # @debate-agent/mcp-server
│   │   ├── src/
│   │   │   ├── index.ts            # MCP server (stdio transport)
│   │   │   └── bin/cli.ts          # CLI entry point
│   │   └── package.json
│   │
│   └── vscode-extension/           # debate-agent-mcp (VS Code)
│       ├── src/
│       │   └── extension.ts
│       └── package.json
│
├── debate-agent.config.json        # Example config
├── package.json                    # Monorepo root
├── pnpm-workspace.yaml
└── README.md

集成

Claude Desktop

{
  "mcpServers": {
    "debate-agent": {
      "command": "node",
      "args": ["/path/to/packages/mcp-server/dist/index.js"]
    }
  }
}

Claude CLI

claude mcp add debate-agent -- node /path/to/packages/mcp-server/dist/index.js

VS Code / Cursor

安装 VS Code 扩展，它会自动配置 MCP。

开发

# 克隆仓库
git clone https://github.com/ferdiangunawan/debate-agent-mcp
cd debate-agent-mcp

# 安装依赖
npm install

# 构建所有包
npm run build

# 构建特定包
npm run build:core
npm run build:server
npm run build:extension