Debate Agent MCP

MCPプロトコルに基づく多エージェントのディベートフレームワークで、コードレビューとディベート計画に使用されます。ClaudeやCodexなどの複数のAIエージェントを並列に実行してコードを評価し、確定的な評価システム（P0/P1/P2の深刻度分類）とプラットフォーム固有のルールを採用し、最終的に結果を統合してレビューレポートを生成します。

開発者ツール人工知能チャットボット #コードレビュー #多エージェント #ディベートフレームワーク #MCPサービス .TypeScript

スコア : 2.5ポイント

ダウンロード数 : 8.7K

更新時間 : 2025-12-12

サイトを開く

ディベートエージェントMCPとは？

ディベートエージェントMCPは、革新的なコードレビューツールです。ClaudeやCodexなどの複数のAIモデルを同時に実行して、コードの変更を並列に分析します。各AIモデルは独立してコードをレビューし、その後システムが確定的な評価ルールに基づいて結果を統合し、より包括的で信頼性の高いコードレビューの提案を提供します。

ディベートエージェントMCPをどのように使用するか？

Claude CLIやCodex CLIなどのAIモデルのコマンドラインツールをローカルにインストールし、設定するだけです。その後、MCPプロトコルを使用して、ディベートエージェントをClaude DesktopやVS CodeなどのAIアシスタントに接続します。システムは自動的にコードの変更を読み取り、複数のAIモデルを並列に実行してレビューし、総合評価と提案を返します。

適用シナリオ

ディベートエージェントMCPは、以下のシナリオに特に適しています： 1. コードマージ前の深度レビュー 2. 安全上重要なコードの複数回の検証 3. 複雑なロジックの相互チェック 4. チームのコード品質基準の統一実行 5. 新しい開発者のコードの自動化指導

主要機能

多エージェント並列レビュー

ClaudeやCodexなどの複数のAIモデルを同時に実行して、同じコードを独立してレビューし、異なる視点からの分析結果を取得します。

確定的な評価システム

ルールベースの客観的な評価システムで、AIの主観的な判断に依存せず、評価の一貫性と説明可能性を保証します。

P0/P1/P2深刻度分類

発見された問題を深刻度に応じて3つのレベルに分類します：P0（深刻な欠陥）、P1（重要な問題）、P2（軽微な問題）。これにより、優先的に処理することができます。

プラットフォーム固有のルール

Flutter、Android、iOS、バックエンドなどの異なる開発プラットフォームに対して、専用のレビュールールとベストプラクティスのチェックを提供します。

追加の認証不要

ローカルで既に設定されているAIツールの認証を再利用するため、MCPでAPIキーを再度設定する必要はありません。

Git変更統合

未コミットのGit差分を自動的に読み取り、実際に変更されたコード部分のみをレビューすることで、レビューの効率を向上させます。

利点

複数のモデルによる検証により、単一のAIの偏見や見落としを減らす

確定的な評価により、結果の一貫性と再現性を保証する

既存のAIツールの設定を再利用し、追加の認証が不要

プラットフォーム固有のルールにより、的を絞ったレビューを提供する

オープンソースフレームワークで、カスタマイズと拡張が可能

制限

複数のAIコマンドラインツールをローカルにインストールし、設定する必要がある

現在は単一ラウンドのレビューのみサポートしており、将来のバージョンでは複数ラウンドの相互検証をサポートする予定

長いコード変更ではタイムアウト（デフォルト180秒）が発生する可能性がある

実験段階であり、APIが変更される可能性がある

ローカルのAIツールの安定性と応答時間に依存する

使い方

インストールの前提条件

システムに必要なAIコマンドラインツールがインストールされ、設定されていることを確認してください。Claude CLIとCodex CLIが正しくインストールされ、認証されていることを確認します。

ディベートエージェントMCPをインストールする

npmを使用してMCPサーバーをグローバルにインストールするか、npxを使用して直接実行します。

AIアシスタントを設定する

MCPサーバーをClaude DesktopやVS CodeなどのAIアシスタントに追加します。

使用を開始する

AIアシスタントで提供されるツールを使用して、コードレビューまたはディベート計画を行います。

使用例

Flutterアプリのコードレビュー

Flutterアプリの非同期コードをレビューし、一般的なメモリリークや状態管理の問題をチェックします。

バックエンドAPIのセキュリティレビュー

バックエンドAPIコードのセキュリティ脆弱性とベストプラクティスの違反をチェックします。

技術案のディベート計画

キャッシュ戦略の選択のために、構造化されたディベート計画を作成し、異なるAIモデルの視点を収集します。

よくある質問

ディベートエージェントMCPに追加のAPIキーは必要ですか？

P0/P1/P2の深刻度レベルは具体的に何を指しますか？

カスタムのAIエージェントを追加できますか？

レビュー中にタイムアウトした場合はどうすればいいですか？

レビュー結果の正確性をどのように保証できますか？

どの開発プラットフォームがサポートされていますか？

🚀 Debate Agent MCP

コードレビューと討論計画に使用する多エージェント討論フレームワークで、P0/P1/P2の深刻度スコアリングが可能です。

🚀 クイックスタート

前提条件

エージェントのCLIをインストールし、認証する必要があります。

# Claude CLIの確認
claude --version
claude auth status  # ログイン済みであることを確認

# Codex CLIの確認
codex --version
# OpenAIを通じて認証されている必要があります

# MCPはこれらを起動するため、追加の認証は不要です

CLIユーザー向け

# グローバルにインストール
npm install -g @debate-agent/mcp-server

# MCPサーバーを起動
debate-agent

# または直接実行
npx @debate-agent/mcp-server

Claude Code向け

# MCPをClaude Codeに追加
claude mcp add debate-reviewer -- node /path/to/packages/mcp-server/dist/index.js

# 接続を確認
claude mcp list
# 表示されるはず: debate-reviewer: ✓ Connected

SDKユーザー向け

npm install @debate-agent/core

import { runDebate, createDebatePlan } from '@debate-agent/core';

// コードレビューの討論を実行
const result = await runDebate({
  question: 'Review this code for security issues',
  agents: ['codex', 'claude'],
  platform: 'backend',
});

// 討論計画を作成
const plan = createDebatePlan('Best caching strategy', ['codex', 'claude'], 'collaborative', 2);

✨ 主な機能

コードレビューと討論計画に使用する多エージェント討論フレームワーク
P0/P1/P2の深刻度スコアリング
複数のエージェントを並列実行し、結果を統合する

📦 インストール

パッケージ	説明	インストール方法
	コアロジック (フレームワーク非依存)	`npm i @debate-agent/core`
	CLIユーザー向けのMCPサーバー	`npm i -g @debate-agent/mcp-server`
	VS Code拡張機能	マーケットプレイスからインストール

💻 使用例

基本的な使用法

# グローバルにインストール
npm install -g @debate-agent/mcp-server

# MCPサーバーを起動
debate-agent

# または直接実行
npx @debate-agent/mcp-server

高度な使用法

import { runDebate, createDebatePlan } from '@debate-agent/core';

// コードレビューの討論を実行
const result = await runDebate({
  question: 'Review this code for security issues',
  agents: ['codex', 'claude'],
  platform: 'backend',
});

// 討論計画を作成
const plan = createDebatePlan('Best caching strategy', ['codex', 'claude'], 'collaborative', 2);

📚 ドキュメント

アーキテクチャの概要

┌─────────────────────────────────────────────────────────────────────────────┐
│                           DEBATE AGENT MCP                                  │
│                                                                             │
│  ┌───────────────────────────────────────────────────────────────────────┐  │
│  │                         MCP SERVER LAYER                              │  │
│  │                    (Model Context Protocol)                           │  │
│  │                                                                       │  │
│  │   Exposes tools via stdio to Claude Code / AI assistants:            │  │
│  │   • list_agents    • read_diff    • run_agent                        │  │
│  │   • debate_review  • debate_plan                                     │  │
│  │                                                                       │  │
│  └───────────────────────────────────────────────────────────────────────┘  │
│                                    │                                        │
│                                    ▼                                        │
│  ┌───────────────────────────────────────────────────────────────────────┐  │
│  │                      ORCHESTRATOR LAYER                               │  │
│  │                     (@debate-agent/core)                              │  │
│  │                                                                       │  │
│  │   Pipeline:                                                          │  │
│  │   1. Read git diff ──► 2. Run agents in parallel (Promise.all)       │  │
│  │   3. Critique round ──► 4. Deterministic scoring ──► 5. Merge        │  │
│  │                                                                       │  │
│  └───────────────────────────────────────────────────────────────────────┘  │
│                                    │                                        │
│                    ┌───────────────┴───────────────┐                        │
│                    ▼                               ▼                        │
│  ┌──────────────────────────┐    ┌──────────────────────────┐              │
│  │      Claude CLI          │    │      Codex CLI           │              │
│  │  /opt/homebrew/bin/claude│    │  /opt/homebrew/bin/codex │              │
│  │                          │    │                          │              │
│  │  spawn() as subprocess   │    │  spawn() as subprocess   │              │
│  │  Uses YOUR credentials   │    │  Uses YOUR credentials   │              │
│  └──────────────────────────┘    └──────────────────────────┘              │
│                    │                               │                        │
│                    ▼                               ▼                        │
│              Anthropic API                   OpenAI API                     │
│           (auth via local CLI)            (auth via local CLI)              │
│                                                                             │
└─────────────────────────────────────────────────────────────────────────────┘

動作原理

認証不要

MCP自体はAPIキーや認証を必要としません。ローカルにインストールされたCLIツールを調整します。

┌─────────────────────────────────────────────────────────────────┐
│  YOUR MACHINE                                                   │
│                                                                 │
│  ~/.claude/credentials  ──► claude CLI ──► Anthropic API       │
│  ~/.codex/credentials   ──► codex CLI  ──► OpenAI API          │
│                                                                 │
│  The MCP just runs: spawn("claude", ["--print", prompt])        │
│  Same as typing in your terminal!                               │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

実行フロー

Step 1: Build Prompt
├── Combine review question + git diff + platform rules
├── Add P0/P1/P2 severity definitions
└── Request JSON output format

Step 2: Parallel Execution
├── spawn("/opt/homebrew/bin/claude", ["--print", prompt])
├── spawn("/opt/homebrew/bin/codex", ["exec", prompt])
└── Both run simultaneously via Promise.all()

Step 3: Capture Output
├── Read stdout from each CLI process
└── Parse JSON responses

Step 4: Deterministic Scoring (No AI)
├── Count P0/P1/P2 findings
├── Check file accuracy against diff
├── Penalize false positives
└── Score clarity and fix quality

Step 5: Merge & Report
├── Pick winner by highest score
├── Combine unique findings from all agents
└── Generate final recommendation

ロードマップ

現在 (v1.0) - 単一レビューラウンド

Claude ──┐
         ├──► Parallel Review ──► Score ──► Merge ──► Final Report
Codex  ──┘

将来の目標 - 複数ターンの相互レビュー

敵対的な検証により、幻覚を排除する

Round 1: Initial Review (Parallel)
┌─────────┐     ┌─────────┐
│ Claude  │     │ Codex   │
│ Review  │     │ Review  │
└────┬────┘     └────┬────┘
     │               │
     ▼               ▼
Round 2: Cross-Review (Each agent reviews the other's findings)
┌─────────────────────────────────────────┐
│ Claude reviews Codex's findings         │
│ "Is P0 about null pointer valid?"       │
│ "Did Codex miss the SQL injection?"     │
└─────────────────────────────────────────┘
┌─────────────────────────────────────────┐
│ Codex reviews Claude's findings         │
│ "Is the race condition real?"           │
│ "False positive on line 42?"            │
└─────────────────────────────────────────┘
     │               │
     ▼               ▼
Round 3: Consensus Building
┌─────────────────────────────────────────┐
│ Only findings validated by BOTH agents  │
│ Hallucinations eliminated               │
│ Disputed findings flagged for human     │
└─────────────────────────────────────────┘
     │
     ▼
Final: Validated Review
┌─────────────────────────────────────────┐
│ High-confidence findings (both agreed)  │
│ Disputed findings (need human review)   │
│ Eliminated findings (proven false)      │
│ Combined score from validation rounds   │
└─────────────────────────────────────────┘

目標: エージェントが相互にレビューすることで、以下のことが可能になります。

幻覚的な発見を排除する (一方のエージェントが存在しない問題を考え出す)
見逃した問題を検出する (一方のエージェントが他方が見逃した問題を見つける)
信頼度スコアを構築する (複数のエージェントによって検証された発見はより信頼できる)
誤検出を減らす (敵対的なレビューにより、誤った評価を検出する)

MCPツール

ツール	説明
`list_agents`	すべての構成済みエージェントをリストする
`read_diff`	コミットされていないgit diffを読み取る
`run_agent`	プロンプトを使用して単一のエージェントを実行する
`debate_review`	多エージェントのP0/P1/P2コードレビュー
`debate_plan`	構造化された討論計画を作成する

設定

debate-agent.config.jsonをプロジェクトのルートに作成します。

{
  "agents": {
    "codex": {
      "name": "codex",
      "path": "/opt/homebrew/bin/codex",
      "args": ["exec", "--skip-git-repo-check"],
      "timeout_seconds": 180
    },
    "claude": {
      "name": "claude",
      "path": "/opt/homebrew/bin/claude",
      "args": ["--print", "--dangerously-skip-permissions"],
      "timeout_seconds": 180
    },
    "gemini": {
      "name": "gemini",
      "path": "/opt/homebrew/bin/gemini",
      "args": ["--prompt"],
      "timeout_seconds": 180
    }
  },
  "debate": {
    "default_agents": ["codex", "claude"],
    "include_critique_round": true,
    "default_mode": "adversarial"
  }
}

深刻度レベル

レベル	基準
P0	重大な欠陥、クラッシュ、データ損失、セキュリティ/プライバシー問題、ビルドブロッカー
P1	おそらくバグ/回帰、誤ったロジック、エラーハンドリングの欠如、テストの欠如
P2	軽微な正確性の問題、小さなロジックの隙間、非ブロッキングのテストの隙間

定義場所: packages/core/src/prompts/review-template.ts

プラットフォーム固有のルール

プラットフォーム	焦点領域
flutter	非同期の誤用、setState、dispose()、非同期でのBuildContext、Riverpodのリーク
android	マニフェスト、パーミッション、ProGuard、ライフサイクルの違反、コンテキストのリーク
ios	plist、ATS、キーチェーン、署名、メインスレッドのUI、リテンシクル
backend	DTOの不一致、HTTPコード、SQLインジェクション、認証の欠陥、レート制限
general	ヌルポインタ、リソースのリーク、競合状態、XSS、入力検証

定義場所: packages/core/src/prompts/platform-rules.ts

スコアリングシステム

スコアリングは決定論的 (AIなし) - 純粋なルールベースの評価です。

基準	ポイント	最大
P0発見	+15	45
P1発見	+8	32
P2発見	+3	12
誤検出	-10	-30
具体的な修正	+5	25
ファイルの正確性	+2	10
明瞭さ	0-10	10

最大可能スコア: 134 最小可能スコア: -30

定義場所: packages/core/src/engine/judge.ts

討論モード

モード	説明
adversarial	エージェントが相互に立場を挑戦する
consensus	エージェントが共通点を見つけるために協力する
collaborative	エージェントが相互のアイデアを発展させる

プロジェクト構造

debate-agent-mcp/
├── packages/
│   ├── core/                       # @debate-agent/core
│   │   ├── src/
│   │   │   ├── engine/
│   │   │   │   ├── debate.ts       # Orchestration (parallel execution)
│   │   │   │   ├── judge.ts        # Deterministic scoring rules
│   │   │   │   ├── merger.ts       # Combine findings from agents
│   │   │   │   └── planner.ts      # Debate plan generation
│   │   │   ├── prompts/
│   │   │   │   ├── review-template.ts   # P0/P1/P2 definitions
│   │   │   │   └── platform-rules.ts    # Platform-specific scrutiny
│   │   │   ├── tools/
│   │   │   │   ├── read-diff.ts    # Git diff reader
│   │   │   │   └── run-agent.ts    # CLI spawner (spawn())
│   │   │   ├── config.ts           # Config loader
│   │   │   ├── types.ts            # TypeScript types
│   │   │   └── index.ts            # Public exports
│   │   └── package.json
│   │
│   ├── mcp-server/                 # @debate-agent/mcp-server
│   │   ├── src/
│   │   │   ├── index.ts            # MCP server (stdio transport)
│   │   │   └── bin/cli.ts          # CLI entry point
│   │   └── package.json
│   │
│   └── vscode-extension/           # debate-agent-mcp (VS Code)
│       ├── src/
│       │   └── extension.ts
│       └── package.json
│
├── debate-agent.config.json        # Example config
├── package.json                    # Monorepo root
├── pnpm-workspace.yaml
└── README.md

統合

Claude Desktop

{
  "mcpServers": {
    "debate-agent": {
      "command": "node",
      "args": ["/path/to/packages/mcp-server/dist/index.js"]
    }
  }
}

Claude CLI

claude mcp add debate-agent -- node /path/to/packages/mcp-server/dist/index.js

VS Code / Cursor

VS Code拡張機能をインストールすると、自動的にMCPが設定されます。

開発

# リポジトリをクローン
git clone https://github.com/ferdiangunawan/debate-agent-mcp
cd debate-agent-mcp

# 依存関係をインストール
npm install

# すべてのパッケージをビルド
npm run build

# 特定のパッケージをビルド
npm run build:core
npm run build:server
npm run build:extension

🔧 技術詳細

アーキテクチャは、MCPサーバーレイヤー、オーケストレーターレイヤー、そしてClaude CLIとCodex CLIを含む多層構造になっています。
スコアリングシステムは、決定論的でAIを使用せず、ルールベースで評価されます。
討論モードには、敵対的、合意形成、協調的などがあり、エージェントの動作を制御します。

📄 ライセンス

MIT

⚠️ 重要提示

このプロジェクトは積極的に開発中です。APIや機能は予告なく変更される可能性があります。本番環境での使用は自己責任で行ってください。

💡 使用建议

エージェントのCLIを事前にインストールし、認証する必要があります。

長いdiffはエージェントのタイムアウトを引き起こす可能性があります (デフォルトは180秒)。

現在は完全なレスポンスを待ってから処理するため、ストリーミングはサポートされていません。

read_diff

リポジトリから未コミットのgit差分を読み取ります。差分内容、ファイル数、および変更されたファイルのリストを返します。

パラメータ

staged : boolean*

説明

trueの場合、ステージングされた変更のみを返します（git diff --cached）。デフォルト：false

パラメータ

path : string*

説明

リポジトリのパス。デフォルトは現在の作業ディレクトリです。

run_agent

プロンプトを使用してCLIベースのLLMエージェントを実行します。エージェントの出力、終了コード、および実行時間を返します。

パラメータ

agent : string*

説明

実行するエージェントの名前

パラメータ

prompt : string*

説明

エージェントに送信するプロンプト

パラメータ

context : string*

説明

オプションのコンテキスト情報。プロンプトと一緒に含まれます。

debate_review

未コミットの変更に対して複数のエージェントを実行し、P0/P1/P2の深刻度レベルに基づいたコードレビューを生成します。流れ：(1)git差分を収集する、(2)すべてのエージェントを並列に実行する、(3)オプションの批判ラウンド、(4)確定的なルールを使用して評価する、(5)勝者を選択する、(6)深刻度レベル付きの統合結果を生成する。

パラメータ

question : string*

説明

レビューの質問または要求（例：'このコードのバグとセキュリティ問題をレビューする'）

パラメータ

agents : array*

説明

ディベートに参加するエージェントのリスト

パラメータ

includeCritique : boolean*

説明

エージェント相互の批判ラウンドを含めるかどうか。デフォルト：true