Mcpbench
MCPBenchは、MCPサーバーのパフォーマンスを評価するためのフレームワークで、Web検索とデータベースクエリの2種類のタスクの評価をサポートし、ローカルおよびリモートのサーバーと互換性があり、主に精度、遅延、トークン消費を評価します。
3ポイント
11.8K

MCPBenchとは?

MCPBenchは、MCPサーバーのパフォーマンスを評価するためのフレームワークです。Brave SearchやDuckDuckGoなどのさまざまなMCPサーバーのタスク完了精度、遅延、トークン消費などの面での性能をテストすることができます。

MCPBenchの使い方は?

MCPBenchは、Web検索タスクとデータベースクエリタスクの2つの主要な評価シナリオをサポートしています。ユーザーは簡単なコマンドで評価プロセスを開始することができます。

適用シーン

MCPBenchは、異なるMCPサーバーの性能を比較する必要がある研究者や開発者に適しており、彼らが自分たちのニーズに最適なMCPサーバーを選択するのに役立ちます。

主要機能

複数サーバー評価
Web検索とデータベースクエリタイプを含む複数のMCPサーバーの評価をサポートします。
標準化テスト
同じLLMとエージェントの設定で公平な比較を行います。
複数の評価指標
精度、遅延、トークン消費の3つの重要な指標を評価します。
利点
標準化された評価フレームワークを提供し、テストの公平性を確保します。
ローカルおよびリモートのMCPサーバーをサポートします。
事前に用意されたデータセットが含まれており、すぐに使えます。
制限
現在は2種類のタスクタイプのみをサポートしています。
Python 3.11以上が必要です。
一部の機能は外部サービスに依存しています。

使い方

依存関係のインストール
システムにPython 3.11、nodejs、jqがインストールされていることを確認してください。
LLMの設定
APIキーとエンドポイントを設定します。
MCPサーバーの起動
サーバータイプに応じて起動方法を選択します。
評価の実行
評価するタスクタイプを選択します。

使用例

DuckDuckGoの検索性能の評価
事前に用意されたWeb検索データセットを使用して、DuckDuckGoのMCPサーバーを評価します。
異なるデータベースクエリサーバーの比較
自動車データベースデータセットを使用して、異なるMCPサーバーのクエリ性能を評価します。

よくある質問

MCPBenchはどのようなMCPサーバーをサポートしていますか?
カスタムデータセットを追加するにはどうすればいいですか?
評価結果はどのように確認できますか?

関連リソース

論文レポート
MCPサーバーの評価レポート
LangProBeベンチマーク
MCPBenchが基づいている元のプロジェクト
GitHubリポジトリ
プロジェクトのソースコード

インストール

以下のコマンドをクライアントにコピーして設定
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

A
Airweave
Airweaveは、オープンソースの人工知能エージェントとRAGシステムのコンテキスト検索層です。さまざまなアプリケーション、ツール、データベースのデータを接続して同期し、統一された検索インターフェースを通じてAIエージェントに関連する、リアルタイムの、複数のデータソースからのコンテキスト情報を提供します。
Python
15.5K
5ポイント
V
Vestige
Vestigeは認知科学に基づくAI記憶エンジンで、予測誤差ゲート、FSRS - 6間隔反復、記憶の夢など29の神経科学モジュールを実装することで、AIに長期記憶能力を提供します。3D可視化ダッシュボードと21のMCPツールを備え、完全にローカルで動作し、クラウドは必要ありません。
Rust
9.7K
4.5ポイント
M
Moltbrain
MoltBrainは、OpenClaw、MoltBook、Claude Code用に設計された長期記憶層プラグインで、自動的にプロジェクトのコンテキストを学習し、思い出すことができます。スマートな検索、観察記録、分析統計、永続的なストレージ機能を提供します。
TypeScript
11.1K
4.5ポイント
B
Bm.md
機能豊富なMarkdown排版ツールで、様々なスタイルテーマとプラットフォーム対応をサポートし、リアルタイム編集プレビュー、画像エクスポート、API統合機能を提供します
TypeScript
18.0K
5ポイント
S
Security Detections MCP
Security Detections MCPは、Model Context Protocolに基づくサーバーで、LLMがSigma、Splunk ESCU、Elastic、KQL形式を含む統一されたセキュリティ検出ルールデータベースをクエリできます。最新のバージョン3.0は自律型検出エンジニアリングプラットフォームにアップグレードされ、自動的に脅威インテリジェンスからTTPを抽出し、カバレッジのギャップを分析し、SIEMネイティブ形式の検出ルールを生成し、テストを実行して検証できます。プロジェクトには71以上のツール、11の事前構築されたワークフロープロンプト、および知識グラフシステムが含まれ、複数のSIEMプラットフォームをサポートしています。
TypeScript
10.0K
4ポイント
P
Paperbanana
Python
8.8K
5ポイント
B
Better Icons
20万以上のアイコンの検索と検索を提供するMCPサーバーとCLIツールで、150以上のアイコンライブラリをサポートし、AIアシスタントと開発者が迅速にアイコンを取得して使用できるように支援します。
TypeScript
9.6K
4.5ポイント
A
Assistant Ui
assistant-uiは、生産レベルのAIチャットインターフェイスを迅速に構築するためのオープンソースのTypeScript/Reactライブラリで、組み合わせ可能なUIコンポーネント、ストリーミング応答、アクセシビリティなどの機能を提供し、複数のAIバックエンドとモデルをサポートしています。
TypeScript
8.9K
5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
26.9K
4.8ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
21.8K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
92.7K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
40.5K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
25.4K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
34.3K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
22.7K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
34.0K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2026AIBase