Mcpbench
MCPBenchは、MCPサーバーのパフォーマンスを評価するためのフレームワークで、Web検索とデータベースクエリの2種類のタスクの評価をサポートし、ローカルおよびリモートのサーバーと互換性があり、主に精度、遅延、トークン消費を評価します。
3ポイント
7.5K

MCPBenchとは?

MCPBenchは、MCPサーバーのパフォーマンスを評価するためのフレームワークです。Brave SearchやDuckDuckGoなどのさまざまなMCPサーバーのタスク完了精度、遅延、トークン消費などの面での性能をテストすることができます。

MCPBenchの使い方は?

MCPBenchは、Web検索タスクとデータベースクエリタスクの2つの主要な評価シナリオをサポートしています。ユーザーは簡単なコマンドで評価プロセスを開始することができます。

適用シーン

MCPBenchは、異なるMCPサーバーの性能を比較する必要がある研究者や開発者に適しており、彼らが自分たちのニーズに最適なMCPサーバーを選択するのに役立ちます。

主要機能

複数サーバー評価
Web検索とデータベースクエリタイプを含む複数のMCPサーバーの評価をサポートします。
標準化テスト
同じLLMとエージェントの設定で公平な比較を行います。
複数の評価指標
精度、遅延、トークン消費の3つの重要な指標を評価します。
利点
標準化された評価フレームワークを提供し、テストの公平性を確保します。
ローカルおよびリモートのMCPサーバーをサポートします。
事前に用意されたデータセットが含まれており、すぐに使えます。
制限
現在は2種類のタスクタイプのみをサポートしています。
Python 3.11以上が必要です。
一部の機能は外部サービスに依存しています。

使い方

依存関係のインストール
システムにPython 3.11、nodejs、jqがインストールされていることを確認してください。
LLMの設定
APIキーとエンドポイントを設定します。
MCPサーバーの起動
サーバータイプに応じて起動方法を選択します。
評価の実行
評価するタスクタイプを選択します。

使用例

DuckDuckGoの検索性能の評価
事前に用意されたWeb検索データセットを使用して、DuckDuckGoのMCPサーバーを評価します。
異なるデータベースクエリサーバーの比較
自動車データベースデータセットを使用して、異なるMCPサーバーのクエリ性能を評価します。

よくある質問

MCPBenchはどのようなMCPサーバーをサポートしていますか?
カスタムデータセットを追加するにはどうすればいいですか?
評価結果はどのように確認できますか?

関連リソース

論文レポート
MCPサーバーの評価レポート
LangProBeベンチマーク
MCPBenchが基づいている元のプロジェクト
GitHubリポジトリ
プロジェクトのソースコード

インストール

以下のコマンドをクライアントにコピーして設定
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

M
MCP
Microsoft公式のMCPサーバーで、AIアシスタントに最新のMicrosoft技術ドキュメントの検索と取得機能を提供します。
10.0K
5ポイント
A
Aderyn
アデリンは、Rustで書かれたオープンソースのSolidityスマートコントラクト静的分析ツールで、開発者やセキュリティ研究者がSolidityコードの脆弱性を発見するのを支援します。FoundryとHardhatプロジェクトをサポートし、複数の形式のレポートを生成でき、VSCode拡張機能も提供します。
Rust
5.9K
5ポイント
D
Devtools Debugger MCP
Node.jsデバッガーMCPサーバーは、Chrome DevToolsプロトコルに基づく完全なデバッグ機能を提供します。ブレークポイントの設定、ステップ実行、変数のチェック、式の評価などが含まれます。
TypeScript
6.4K
4ポイント
S
Scrapling
Scraplingは適応型ウェブページのスクレイピングライブラリで、ウェブサイトの変化を自動的に学習し、要素を再配置します。複数のスクレイピング方法とAI統合をサポートし、高性能な解析と開発者に優しい体験を提供します。
Python
8.9K
5ポイント
M
Mcpjungle
MCPJungleは自ホスト型のMCPゲートウェイで、複数のMCPサーバーを集中的に管理および代理し、AIエージェントに統一されたツールアクセスインターフェースを提供します。
Go
0
4.5ポイント
C
Cipher
Cipherは、プログラミングAIエージェント向けに設計されたオープンソースのメモリ層フレームワークです。MCPプロトコルを通じてさまざまなIDEとAIコーディングアシスタントと統合し、自動記憶生成、チーム記憶共有、デュアルシステム記憶管理などの核心機能を提供します。
TypeScript
0
5ポイント
N
Nexus
NexusはAIツール集約ゲートウェイで、複数のMCPサーバーとLLMプロバイダーの接続をサポートし、統一されたエンドポイントを通じてツール検索、実行、およびモデルルーティング機能を提供し、セキュリティ認証とレート制限をサポートします。
Rust
0
4ポイント
S
Shadcn Ui MCP Server
AIワークフローにshadcn/uiコンポーネントの統合を提供するMCPサーバーで、React、Svelte、Vueフレームワークをサポートし、コンポーネントのソースコード、使用例、メタデータへのアクセス機能を備えています。
TypeScript
10.1K
5ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
12.4K
4.5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
16.2K
4.8ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
44.1K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
23.5K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
12.0K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
14.9K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
14.6K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
21.4K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIBase