MCP Evals
MCP Evalsは、MCPツールの実装を評価するためのNode.jsパッケージとGitHub Actionです。LLMに基づく評点付けを通じて、MCPサーバーのツールが正常に動作し、良好な性能を発揮することを保証します。
2.5ポイント
10.8K

MCP Evalsとは?

MCP Evalsは、開発者がModel Context Protocol (MCP)サーバーツールの機能と性能をテストおよび検証するための評価ツールです。大型言語モデル(LLM)を使用して自動的に評点付けを行い、ツールが期待通りに動作することを確認します。

MCP Evalsの使い方は?

あなたはNode.jsパッケージまたはGitHub Actionのいずれかの方法でMCP Evalsを使用できます。評価設定ファイルを作成し、評価を実行するだけで、詳細な評点レポートを取得できます。

適用シナリオ

MCPツールを開発するチームがツールの品質を継続的に検証する必要がある場合、またはCI/CDフローで自動的にツールの性能をチェックするシナリオに適しています。

主要機能

LLMによる自動評点付け
GPT - 4などの大型言語モデルを使用して、ツールの応答品質を自動的に評価します。
多面的な評価
精度、完全性、関連性、明瞭性、推論能力の5つの側面で評点付けを行います。
GitHubとの統合
GitHub Actionとして自動的に実行され、結果をPull Requestにフィードバックします。
利点
評価プロセスを自動化し、人手によるテスト時間を節約します。
詳細な評点とフィードバックを提供し、ツールの改善に役立ちます。
CI/CDフローとシームレスに統合されます。
オープンソースプロジェクトではOpenAIの無料枠を利用できます。
制限
OpenAI APIに依存しているため、ネットワーク接続が必要です。
評価結果はLLMの主観性の影響を受ける可能性があります。
一定の設定作業が必要です。

使い方

インストール
Node.jsパッケージまたはGitHub Actionとしてインストールします。
評価ファイルを作成する
TypeScriptファイルを作成して、あなたの評価設定を定義します。
評価を実行する
CLIまたはGitHub Actionを通じて評価を実行します。

使用例

天気ツールの評価
天気検索ツールが返す情報の精度と完全性を評価します。
知識検索の評価
知識検索ツールが返す情報の精度と関連性を評価します。

よくある質問

OpenAI APIキーが必要ですか?
評価にはどのモデルが使用されますか?
評点結果をどのように解釈すればいいですか?

関連リソース

GitHubリポジトリ
プロジェクトのソースコードと問題追跡
OpenAI APIドキュメント
OpenAI APIの使用ガイド

インストール

以下のコマンドをクライアントにコピーして設定
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

V
Vestige
Vestigeは認知科学に基づくAI記憶エンジンで、予測誤差ゲート、FSRS - 6間隔反復、記憶の夢など29の神経科学モジュールを実装することで、AIに長期記憶能力を提供します。3D可視化ダッシュボードと21のMCPツールを備え、完全にローカルで動作し、クラウドは必要ありません。
Rust
11.8K
4.5ポイント
M
Moltbrain
MoltBrainは、OpenClaw、MoltBook、Claude Code用に設計された長期記憶層プラグインで、自動的にプロジェクトのコンテキストを学習し、思い出すことができます。スマートな検索、観察記録、分析統計、永続的なストレージ機能を提供します。
TypeScript
12.1K
4.5ポイント
B
Bm.md
機能豊富なMarkdown排版ツールで、様々なスタイルテーマとプラットフォーム対応をサポートし、リアルタイム編集プレビュー、画像エクスポート、API統合機能を提供します
TypeScript
19.0K
5ポイント
S
Security Detections MCP
Security Detections MCPは、Model Context Protocolに基づくサーバーで、LLMがSigma、Splunk ESCU、Elastic、KQL形式を含む統一されたセキュリティ検出ルールデータベースをクエリできます。最新のバージョン3.0は自律型検出エンジニアリングプラットフォームにアップグレードされ、自動的に脅威インテリジェンスからTTPを抽出し、カバレッジのギャップを分析し、SIEMネイティブ形式の検出ルールを生成し、テストを実行して検証できます。プロジェクトには71以上のツール、11の事前構築されたワークフロープロンプト、および知識グラフシステムが含まれ、複数のSIEMプラットフォームをサポートしています。
TypeScript
10.6K
4ポイント
P
Paperbanana
Python
11.9K
5ポイント
B
Better Icons
20万以上のアイコンの検索と検索を提供するMCPサーバーとCLIツールで、150以上のアイコンライブラリをサポートし、AIアシスタントと開発者が迅速にアイコンを取得して使用できるように支援します。
TypeScript
11.8K
4.5ポイント
A
Assistant Ui
assistant-uiは、生産レベルのAIチャットインターフェイスを迅速に構築するためのオープンソースのTypeScript/Reactライブラリで、組み合わせ可能なUIコンポーネント、ストリーミング応答、アクセシビリティなどの機能を提供し、複数のAIバックエンドとモデルをサポートしています。
TypeScript
12.7K
5ポイント
A
Apify MCP Server
Apify MCPサーバーは、モデルコンテキストプロトコル(MCP)に基づくツールで、AIアシスタントが数千の既成のクローラー、スクレイパー、自動化ツール(Apifyアクター)を通じて、ソーシャルメディア、検索エンジン、電子商取引などのウェブサイトからデータを抽出できるようにします。OAuthとSkyfireプロキシ支払いをサポートしており、HTTPSエンドポイントまたはローカルのstdio方式でClaude、VS CodeなどのMCPクライアントに統合できます。
TypeScript
11.7K
5ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
23.1K
4.5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
29.4K
4.8ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
97.6K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
46.0K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
28.0K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
35.2K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
23.5K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
34.8K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2026AIBase