MCP Evals
MCP Evalsは、MCPツールの実装を評価するためのNode.jsパッケージとGitHub Actionです。LLMに基づく評点付けを通じて、MCPサーバーのツールが正常に動作し、良好な性能を発揮することを保証します。
2.5ポイント
6.3K

MCP Evalsとは?

MCP Evalsは、開発者がModel Context Protocol (MCP)サーバーツールの機能と性能をテストおよび検証するための評価ツールです。大型言語モデル(LLM)を使用して自動的に評点付けを行い、ツールが期待通りに動作することを確認します。

MCP Evalsの使い方は?

あなたはNode.jsパッケージまたはGitHub Actionのいずれかの方法でMCP Evalsを使用できます。評価設定ファイルを作成し、評価を実行するだけで、詳細な評点レポートを取得できます。

適用シナリオ

MCPツールを開発するチームがツールの品質を継続的に検証する必要がある場合、またはCI/CDフローで自動的にツールの性能をチェックするシナリオに適しています。

主要機能

LLMによる自動評点付け
GPT - 4などの大型言語モデルを使用して、ツールの応答品質を自動的に評価します。
多面的な評価
精度、完全性、関連性、明瞭性、推論能力の5つの側面で評点付けを行います。
GitHubとの統合
GitHub Actionとして自動的に実行され、結果をPull Requestにフィードバックします。
利点
評価プロセスを自動化し、人手によるテスト時間を節約します。
詳細な評点とフィードバックを提供し、ツールの改善に役立ちます。
CI/CDフローとシームレスに統合されます。
オープンソースプロジェクトではOpenAIの無料枠を利用できます。
制限
OpenAI APIに依存しているため、ネットワーク接続が必要です。
評価結果はLLMの主観性の影響を受ける可能性があります。
一定の設定作業が必要です。

使い方

インストール
Node.jsパッケージまたはGitHub Actionとしてインストールします。
評価ファイルを作成する
TypeScriptファイルを作成して、あなたの評価設定を定義します。
評価を実行する
CLIまたはGitHub Actionを通じて評価を実行します。

使用例

天気ツールの評価
天気検索ツールが返す情報の精度と完全性を評価します。
知識検索の評価
知識検索ツールが返す情報の精度と関連性を評価します。

よくある質問

OpenAI APIキーが必要ですか?
評価にはどのモデルが使用されますか?
評点結果をどのように解釈すればいいですか?

関連リソース

GitHubリポジトリ
プロジェクトのソースコードと問題追跡
OpenAI APIドキュメント
OpenAI APIの使用ガイド

インストール

以下のコマンドをクライアントにコピーして設定
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

A
Acemcp
Acemcpは、コードライブラリのインデックス化と意味検索を行うMCPサーバーです。自動増分インデックス、複数エンコーディングファイルの処理、.gitignore統合、およびWeb管理インターフェイスをサポートしており、開発者がコードのコンテキストをすばやく検索し、理解するのに役立ちます。
Python
8.9K
5ポイント
B
Blueprint MCP
Blueprint MCPは、Arcadeエコシステムに基づくチャート生成ツールで、Nano Banana Proなどの技術を利用して、コードベースとシステムアーキテクチャを分析し、アーキテクチャ図、フローチャートなどのビジュアルチャートを自動生成し、開発者が複雑なシステムを理解するのを支援します。
Python
6.9K
4ポイント
M
MCP Agent Mail
MCPエージェントメールは、AIプログラミングエージェント向けのメール形式の調整レイヤーで、ID管理、メッセージの送受信、ファイルの予約、検索機能を提供し、複数のエージェントの非同期協力と競合の回避をサポートします。
Python
8.4K
5ポイント
K
Klavis
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
TypeScript
12.8K
5ポイント
M
MCP
Microsoft公式のMCPサーバーで、AIアシスタントに最新のMicrosoft技術ドキュメントの検索と取得機能を提供します。
11.9K
5ポイント
A
Aderyn
アデリンは、Rustで書かれたオープンソースのSolidityスマートコントラクト静的分析ツールで、開発者やセキュリティ研究者がSolidityコードの脆弱性を発見するのを支援します。FoundryとHardhatプロジェクトをサポートし、複数の形式のレポートを生成でき、VSCode拡張機能も提供します。
Rust
10.6K
5ポイント
D
Devtools Debugger MCP
Node.jsデバッガーMCPサーバーは、Chrome DevToolsプロトコルに基づく完全なデバッグ機能を提供します。ブレークポイントの設定、ステップ実行、変数のチェック、式の評価などが含まれます。
TypeScript
8.9K
4ポイント
S
Scrapling
Scraplingは適応型ウェブページのスクレイピングライブラリで、ウェブサイトの変化を自動的に学習し、要素を再配置します。複数のスクレイピング方法とAI統合をサポートし、高性能な解析と開発者に優しい体験を提供します。
Python
11.6K
5ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
13.5K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
57.0K
4.7ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
18.5K
4.8ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
28.8K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
15.7K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
19.7K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
17.2K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
24.3K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIBase