MCP Evals
MCP Evalsは、MCPツールの実装を評価するためのNode.jsパッケージとGitHub Actionです。LLMに基づく評点付けを通じて、MCPサーバーのツールが正常に動作し、良好な性能を発揮することを保証します。
2.5ポイント
6.7K

MCP Evalsとは?

MCP Evalsは、開発者がModel Context Protocol (MCP)サーバーツールの機能と性能をテストおよび検証するための評価ツールです。大型言語モデル(LLM)を使用して自動的に評点付けを行い、ツールが期待通りに動作することを確認します。

MCP Evalsの使い方は?

あなたはNode.jsパッケージまたはGitHub Actionのいずれかの方法でMCP Evalsを使用できます。評価設定ファイルを作成し、評価を実行するだけで、詳細な評点レポートを取得できます。

適用シナリオ

MCPツールを開発するチームがツールの品質を継続的に検証する必要がある場合、またはCI/CDフローで自動的にツールの性能をチェックするシナリオに適しています。

主要機能

LLMによる自動評点付け
GPT - 4などの大型言語モデルを使用して、ツールの応答品質を自動的に評価します。
多面的な評価
精度、完全性、関連性、明瞭性、推論能力の5つの側面で評点付けを行います。
GitHubとの統合
GitHub Actionとして自動的に実行され、結果をPull Requestにフィードバックします。
利点
評価プロセスを自動化し、人手によるテスト時間を節約します。
詳細な評点とフィードバックを提供し、ツールの改善に役立ちます。
CI/CDフローとシームレスに統合されます。
オープンソースプロジェクトではOpenAIの無料枠を利用できます。
制限
OpenAI APIに依存しているため、ネットワーク接続が必要です。
評価結果はLLMの主観性の影響を受ける可能性があります。
一定の設定作業が必要です。

使い方

インストール
Node.jsパッケージまたはGitHub Actionとしてインストールします。
評価ファイルを作成する
TypeScriptファイルを作成して、あなたの評価設定を定義します。
評価を実行する
CLIまたはGitHub Actionを通じて評価を実行します。

使用例

天気ツールの評価
天気検索ツールが返す情報の精度と完全性を評価します。
知識検索の評価
知識検索ツールが返す情報の精度と関連性を評価します。

よくある質問

OpenAI APIキーが必要ですか?
評価にはどのモデルが使用されますか?
評点結果をどのように解釈すればいいですか?

関連リソース

GitHubリポジトリ
プロジェクトのソースコードと問題追跡
OpenAI APIドキュメント
OpenAI APIの使用ガイド

インストール

以下のコマンドをクライアントにコピーして設定
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

R
Rsdoctor
Rsdoctorは、Rspackエコシステム向けに開発されたビルド分析ツールで、webpackと完全に互換性があり、可視化ビルド分析、多次元パフォーマンス診断、インテリジェントな最適化提案を提供し、開発者がビルド効率とエンジニアリング品質を向上させるのに役立ちます。
TypeScript
7.7K
5ポイント
N
Next Devtools MCP
Next.js開発ツールのMCPサーバーです。ClaudeやCursorなどのAIプログラミングアシスタントにNext.js開発ツールとユーティリティを提供します。実行時診断、開発自動化、およびドキュメントアクセス機能が含まれています。
TypeScript
8.3K
5ポイント
T
Testkube
Testkubeは、クラウドネイティブアプリケーション向けのテストオーケストレーションと実行フレームワークで、テストの定義、実行、分析を行うための統一プラットフォームを提供します。既存のテストツールとKubernetesインフラストラクチャをサポートします。
Go
6.2K
5ポイント
M
MCP Windbg
AIモデルをWinDbg/CDBに統合するMCPサーバーで、Windowsのクラッシュダンプファイルの分析とリモートデバッグに使用し、自然言語での対話を通じてデバッグコマンドを実行できます。
Python
8.6K
5ポイント
R
Runno
Runnoは、JavaScriptツールキットのセットで、ブラウザやNode.jsなどの環境で複数のプログラミング言語のコードを安全に実行するためのものです。WebAssemblyとWASIを通じてサンドボックス化された実行を実現し、Python、Ruby、JavaScript、SQLite、C/C++などの言語をサポートし、Webコンポーネント、MCPサーバーなどの統合方法を提供します。
TypeScript
7.5K
5ポイント
P
Praisonai
PraisonAIは、自動反省機能を備えた本番環境で使用可能な多AIエージェントフレームワークです。簡単なタスクから複雑な課題まで、様々な問題を自動的に解決するAIエージェントを作成することを目的としています。PraisonAIエージェント、AG2、CrewAIを低コードソリューションに統合することで、多エージェントLLMシステムの構築と管理を簡素化し、簡単さ、カスタマイズ性、および効果的な人間との協働を重視しています。
Python
6.1K
5ポイント
N
Netdata
Netdataはオープンソースのリアルタイムインフラストラクチャ監視プラットフォームで、毎秒の指標収集、可視化、機械学習による異常検出、自動化アラートを提供し、複雑な構成なしで全スタックの監視を実現します。
Go
9.6K
5ポイント
M
MCP Server
Mapbox MCPサーバーは、Node.jsで実装されたモデルコンテキストプロトコルサーバーで、AIアプリケーションにMapboxの地理空間APIへのアクセス機能を提供します。地理コーディング、興味のある場所の検索、ルート計画、等時線分析、静的地図生成などの機能が含まれます。
TypeScript
6.7K
4ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
16.3K
4.5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
22.1K
4.8ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
65.4K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
31.7K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
18.1K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
22.7K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
17.4K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
27.1K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2026AIBase