M

MCP Evals

MCP Evalsは、MCPツールの実装を評価するためのNode.jsパッケージとGitHub Actionです。LLMに基づく評点付けを通じて、MCPサーバーのツールが正常に動作し、良好な性能を発揮することを保証します。
2.5ポイント
26

MCP Evalsとは?

MCP Evalsは、開発者がModel Context Protocol (MCP)サーバーツールの機能と性能をテストおよび検証するための評価ツールです。大型言語モデル(LLM)を使用して自動的に評点付けを行い、ツールが期待通りに動作することを確認します。

MCP Evalsの使い方は?

あなたはNode.jsパッケージまたはGitHub Actionのいずれかの方法でMCP Evalsを使用できます。評価設定ファイルを作成し、評価を実行するだけで、詳細な評点レポートを取得できます。

適用シナリオ

MCPツールを開発するチームがツールの品質を継続的に検証する必要がある場合、またはCI/CDフローで自動的にツールの性能をチェックするシナリオに適しています。

主要機能

LLMによる自動評点付けGPT - 4などの大型言語モデルを使用して、ツールの応答品質を自動的に評価します。
多面的な評価精度、完全性、関連性、明瞭性、推論能力の5つの側面で評点付けを行います。
GitHubとの統合GitHub Actionとして自動的に実行され、結果をPull Requestにフィードバックします。

利点と制限

利点
評価プロセスを自動化し、人手によるテスト時間を節約します。
詳細な評点とフィードバックを提供し、ツールの改善に役立ちます。
CI/CDフローとシームレスに統合されます。
オープンソースプロジェクトではOpenAIの無料枠を利用できます。
制限
OpenAI APIに依存しているため、ネットワーク接続が必要です。
評価結果はLLMの主観性の影響を受ける可能性があります。
一定の設定作業が必要です。

使い方

インストール
Node.jsパッケージまたはGitHub Actionとしてインストールします。
評価ファイルを作成する
TypeScriptファイルを作成して、あなたの評価設定を定義します。
評価を実行する
CLIまたはGitHub Actionを通じて評価を実行します。

使用例

天気ツールの評価天気検索ツールが返す情報の精度と完全性を評価します。
知識検索の評価知識検索ツールが返す情報の精度と関連性を評価します。

よくある質問

OpenAI APIキーが必要ですか?
評価にはどのモデルが使用されますか?
評点結果をどのように解釈すればいいですか?

関連リソース

GitHubリポジトリ
プロジェクトのソースコードと問題追跡
OpenAI APIドキュメント
OpenAI APIの使用ガイド
インストール
以下のコマンドをクライアントにコピーして設定
注意:あなたのキーは機密情報です。誰とも共有しないでください。
N
Notte Browser
認証済み
NotteはオープンソースのフルスタックネットワークAIエージェントフレームワークで、ブラウザセッション、自動化されたLLM駆動エージェント、ウェブページの監視と操作、資格情報管理などの機能を提供し、インターネットをエージェントに優しい環境に変え、自然言語でウェブサイトの構造を記述することでLLMの認知負荷を軽減することを目的としています。
647
4.5ポイント
S
Search1api
Search1API MCPサーバーは、Model Context Protocol (MCP)に基づくサーバーで、検索とクローリング機能を提供し、複数の検索サービスとツールをサポートします。
TypeScript
327
4ポイント
D
Duckduckgo MCP Server
認証済み
DuckDuckGo検索MCPサーバーは、ClaudeなどのLLMにウェブ検索とコンテンツ取得サービスを提供します。
Python
807
4.3ポイント
B
Bing Search MCP
Microsoft Bing検索APIを統合するためのMCPサーバーで、ウェブページ、ニュース、画像の検索機能をサポートし、AIアシスタントにウェブ検索機能を提供します。
Python
218
4ポイント
M
MCP Alchemy
認証済み
MCPアルケミーは、Claude Desktopと複数のデータベースを接続するツールで、SQLクエリ、データベース構造分析、データレポート生成をサポートします。
Python
313
4.2ポイント
P
Postgresql MCP
FastMCPライブラリに基づくPostgreSQLデータベースのMCPサービスで、指定されたテーブルのCRUD操作、スキーマ検査、およびカスタムSQLクエリ機能を提供します。
Python
96
4ポイント
M
MCP Scan
MCP-Scanは、MCPサーバー用のセキュリティスキャンツールで、提示注入、ツール汚染、クロスドメインアップグレードなどの一般的なセキュリティホールを検出します。
Python
609
5ポイント
A
Agentic Radar
エージェンティックレーダーは、エージェントシステムを分析・評価するセキュリティスキャナーで、開発者、研究者、セキュリティ専門家がエージェントシステムのワークフローを理解し、潜在的なホールを特定するのに役立ちます。
Python
544
5ポイント
厳選MCPサービス
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
259
4.8ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
287
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
5.2K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
713
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
78
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
550
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
1.7K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
272
4.5ポイント
AIbase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIbase