Nexus MCPサーバー：AIツールを集約、多サーバーとLLMを接続、統一端点で効率的集積

たんさく

Nexus

NexusはAIツール集約ゲートウェイで、複数のMCPサーバーとLLMプロバイダーの接続をサポートし、統一されたエンドポイントを通じてツール検索、実行、およびモデルルーティング機能を提供し、セキュリティ認証とレート制限をサポートします。

開発者ツール人工知能チャットボット #ツール集約 #モデルルーティング #セキュリティ認証 #プロトコルサポート .Rust

スコア : 4ポイント

ダウンロード数 : 0

更新時間 : 2025-08-21

サイトを開く

Nexus MCP Routerとは？

Nexusは、複数のModel Context Protocol (MCP) サーバーと大規模言語モデル (LLM) プロバイダーを統一されたエンドポイントに接続できるインテリジェントなルーティングプラットフォームです。これにより、AIアシスタントは、各接続を個別に設定することなく、さまざまなツールとサービスに同時にアクセスできます。

Nexusの使い方は？

接続したいMCPサーバーとLLMプロバイダーを簡単な設定ファイルで設定し、Nexusサービスを起動します。CursorやClaude CodeなどのAIアシスタントは、Nexusの単一のエンドポイントに接続するだけで、すべての設定されたツールとモデルにアクセスできます。

適用シナリオ

複数のAIツールとモデルを集中管理する必要がある組織、AIアシスタントの設定を簡素化したい開発チーム、およびAIリソースのアクセス権を統一的に制御する必要があるシナリオに適しています。

主要機能

MCPサーバー集約

STDIO、SSE、HTTPの3つのプロトコルのMCPサーバーをサポートし、単一のエンドポイントから統一的にアクセスできます。

LLMプロバイダールーティング

OpenAI、Anthropic、Google、AWS BedrockなどのさまざまなLLMプロバイダーをサポートする統一インターフェイス。

インテリジェントツール検索

自然言語クエリに基づく曖昧検索で、関連するツールをすばやく見つけます。

企業レベルのセキュリティ

組み込みのCORS、CSRF保護、OAuth2認証、およびTLSサポート。

多段階レート制限

グローバル、IP、サーバー、およびツールレベルのレート制御をサポートします。

コンテナ化サポート

Dockerイメージを提供し、デプロイと管理を簡素化します。

利点

設定の簡素化：一度設定すれば、すべてのAIアシスタントが使用できます。

集中管理：すべてのMCPサーバーとLLMプロバイダーのアクセスを統一的に制御します。

セキュリティの強化：統一された認証と承認メカニズムを提供します。

コストコントロール：レート制限によりAPI使用コストを管理します。

柔軟な拡張：新しいツールとサービスを簡単に追加できます。

制限

追加のデプロイとメンテナンス作業が必要です。

単一障害点のリスク（クラスターデプロイで緩和できます）

接続するサービスの数が増えるにつれて、設定の複雑さが増します。

使い方

Nexusのインストール

Dockerまたはバイナリファイルを直接インストールします。

設定ファイルの作成

nexus.tomlファイルを作成し、MCPサーバーとLLMプロバイダーを設定します。

サービスの起動

Nexusサービスを実行します。

AIアシスタントの設定

CursorまたはClaude CodeでNexusへの接続を設定します。

使用例

コード開発アシスタント

GitHubコード検索、ファイルシステム操作、およびAIコード生成を同時に使用します。

多モデル対話

異なるタスクに適したLLMモデルを選択します。

企業知識管理

社内の知識ベースツールと外部のAIモデルを組み合わせます。

よくある質問

Nexusは無料ですか？

どのMCPサーバーがサポートされていますか？

セキュリティはどのように保証されますか？

パフォーマンスへの影響は大きいですか？

カスタム開発はサポートされていますか？

Docker

最新のイメージを取得します：

docker pull ghcr.io/grafbase/nexus:latest

または、安定版を使用します：

docker pull ghcr.io/grafbase/nexus:stable

または、特定のバージョンを使用します：

docker pull ghcr.io/grafbase/nexus:X.Y.Z

ソースからビルド

git clone https://github.com/grafbase/nexus
cd nexus
cargo build --release

💻 使用例

バイナリを使用する場合

nexus

Dockerを使用する場合

docker run -p 8000:8000 -v /path/to/config:/etc/nexus.toml ghcr.io/grafbase/nexus:latest

Docker Composeの例

services:
  nexus:
    image: ghcr.io/grafbase/nexus:latest
    ports:
      - "8000:8000"
    volumes:
      - ./nexus.toml:/etc/nexus.toml
    environment:
      - GITHUB_TOKEN=${GITHUB_TOKEN}
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:8000/health"]
      interval: 30s
      timeout: 10s
      retries: 3

📚 ドキュメント

構成

nexus.tomlファイルを作成して、Nexusを構成します：

# LLMプロバイダーの構成
[llm.providers.openai]
type = "openai"
api_key = "{{ env.OPENAI_API_KEY }}"
forward_token = true

# モデルの構成 (各プロバイダーに少なくとも1つのモデルが必要)
[llm.providers.openai.models.gpt-4]
[llm.providers.openai.models.gpt-3-5-turbo]

[llm.providers.anthropic]
type = "anthropic"
api_key = "{{ env.ANTHROPIC_API_KEY }}"

[llm.providers.anthropic.models.claude-3-5-sonnet-20241022]

# MCPサーバーの構成
[mcp.servers.github]
url = "https://api.githubcopilot.com/mcp/"
auth.token = "{{ env.GITHUB_TOKEN }}"

[mcp.servers.filesystem]
cmd = ["npx", "-y", "@modelcontextprotocol/server-filesystem", "/Users/YOUR_USERNAME/Desktop"]

[mcp.servers.python_server]
cmd = ["python", "-m", "mcp_server"]
env = { PYTHONPATH = "/opt/mcp" }
cwd = "/workspace"

構成オプション

サーバー構成

server.listen_address：Nexusがリッスンするアドレスとポート (デフォルト: 127.0.0.1:8000)
server.health.enabled：ヘルスエンドポイントを有効にする (デフォルト: true)
server.health.path：ヘルスチェックエンドポイントのパス (デフォルト: /health)

LLM構成

llm.enabled：LLM機能を有効にする (デフォルト: true)
llm.path：LLMエンドポイントのパス (デフォルト: /llm)

詳細なLLMプロバイダーの構成については、以下のLLMプロバイダー構成セクションを参照してください。

MCP構成

mcp.enabled：MCP機能を有効にする (デフォルト: true)
mcp.path：MCPエンドポイントのパス (デフォルト: /mcp)
mcp.enable_structured_content：MCP検索ツールの応答形式を制御する (デフォルト: true)
- trueの場合：パフォーマンスと型安全性を向上させるために、最新のstructuredContentフィールドを使用します。
- falseの場合：古いMCPクライアントとの互換性のために、Content::jsonオブジェクトを持つレガシーのcontentフィールドを使用します。

MCPサーバーの種類

STDIOサーバー：標準入出力を介して通信するローカルプロセスを起動します。

[mcp.servers.my_tool]
cmd = ["path/to/executable", "--arg1", "--arg2"]

# オプション: 環境変数を設定する
env = { DEBUG = "1", API_KEY = "{{ env.MY_API_KEY }}" }

# オプション: 作業ディレクトリを設定する
cwd = "/path/to/working/directory"

# オプション: stderrの処理を構成する (デフォルト: "null")
stderr = "inherit"  # コンソールに表示する
# または
stderr = { file = "/var/log/mcp/server.log" }  # ファイルにログを記録する

注意：STDIOサーバーは、stdoutに有効なJSON-RPCメッセージを出力する必要があります。cmd配列には、少なくとも1つの要素（実行可能ファイル）が必要です。

SSEサーバー：Server-Sent Eventsエンドポイントに接続します。

[mcp.servers.my_sse_server]
protocol = "sse"
url = "http://example.com/sse"
message_url = "http://example.com/messages"  # オプション

HTTPサーバー：ストリーム可能なHTTPエンドポイントに接続します。

[mcp.servers.my_http_server]
protocol = "streamable-http"
url = "https://api.example.com/mcp"

リモートのMCPサーバーの場合、プロトコルを省略すると、Nexusは最初にストリーム可能なHTTPを試し、次にSSEを試します。

認証

任意のサーバーにサービストークン認証を追加します：

[mcp.servers.my_server.auth]
token = "your-token-here"
# または環境変数を使用する
token = "{{ env.MY_API_TOKEN }}"

サーバーにOAuth2認証を有効にし、下流のサーバーがすべて同じ認証サーバーを使用する場合、Nexusを構成して、リクエストのアクセストークンを下流のサーバーに転送することができます。

[mcp.servers.my_server.auth]
type = "forward"

OAuth2認証

Nexusエンドポイントを保護するために、OAuth2認証を構成します：

[server.oauth]
url = "https://your-oauth-provider.com/.well-known/jwks.json"
poll_interval = "5m"
expected_issuer = "https://your-oauth-provider.com"
expected_audience = "your-service-audience"

[server.oauth.protected_resource]
resource = "https://your-nexus-instance.com"
authorization_servers = ["https://your-oauth-provider.com"]

OAuth2の構成オプション：

url：トークン検証用のJWKsエンドポイントのURL
poll_interval：JWKsを更新する頻度 (オプション、デフォルト: ポーリングなし)
expected_issuer：JWTトークンで期待されるissクレーム (オプション)
expected_audience：JWTトークンで期待されるaudクレーム (オプション)
protected_resource.resource：この保護されたリソースのURL
protected_resource.authorization_servers：認証サーバーのURLのリスト

OAuth2が有効になっている場合、/healthと/.well-known/oauth-protected-resourceを除くすべてのエンドポイントは、Authorization: Bearer <token>ヘッダーに有効なJWTトークンを必要とします。

レート制限

Nexusは、乱用を防止し、公平なリソース使用を確保するために、包括的なレート制限をサポートしています：

# グローバルなレート制限の構成
[server.rate_limits]
enabled = true

# ストレージバックエンドの構成
[server.rate_limits.storage]
type = "memory"  # または分散型レート制限の場合は "redis"
# Redisバックエンドの場合:
# url = "redis://localhost:6379"
# key_prefix = "nexus:rate_limit:"

# グローバルなレート制限 (すべてのリクエストに適用)
[server.rate_limits.global]
limit = 1000
interval = "60s"

# 1IPあたりのレート制限
[server.rate_limits.per_ip]
limit = 100
interval = "60s"

# 各MCPサーバーのレート制限
[mcp.servers.my_server.rate_limits]
limit = 50
interval = "60s"

# ツール固有のレート制限 (サーバーのデフォルトを上書き)
[mcp.servers.my_server.rate_limits.tools]
expensive_tool = { limit = 10, interval = "60s" }
cheap_tool = { limit = 100, interval = "60s" }

レート制限の機能：

複数のレベル：グローバル、1IPあたり、サーバーごと、およびツールごとの制限
ストレージバックエンド：メモリ内（単一インスタンス）またはRedis（分散型）
柔軟なインターバル：各制限の時間ウィンドウを構成できます
ツール固有の上書き：高価な操作に対して異なる制限を設定できます

Redisバックエンドの構成：

[server.rate_limits.storage]
type = "redis"
url = "redis://localhost:6379"
key_prefix = "nexus:rate_limit:"
response_timeout = "1s"
connection_timeout = "5s"

# コネクションプールの設定
[server.rate_limits.storage.pool]
max_size = 16
min_idle = 0
timeout_create = "5s"
timeout_wait = "5s"
timeout_recycle = "300s"

# RedisのTLS構成 (オプション)
[server.rate_limits.storage.tls]
enabled = true
ca_cert_path = "/path/to/ca.crt"
client_cert_path = "/path/to/client.crt"  # 相互TLSの場合
client_key_path = "/path/to/client.key"
# insecure = true  # 警告: 開発/テスト用のみ、証明書検証をスキップします

注意：ツール固有のレート制限を構成する場合、存在しないツールを参照すると、Nexusは警告を表示します。

LLMトークンレート制限

Nexusは、LLMプロバイダーに対するトークンベースのレート制限を提供し、コストを管理し、乱用を防止するのに役立ちます。リクエストベースのレート制限とは異なり、トークンレート制限は、実際に消費されたトークンの推定値をカウントします。

前提条件

重要：LLMのレート制限には、クライアント識別を有効にする必要があります：

[server.client_identification]
enabled = true

# 識別方法を選択する (少なくとも1つ必要)
client_id.jwt_claim = "sub"                    # JWTの 'sub' クレームからIDを抽出する
# または
client_id.http_header = "X-Client-ID"          # HTTPヘッダーからIDを抽出する

# オプション: ユーザーごとのグループを制限する (最大1つ許可)
group_id.jwt_claim = "groups"                  # ユーザーのグループを含むJWTクレーム
# または
group_id.http_header = "X-Group-ID"            # HTTPヘッダーからIDを抽出する

# 許可されるグループのリストを提供する必要があります
[server.client_identification.validation]
group_values = ["free", "pro", "max"]

クライアント識別がない場合、レート制限を適用できず、リクエストは構成エラーで失敗します。

構成の階層

トークンレート制限は、最も具体的なものから最も一般的なものまで、4つのレベルで構成できます：

ユーザー+グループごとのモデル：グループ内の各ユーザーに対する特定のモデル
ユーザーごとのモデル：各ユーザーに対する特定のモデル
ユーザー+グループごとのプロバイダー：グループ内の各ユーザーに対するプロバイダーのすべてのモデル
ユーザーごとのプロバイダー：各ユーザーに対するプロバイダーのすべてのモデル

常に最も具体的な適用可能な制限が使用されます。

基本的な構成

# プロバイダーレベルのデフォルトレート制限 (すべてのモデルに適用)
[llm.providers.openai.rate_limits.per_user]
input_token_limit = 100000        # 100K入力トークン
interval = "1m"                   # 1分ごと

# モデル固有のレート制限 (プロバイダーのデフォルトを上書き)
[llm.providers.openai.models.gpt-4.rate_limits.per_user]
input_token_limit = 50000         # 高価なモデルに対してより制限的
interval = "30s"

グループベースのレート制限

ユーザーグループに対して異なる制限を構成します（クライアント識別にgroup_idとgroup_valuesが必要）：

# プロバイダーレベルのグループ制限
[llm.providers.openai.rate_limits.per_user.groups]
free = { input_token_limit = 10000, interval = "60s" }
pro = { input_token_limit = 100000, interval = "60s" }
enterprise = { input_token_limit = 1000000, interval = "60s" }

# モデル固有のグループ制限 (プロバイダーのグループを上書き)
[llm.providers.openai.models.gpt-4.rate_limits.per_user.groups]
free = { input_token_limit = 5000, interval = "60s" }
pro = { input_token_limit = 50000, interval = "60s" }

制限はユーザーごとに適用されますが、ユーザーが特定のグループに属している場合、異なる制限を定義することができます。ユーザーがどのグループにも属していない場合、ユーザーごとの制限が適用されます。

完全な例

# クライアント識別 (レート制限に必須)
[server.client_identification]
enabled = true
client_id.jwt_claim = "sub"
group_id.jwt_claim = "subscription_tier"
[server.client_identification.validation]
group_values = ["free", "pro", "enterprise"]

# 包括的なレート制限を持つOpenAIプロバイダー
[llm.providers.openai]
type = "openai"
api_key = "{{ env.OPENAI_API_KEY }}"

# プロバイダーレベルのデフォルト
[llm.providers.openai.rate_limits.per_user]
input_token_limit = 100000
interval = "60s"

[llm.providers.openai.rate_limits.per_user.groups]
free = { input_token_limit = 10000, interval = "60s" }
pro = { input_token_limit = 100000, interval = "60s" }

# GPT-4固有の制限 (より制限的)
[llm.providers.openai.models.gpt-4]
[llm.providers.openai.models.gpt-4.rate_limits.per_user]
input_token_limit = 50000
interval = "60s"

[llm.providers.openai.models.gpt-4.rate_limits.per_user.groups]
free = { input_token_limit = 5000, interval = "60s" }
pro = { input_token_limit = 50000, interval = "60s" }

# GPT-3.5はプロバイダーのデフォルトを使用する
[llm.providers.openai.models.gpt-3-5-turbo]

トークンカウントの仕組み

入力トークンのみ：レート制限は、リクエストのメッセージとシステムプロンプトからカウントされる入力トークンのみに基づいています。
出力バッファリングなし：出力トークンとmax_tokensパラメータは、レート制限の計算には考慮されません。
事前チェック：入力トークンは、処理前にレート制限と照合されます。
トークンの累積：時間経過に伴う使用状況を追跡するために、スライディングウィンドウアルゴリズムを使用します。

注意：レート制限は、クライアントが送信する内容のみに基づいて予測可能に設計されており、可変の出力サイズには基づいていません。

レート制限の応答

レート制限に達した場合、サーバーは429ステータスコードを返します。下流のLLMプロバイダーの動作との一貫性を保つために、Retry-Afterヘッダーは送信されません。

エラー応答

レート制限を超えた場合：

{
  "error": {
    "message": "Rate limit exceeded: Token rate limit exceeded. Please try again later.",
    "type": "rate_limit_error",
    "code": 429
  }
}

重要な注意事項

ユーザーごとの制限：すべての制限は、個々のユーザー/クライアントIDごとに設定されています。
共有プールなし：現在、共有/グローバルなトークンプールはありません。
ストリーミングサポート：トークンカウントは、通常の応答とストリーミング応答の両方で機能します。
プロバイダー非依存：すべてのLLMプロバイダーで一貫して機能します。
検証：構成は起動時に検証され、無効なグループ名はエラーを引き起こします。

TLS構成

下流の接続にTLSを構成します：

[mcp.servers.my_server.tls]
verify_certs = true
accept_invalid_hostnames = false
root_ca_cert_path = "/path/to/ca.pem"
client_cert_path = "/path/to/client.pem"
client_key_path = "/path/to/client.key"

LLMプロバイダーの構成

Nexusは、複数のLLMプロバイダーに対する統一インターフェイスを提供し、一貫したAPIを使用してさまざまなサービスを介してチャット補完をルーティングすることができます。

LLMルーティングの有効化

[llm]
enabled = true  # LLM機能を有効にする (デフォルト: true)
path = "/llm"   # LLMエンドポイントのパス (デフォルト: "/llm")

サポートされるプロバイダー

Nexusは現在、4つの主要なLLMプロバイダーをサポートしています：

OpenAI (OpenAI互換APIを含む)
Anthropic (Claudeモデル)
Google (Geminiモデル)
AWS Bedrock (AWSを介した複数のモデルファミリー)

プロバイダーの構成

nexus.tomlに1つ以上のLLMプロバイダーを構成します：

OpenAIプロバイダー

[llm.providers.openai]
type = "openai"
api_key = "{{ env.OPENAI_API_KEY }}"
# オプション: カスタムベースURLを使用する (Azure OpenAI、プロキシ、または互換APIの場合)
base_url = "https://api.openai.com/v1"  # デフォルト

# モデルの構成 (必須 - 少なくとも1つのモデルを構成する必要があります)
[llm.providers.openai.models.gpt-4]
# オプション: ユーザーに表示するためにモデルをリネームする
# rename = "smart-model"  # ユーザーは "openai/smart-model" としてモデルを見ることになります

[llm.providers.openai.models.gpt-3-5-turbo]
# リネームされていないモデルは、元のIDを使用します

Anthropicプロバイダー

[llm.providers.anthropic]
type = "anthropic"
api_key = "{{ env.ANTHROPIC_API_KEY }}"
# オプション: カスタムベースURLを使用する
base_url = "https://api.anthropic.com/v1"  # デフォルト

# モデルの構成 (必須 - 少なくとも1つのモデルを構成する必要があります)
[llm.providers.anthropic.models.claude-3-opus-20240229]

[llm.providers.anthropic.models.claude-3-5-sonnet-20241022]

Googleプロバイダー

[llm.providers.google]
type = "google"
api_key = "{{，

Gmail MCP Server

Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。

Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。

TypeScript

74.2K

4.7ポイント

Edgeone Pages MCP Server

EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。

百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。

GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。

UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。

25.6K

5ポイント

Magic MCP

Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。

JavaScript

20.1K

5ポイント

Sequential Thinking MCP Server

MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。

Python

30.7K

4.5ポイント

智啓未来、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

Nexus

概要

インストール

コンテンツ詳細

代替品

Nexus MCP Routerとは？

Nexusの使い方は？

適用シナリオ

主要機能

使い方

使用例

よくある質問

関連リソース

インストール

Docker

ソースからビルド

💻 使用例

バイナリを使用する場合

Dockerを使用する場合

Docker Composeの例

📚 ドキュメント

構成

構成オプション

サーバー構成

LLM構成

MCP構成

MCPサーバーの種類

認証

OAuth2認証

レート制限

LLMトークンレート制限

前提条件

構成の階層

基本的な構成

グループベースのレート制限

完全な例

トークンカウントの仕組み

レート制限の応答

エラー応答

重要な注意事項

TLS構成

LLMプロバイダーの構成

LLMルーティングの有効化

サポートされるプロバイダー

プロバイダーの構成

OpenAIプロバイダー

Anthropicプロバイダー

Googleプロバイダー

代替品