MCP Vision Relay
MCP Vision Relayは、ローカルにインストールされたGeminiとQwenのコマンドラインツールをラッピングすることで、ClaudeやCodexなどのテキストのみをサポートするMCPクライアントに画像分析機能を提供するMCPサーバーです。ローカルパス、URL、またはbase64エンコードされた画像を処理できます。
スコア : 2.5ポイント
ダウンロード数 : 6.2K
MCP Vision Relayとは?
MCP Vision Relayは、ネイティブの画像分析をサポートしていないAIアシスタント(ClaudeやCodexなど)が、ローカルにインストールされた多モーダルAIツールを呼び出して画像を分析できるようにするブリッジツールです。これらのツールを標準化されたMCPサーバーにラッピングし、AIアシスタントが組み込み機能のように画像分析機能を使用できるようにします。MCP Vision Relayの使い方は?
使用方法は3つのステップに分かれます:1) コンピューターにGemini CLIまたはQwen CLIをインストールし、設定を完了します;2) MCP Vision Relayサーバーをインストールして実行します;3) AIアシスタント(Claude Desktopなど)でこのサーバーを登録します。完了すると、会話の中で直接AIアシスタントに画像を分析させることができます。適用シナリオ
使用しているAIアシスタント(特定のサービスプロバイダーを介したClaudeやCodexなど)に画像分析機能がない場合、このツールは非常に役立ちます。これは、低コストでサービスプロバイダーを変更せずに多モーダル機能を復元する解決策を提供します。たとえば、スクリーンショット内のコードを分析したり、チャートの内容を説明したり、写真内のシーンを説明したりすることができます。主要機能
統一された画像分析ツール
`gemini_analyze_image` と `qwen_analyze_image` の2つのツールを提供し、ローカルファイルパス、Web画像リンク、またはBase64エンコード文字列の3つの方法で画像を入力して分析をサポートします。
複数プロバイダーのリレーアーキテクチャ
抽象的な「プロバイダー」レイヤーを介して、異なるコマンドラインツール(CLI)を簡単に切り替えたり拡張したりできます。モデル選択、出力形式などの核心的な設定に対する制御能力を保持します。
堅牢な入力処理
画像のサイズとファイル形式を自動的にチェックし、必要に応じてWeb画像を自動的にダウンロードしたり、Base64データを一時ファイルにデコードしたりし、使用後にクリーンアップして、セキュリティとリソース管理を確保します。
高度に設定可能な実行
サンドボックスモード、タイムアウト設定、追加のコマンドラインパラメータ、デフォルトモデルの上書きなどをサポートします。環境変数または `.env` ファイルを使用して柔軟に設定できます。
構造化された実行可能な出力
基盤となるCLIの出力を整理し、メタデータ(使用したモデル、分析時間、画像のソースなど)を追加して、AIアシスタントが画面に表示したり後続の処理を行ったりしやすくします。
利点
低コストで機能を拡張できます:より高価なビジュアル対応AIサービスプランにアップグレードする必要はなく、ローカルの無料または低コストのCLIツールを利用できます。
シームレスな統合:サポートされているAIアシスタント(Claude Desktopなど)で登録すると、画像分析ツールがネイティブ機能のようにツールリストに表示されます。
柔軟な選択:複数のバックエンド(Gemini、Qwen)をサポートしており、ニーズ、モデルのパフォーマンス、またはコストに応じて最適なものを選択できます。
プライバシーをコントロールできます:画像分析プロセスはローカルで呼び出されるCLI上で行われるため、データがどのように対応するサービスプロバイダーに送信されるかを把握できます。
制限
ローカル環境に依存します:コンピューターに対応するCLIツールを事前にインストールし、正しく設定し、ログイン認証を完了する必要があります。
追加の手順が必要です:AIアシスタントに組み込まれたビジュアル機能と比較すると、追加のインストールと設定手順が必要です。
パフォーマンスに依存します:分析速度と結果は、選択したCLIツールとその背後にあるAIモデルに依存します。
間接的な呼び出し:AIアシスタントがネイティブに画像を理解するのではなく、タスクを別のツールに「委譲」するため、一部の複雑な対話シナリオではネイティブ統合ほどスムーズではない場合があります。
使い方
環境の準備
コンピューターにNode.js(バージョン18以上)がインストールされていることを確認してください。次に、選択に応じて、Google Gemini CLIまたはQwen CLIをインストールし、設定を完了してください。コマンドラインで直接 `gemini -p "hi"` または `qwen -p "hi"` を実行して正常に結果が返されることを確認してください。これは、CLIが正しくインストールされ、認証されていることを示します。
MCP Vision Relayのインストールとビルド
MCP Vision Relayプロジェクトをダウンロードまたはクローンし、プロジェクトディレクトリに移動して、依存関係をインストールし、プロジェクトをビルドします。
設定(オプション)
プロジェクト内の `.env.example` ファイルを `.env` にコピーし、必要に応じて設定を変更します。たとえば、デフォルトモデルやタイムアウト時間を設定します。CLIのデフォルトのインストールと設定を維持する場合は、この手順をスキップできます。
AIアシスタントでサーバーを登録する
使用しているAIアシスタント(Claude DesktopやCodex CLIなど)で、MCP Vision RelayをMCPサーバーとして追加します。注意:登録コマンドは、npmスクリプトではなくエントリーファイルを直接呼び出す必要があります。これは、余分な出力が通信を妨げないようにするためです。
使用を開始する
登録が成功すると、AIアシスタントの会話画面に新しく追加された画像分析ツール(`gemini_analyze_image` など)が表示されます。会話の中でAIアシスタントにこれらのツールを使用して画像を分析させることができます。
使用例
技術チャートの分析
システムアーキテクチャ図をスクリーンショットし、AIアシスタントにコンポーネントとワークフローを説明してもらいたい場合。
エラースクリーンショットの説明
プログラムが実行中にエラーダイアログが表示され、スクリーンショットを撮ってこのエラーの具体的な意味と考えられる原因を知りたい場合。
写真の内容を説明する
旅行中に撮影した風景写真があり、AIアシスタントに美しい説明文章を生成してもらいたい場合。
よくある質問
すでに画像を分析できるAIがあるのに、なぜこのツールが必要なのですか?
インストール時に「コマンドが見つかりません」というエラーが発生した場合はどうすればいいですか?
Claude Desktopでサーバーを追加する際に、ハンドシェイクエラーが表示されました。どうすればいいですか?
ツールの呼び出しは成功しましたが、「画像が大きすぎます」または「サポートされていない形式です」というエラーが返されました。どうすればいいですか?
GeminiとQwen以外の他のモデルもサポートしていますか?
関連リソース
Model Context Protocol 公式ドキュメント
MCPプロトコルの標準と仕様を理解します。
Google Gemini CLI プロジェクトホームページ
Gemini CLIのインストール、設定、および使用方法の説明を取得します。
Qwen Code (CLI) NPMページ
Qwen CLIのインストールと使用情報を取得します。
MCP Vision Relay プロジェクトコードリポジトリ
このプロジェクトの最新のソースコードを取得し、問題を報告したり、貢献したりできます。

Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
21.9K
4.8ポイント

Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
16.0K
4.5ポイント

Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
65.4K
4.7ポイント

Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
32.3K
4.5ポイント

Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
18.7K
4.3ポイント

Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
23.2K
5ポイント

Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
17.1K
5ポイント

Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
26.6K
4.5ポイント

