MCP Vision Relay
M

MCP Vision Relay

MCP Vision Relayは、ローカルにインストールされたGeminiとQwenのコマンドラインツールをラッピングすることで、ClaudeやCodexなどのテキストのみをサポートするMCPクライアントに画像分析機能を提供するMCPサーバーです。ローカルパス、URL、またはbase64エンコードされた画像を処理できます。
2.5ポイント
6.2K

MCP Vision Relayとは?

MCP Vision Relayは、ネイティブの画像分析をサポートしていないAIアシスタント(ClaudeやCodexなど)が、ローカルにインストールされた多モーダルAIツールを呼び出して画像を分析できるようにするブリッジツールです。これらのツールを標準化されたMCPサーバーにラッピングし、AIアシスタントが組み込み機能のように画像分析機能を使用できるようにします。

MCP Vision Relayの使い方は?

使用方法は3つのステップに分かれます:1) コンピューターにGemini CLIまたはQwen CLIをインストールし、設定を完了します;2) MCP Vision Relayサーバーをインストールして実行します;3) AIアシスタント(Claude Desktopなど)でこのサーバーを登録します。完了すると、会話の中で直接AIアシスタントに画像を分析させることができます。

適用シナリオ

使用しているAIアシスタント(特定のサービスプロバイダーを介したClaudeやCodexなど)に画像分析機能がない場合、このツールは非常に役立ちます。これは、低コストでサービスプロバイダーを変更せずに多モーダル機能を復元する解決策を提供します。たとえば、スクリーンショット内のコードを分析したり、チャートの内容を説明したり、写真内のシーンを説明したりすることができます。

主要機能

統一された画像分析ツール
`gemini_analyze_image` と `qwen_analyze_image` の2つのツールを提供し、ローカルファイルパス、Web画像リンク、またはBase64エンコード文字列の3つの方法で画像を入力して分析をサポートします。
複数プロバイダーのリレーアーキテクチャ
抽象的な「プロバイダー」レイヤーを介して、異なるコマンドラインツール(CLI)を簡単に切り替えたり拡張したりできます。モデル選択、出力形式などの核心的な設定に対する制御能力を保持します。
堅牢な入力処理
画像のサイズとファイル形式を自動的にチェックし、必要に応じてWeb画像を自動的にダウンロードしたり、Base64データを一時ファイルにデコードしたりし、使用後にクリーンアップして、セキュリティとリソース管理を確保します。
高度に設定可能な実行
サンドボックスモード、タイムアウト設定、追加のコマンドラインパラメータ、デフォルトモデルの上書きなどをサポートします。環境変数または `.env` ファイルを使用して柔軟に設定できます。
構造化された実行可能な出力
基盤となるCLIの出力を整理し、メタデータ(使用したモデル、分析時間、画像のソースなど)を追加して、AIアシスタントが画面に表示したり後続の処理を行ったりしやすくします。
利点
低コストで機能を拡張できます:より高価なビジュアル対応AIサービスプランにアップグレードする必要はなく、ローカルの無料または低コストのCLIツールを利用できます。
シームレスな統合:サポートされているAIアシスタント(Claude Desktopなど)で登録すると、画像分析ツールがネイティブ機能のようにツールリストに表示されます。
柔軟な選択:複数のバックエンド(Gemini、Qwen)をサポートしており、ニーズ、モデルのパフォーマンス、またはコストに応じて最適なものを選択できます。
プライバシーをコントロールできます:画像分析プロセスはローカルで呼び出されるCLI上で行われるため、データがどのように対応するサービスプロバイダーに送信されるかを把握できます。
制限
ローカル環境に依存します:コンピューターに対応するCLIツールを事前にインストールし、正しく設定し、ログイン認証を完了する必要があります。
追加の手順が必要です:AIアシスタントに組み込まれたビジュアル機能と比較すると、追加のインストールと設定手順が必要です。
パフォーマンスに依存します:分析速度と結果は、選択したCLIツールとその背後にあるAIモデルに依存します。
間接的な呼び出し:AIアシスタントがネイティブに画像を理解するのではなく、タスクを別のツールに「委譲」するため、一部の複雑な対話シナリオではネイティブ統合ほどスムーズではない場合があります。

使い方

環境の準備
コンピューターにNode.js(バージョン18以上)がインストールされていることを確認してください。次に、選択に応じて、Google Gemini CLIまたはQwen CLIをインストールし、設定を完了してください。コマンドラインで直接 `gemini -p "hi"` または `qwen -p "hi"` を実行して正常に結果が返されることを確認してください。これは、CLIが正しくインストールされ、認証されていることを示します。
MCP Vision Relayのインストールとビルド
MCP Vision Relayプロジェクトをダウンロードまたはクローンし、プロジェクトディレクトリに移動して、依存関係をインストールし、プロジェクトをビルドします。
設定(オプション)
プロジェクト内の `.env.example` ファイルを `.env` にコピーし、必要に応じて設定を変更します。たとえば、デフォルトモデルやタイムアウト時間を設定します。CLIのデフォルトのインストールと設定を維持する場合は、この手順をスキップできます。
AIアシスタントでサーバーを登録する
使用しているAIアシスタント(Claude DesktopやCodex CLIなど)で、MCP Vision RelayをMCPサーバーとして追加します。注意:登録コマンドは、npmスクリプトではなくエントリーファイルを直接呼び出す必要があります。これは、余分な出力が通信を妨げないようにするためです。
使用を開始する
登録が成功すると、AIアシスタントの会話画面に新しく追加された画像分析ツール(`gemini_analyze_image` など)が表示されます。会話の中でAIアシスタントにこれらのツールを使用して画像を分析させることができます。

使用例

技術チャートの分析
システムアーキテクチャ図をスクリーンショットし、AIアシスタントにコンポーネントとワークフローを説明してもらいたい場合。
エラースクリーンショットの説明
プログラムが実行中にエラーダイアログが表示され、スクリーンショットを撮ってこのエラーの具体的な意味と考えられる原因を知りたい場合。
写真の内容を説明する
旅行中に撮影した風景写真があり、AIアシスタントに美しい説明文章を生成してもらいたい場合。

よくある質問

すでに画像を分析できるAIがあるのに、なぜこのツールが必要なのですか?
インストール時に「コマンドが見つかりません」というエラーが発生した場合はどうすればいいですか?
Claude Desktopでサーバーを追加する際に、ハンドシェイクエラーが表示されました。どうすればいいですか?
ツールの呼び出しは成功しましたが、「画像が大きすぎます」または「サポートされていない形式です」というエラーが返されました。どうすればいいですか?
GeminiとQwen以外の他のモデルもサポートしていますか?

関連リソース

Model Context Protocol 公式ドキュメント
MCPプロトコルの標準と仕様を理解します。
Google Gemini CLI プロジェクトホームページ
Gemini CLIのインストール、設定、および使用方法の説明を取得します。
Qwen Code (CLI) NPMページ
Qwen CLIのインストールと使用情報を取得します。
MCP Vision Relay プロジェクトコードリポジトリ
このプロジェクトの最新のソースコードを取得し、問題を報告したり、貢献したりできます。

インストール

以下のコマンドをクライアントにコピーして設定
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

R
Rsdoctor
Rsdoctorは、Rspackエコシステム向けに開発されたビルド分析ツールで、webpackと完全に互換性があり、可視化ビルド分析、多次元パフォーマンス診断、インテリジェントな最適化提案を提供し、開発者がビルド効率とエンジニアリング品質を向上させるのに役立ちます。
TypeScript
6.7K
5ポイント
N
Next Devtools MCP
Next.js開発ツールのMCPサーバーです。ClaudeやCursorなどのAIプログラミングアシスタントにNext.js開発ツールとユーティリティを提供します。実行時診断、開発自動化、およびドキュメントアクセス機能が含まれています。
TypeScript
8.2K
5ポイント
T
Testkube
Testkubeは、クラウドネイティブアプリケーション向けのテストオーケストレーションと実行フレームワークで、テストの定義、実行、分析を行うための統一プラットフォームを提供します。既存のテストツールとKubernetesインフラストラクチャをサポートします。
Go
5.0K
5ポイント
M
MCP Windbg
AIモデルをWinDbg/CDBに統合するMCPサーバーで、Windowsのクラッシュダンプファイルの分析とリモートデバッグに使用し、自然言語での対話を通じてデバッグコマンドを実行できます。
Python
8.2K
5ポイント
R
Runno
Runnoは、JavaScriptツールキットのセットで、ブラウザやNode.jsなどの環境で複数のプログラミング言語のコードを安全に実行するためのものです。WebAssemblyとWASIを通じてサンドボックス化された実行を実現し、Python、Ruby、JavaScript、SQLite、C/C++などの言語をサポートし、Webコンポーネント、MCPサーバーなどの統合方法を提供します。
TypeScript
6.1K
5ポイント
P
Praisonai
PraisonAIは、自動反省機能を備えた本番環境で使用可能な多AIエージェントフレームワークです。簡単なタスクから複雑な課題まで、様々な問題を自動的に解決するAIエージェントを作成することを目的としています。PraisonAIエージェント、AG2、CrewAIを低コードソリューションに統合することで、多エージェントLLMシステムの構築と管理を簡素化し、簡単さ、カスタマイズ性、および効果的な人間との協働を重視しています。
Python
5.9K
5ポイント
N
Netdata
Netdataはオープンソースのリアルタイムインフラストラクチャ監視プラットフォームで、毎秒の指標収集、可視化、機械学習による異常検出、自動化アラートを提供し、複雑な構成なしで全スタックの監視を実現します。
Go
8.1K
5ポイント
M
MCP Server
Mapbox MCPサーバーは、Node.jsで実装されたモデルコンテキストプロトコルサーバーで、AIアプリケーションにMapboxの地理空間APIへのアクセス機能を提供します。地理コーディング、興味のある場所の検索、ルート計画、等時線分析、静的地図生成などの機能が含まれます。
TypeScript
6.6K
4ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
21.9K
4.8ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
16.0K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
65.4K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
32.3K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
18.7K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
23.2K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
17.1K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
26.6K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2026AIBase