Ai Vision MCP
Google GeminiとVertex AIに基づくAIビジョン分析MCPサーバーです。画像とビデオのマルチモーダル分析をサポートし、オブジェクト検出、画像比較などの機能を提供し、複数のMCPクライアントに統合できます。
2.5ポイント
0

什么是AI Vision MCP Server?

AI Vision MCP Serverは、Model Context Protocolに基づくAIビジョン分析ツールです。これにより、AIモデルを通じて画像やビデオの内容を分析することができます。画像の内容を説明したり、複数の画像を比較したり、画像内の物体を検出したり、ビデオの内容を分析したりする場合、このサーバーは詳細なAI分析結果を提供します。

如何使用AI Vision MCP Server?

このサーバーを使用するには、MCPクライアント(Claude Desktop、Cursorなど)を設定します。まず、AIプロバイダー(Google AI StudioまたはVertex AI)を選択し、次に対応するAPIキーまたは資格情報を設定し、最後にMCPツールを使用してさまざまなビジョン分析機能を呼び出します。

适用场景

コンテンツ分析、画像認識、ビデオ理解、物体検出、複数画像比較などのシナリオに適しています。例えば、製品画像の分析、ビデオ内容の理解、画像内の特定物体の検出、デザイン案の違いの比較などです。

主要功能

双提供商支持
Google AI StudioとVertex AIの2種類のAIサービスプロバイダーをサポートしています。必要に応じて最適なソリューションを選択できます。
多模态分析
画像とビデオの内容分析を同時にサポートし、さまざまなビジュアルコンテンツの処理ニーズを満たします。
灵活的文件处理
複数のファイルアップロード方法をサポートしています。URLリンク、ローカルファイルパス、Base64エンコードデータなどで、さまざまなソースのコンテンツ分析が容易になります。
存储集成
Google Cloud Storageのサポートが組み込まれており、大規模なファイル処理とストレージ管理が容易になります。
全面的数据验证
Zodを使用してデータ検証を行い、入力データの完全性と正確性を保証します。
强大的错误处理
リトライロジックとブレーカーメカニズムを備えた堅牢なエラー処理システムです。
TypeScript支持
完全なTypeScriptサポートがあり、厳密な型チェックとより良い開発体験を提供します。
优势
複数のAIプロバイダーをサポートし、柔軟な選択が可能
複数のファイル形式とソースを処理でき、使いやすい
強力なエラー処理メカニズムで、システムの安定性を向上させる
詳細な設定オプションで、機能レベルの最適化をサポート
完全なTypeScriptサポートで、開発体験が良い
局限性
APIキーまたはサービスアカウントの資格情報が必要
ビデオ分析はYouTubeとローカルファイルのみサポート
大きなファイルの処理には時間がかかる場合がある
基本的なコマンドライン操作の知識が必要
一部の高度な機能にはGoogle Cloudの設定が必要

如何使用

选择AI提供商
必要に応じて、Google AI Studio(推奨)またはVertex AIをAIサービスプロバイダーとして選択します。
获取API凭证
選択したプロバイダーに応じて、対応するAPIキーまたはサービスアカウントの資格情報を取得します。
配置MCP客户端
使用するMCPクライアント(Claude Desktop、Cursorなど)にサーバー設定を追加します。
设置超时配置
ネットワーク状況と処理ニーズに応じて、MCPクライアントのタイムアウト設定を適切に調整します。
开始使用
MCPクライアントを再起動し、これでさまざまなビジョン分析ツールを使用できます。

使用案例

产品图片分析
電子商取引プラットフォームの製品画像を分析し、詳細な製品説明を自動生成します。
设计方案比较
複数のUIデザイン案の視覚的な効果とレイアウトの違いを比較します。
场景物体检测
屋内シーンの家具や物品を検出し、スマートホームアプリケーションに使用します。
教学视频理解
教育ビデオの内容を分析し、重要な知識ポイントと教学ステップを抽出します。

常见问题

我应该选择Google AI Studio还是Vertex AI?
支持哪些图像格式?
视频分析支持哪些来源?
处理大文件时超时怎么办?
如何优化分析结果的质量?
是否需要编程知识才能使用?
是否有使用限制或费用?
如何处理隐私和敏感数据?

相关资源

GitHub仓库
プロジェクトのソースコードと最新バージョン
Google AI Studio
Google AI StudioのAPIキーを取得する
Vertex AI快速入门
Vertex AIの設定と使用ガイド
环境变量配置指南
詳細な設定オプションと最適化の提案
Model Context Protocol
MCPプロトコルの公式ドキュメント
问题反馈和讨论
問題を報告し、議論に参加する

インストール

以下のコマンドをクライアントにコピーして設定
{
  "mcpServers": {
    "ai-vision-mcp": {
      "command": "npx",
      "args": ["ai-vision-mcp"],
      "env": {
        "IMAGE_PROVIDER": "google",
        "VIDEO_PROVIDER": "google",
        "GEMINI_API_KEY": "your-gemini-api-key"
      }
    }
  }
}

{
  "mcpServers": {
    "ai-vision-mcp": {
      "command": "npx",
      "args": ["ai-vision-mcp"],
      "env": {
        "IMAGE_PROVIDER": "vertex_ai",
        "VIDEO_PROVIDER": "vertex_ai",
        "VERTEX_CREDENTIALS": "/path/to/service-account.json",
        "GCS_BUCKET_NAME": "ai-vision-mcp-{VERTEX_PROJECT_ID}"
      }
    }
  }
}

{
  "mcpServers": {
    "timeout": 300, 
    "type": "stdio",
    "ai-vision-mcp": {
      "command": "npx",
      "args": ["ai-vision-mcp"],
      "env": {
        "IMAGE_PROVIDER": "google",
        "VIDEO_PROVIDER": "google",
        "GEMINI_API_KEY": "your-gemini-api-key"
      }
    }
  }
}

{
  "mcpServers": {
    "ai-vision-mcp": {
      "timeout": 300,
      "type": "stdio",
      "command": "npx",
      "args": ["ai-vision-mcp"],
      "env": {
        "IMAGE_PROVIDER": "vertex_ai",
        "VIDEO_PROVIDER": "vertex_ai",
        "VERTEX_CREDENTIALS": "/path/to/service-account.json",
        "GCS_BUCKET_NAME": "ai-vision-mcp-{VERTEX_PROJECT_ID}"
      }
    }
  }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

B
Blueprint MCP
Blueprint MCPは、Arcadeエコシステムに基づくチャート生成ツールで、Nano Banana Proなどの技術を利用して、コードベースとシステムアーキテクチャを分析し、アーキテクチャ図、フローチャートなどのビジュアルチャートを自動生成し、開発者が複雑なシステムを理解するのを支援します。
Python
8.2K
4ポイント
K
Klavis
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
TypeScript
13.1K
5ポイント
D
Devtools Debugger MCP
Node.jsデバッガーMCPサーバーは、Chrome DevToolsプロトコルに基づく完全なデバッグ機能を提供します。ブレークポイントの設定、ステップ実行、変数のチェック、式の評価などが含まれます。
TypeScript
10.0K
4ポイント
M
Mcpjungle
MCPJungleは自ホスト型のMCPゲートウェイで、複数のMCPサーバーを集中的に管理および代理し、AIエージェントに統一されたツールアクセスインターフェースを提供します。
Go
0
4.5ポイント
N
Nexus
NexusはAIツール集約ゲートウェイで、複数のMCPサーバーとLLMプロバイダーの接続をサポートし、統一されたエンドポイントを通じてツール検索、実行、およびモデルルーティング機能を提供し、セキュリティ認証とレート制限をサポートします。
Rust
0
4ポイント
Z
Zen MCP Server
Zen MCPは多モデルAI協調開発サーバーで、ClaudeやGemini CLIなどのAIコーディングアシスタントに強化されたワークフローツールとモデル間のコンテキスト管理を提供します。これは複数のAIモデルのシームレスな協調をサポートし、コードレビュー、デバッグ、リファクタリングなどの開発タスクを実現し、異なるワークフロー間で会話のコンテキストを維持することができます。
Python
16.2K
5ポイント
O
Opendia
OpenDiaはオープンソースのブラウザ拡張ツールで、AIモデルが直接ユーザーのブラウザを制御でき、既存のログイン状態、ブックマークなどのデータを利用して自動化操作を行います。複数のブラウザとAIモデルをサポートし、プライバシー保護に配慮しています。
JavaScript
12.0K
5ポイント
N
Notte Browser
認証済み
NotteはオープンソースのフルスタックネットワークAIエージェントフレームワークで、ブラウザセッション、自動化されたLLM駆動エージェント、ウェブページの監視と操作、資格情報管理などの機能を提供し、インターネットをエージェントに優しい環境に変え、自然言語でウェブサイトの構造を記述することでLLMの認知負荷を軽減することを目的としています。
15.4K
4.5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
17.6K
4.8ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
14.6K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
57.6K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
29.2K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
14.9K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
17.9K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
16.3K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
25.6K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIBase