Ai Vision MCP
A

Ai Vision MCP

一個基於Google Gemini和Vertex AI的AI視覺分析MCP服務器,支持圖像和視頻的多模態分析,提供對象檢測、圖像比較等功能,可集成到多種MCP客戶端中。
2.5分
0

什麼是AI Vision MCP Server?

AI Vision MCP Server是一個基於Model Context Protocol的AI視覺分析工具,它允許您通過AI模型分析圖像和視頻內容。無論您需要描述圖片內容、比較多個圖像、檢測圖像中的物體,還是分析視頻內容,這個服務器都能提供詳細的AI分析結果。

如何使用AI Vision MCP Server?

您可以通過配置MCP客戶端(如Claude Desktop、Cursor等)來使用這個服務器。首先選擇AI提供商(Google AI Studio或Vertex AI),然後設置相應的API密鑰或憑證,最後通過MCP工具調用各種視覺分析功能。

適用場景

適用於內容分析、圖像識別、視頻理解、物體檢測、多圖像比較等場景。例如:分析產品圖片、理解視頻內容、檢測圖像中的特定物體、比較設計方案的差異等。

主要功能

雙提供商支持
支持Google AI Studio和Vertex AI兩種AI服務提供商,您可以根據需求選擇最適合的方案
多模態分析
同時支持圖像和視頻內容分析,滿足不同視覺內容的處理需求
靈活的文件處理
支持多種文件上傳方式:URL鏈接、本地文件路徑、Base64編碼數據,方便不同來源的內容分析
存儲集成
內置Google Cloud Storage支持,便於大規模文件處理和存儲管理
全面的數據驗證
使用Zod進行數據驗證,確保輸入數據的完整性和正確性
強大的錯誤處理
包含重試邏輯和斷路器機制的健壯錯誤處理系統
TypeScript支持
完整的TypeScript支持,提供嚴格的類型檢查和更好的開發體驗
優勢
支持多種AI提供商,提供靈活的選擇
處理多種文件格式和來源,使用方便
強大的錯誤處理機制,提高系統穩定性
詳細的配置選項,支持功能級優化
完整的TypeScript支持,開發體驗好
侷限性
需要API密鑰或服務賬戶憑證
視頻分析僅支持YouTube和本地文件
大文件處理可能需要較長時間
需要基本的命令行操作知識
某些高級功能需要Google Cloud配置

如何使用

選擇AI提供商
根據您的需求選擇Google AI Studio(推薦)或Vertex AI作為AI服務提供商
獲取API憑證
根據選擇的提供商獲取相應的API密鑰或服務賬戶憑證
配置MCP客戶端
在您使用的MCP客戶端(如Claude Desktop、Cursor等)中添加服務器配置
設置超時配置
根據您的網絡狀況和處理需求,適當調整MCP客戶端的超時設置
開始使用
重啟MCP客戶端,現在您可以使用各種視覺分析工具了

使用案例

產品圖片分析
分析電商平臺的產品圖片,自動生成詳細的產品描述
設計方案比較
比較多個UI設計方案的視覺效果和佈局差異
場景物體檢測
檢測室內場景中的傢俱和物品,用於智能家居應用
教學視頻理解
分析教育視頻內容,提取關鍵知識點和教學步驟

常見問題

我應該選擇Google AI Studio還是Vertex AI?
支持哪些圖像格式?
視頻分析支持哪些來源?
處理大文件時超時怎麼辦?
如何優化分析結果的質量?
是否需要編程知識才能使用?
是否有使用限制或費用?
如何處理隱私和敏感數據?

相關資源

GitHub倉庫
項目源代碼和最新版本
Google AI Studio
獲取Google AI Studio API密鑰
Vertex AI快速入門
Vertex AI設置和使用指南
環境變量配置指南
詳細的配置選項和優化建議
Model Context Protocol
MCP協議官方文檔
問題反饋和討論
報告問題和參與討論

安裝

複製以下命令到你的Client進行配置
{
  "mcpServers": {
    "ai-vision-mcp": {
      "command": "npx",
      "args": ["ai-vision-mcp"],
      "env": {
        "IMAGE_PROVIDER": "google",
        "VIDEO_PROVIDER": "google",
        "GEMINI_API_KEY": "your-gemini-api-key"
      }
    }
  }
}

{
  "mcpServers": {
    "ai-vision-mcp": {
      "command": "npx",
      "args": ["ai-vision-mcp"],
      "env": {
        "IMAGE_PROVIDER": "vertex_ai",
        "VIDEO_PROVIDER": "vertex_ai",
        "VERTEX_CREDENTIALS": "/path/to/service-account.json",
        "GCS_BUCKET_NAME": "ai-vision-mcp-{VERTEX_PROJECT_ID}"
      }
    }
  }
}

{
  "mcpServers": {
    "timeout": 300, 
    "type": "stdio",
    "ai-vision-mcp": {
      "command": "npx",
      "args": ["ai-vision-mcp"],
      "env": {
        "IMAGE_PROVIDER": "google",
        "VIDEO_PROVIDER": "google",
        "GEMINI_API_KEY": "your-gemini-api-key"
      }
    }
  }
}

{
  "mcpServers": {
    "ai-vision-mcp": {
      "timeout": 300,
      "type": "stdio",
      "command": "npx",
      "args": ["ai-vision-mcp"],
      "env": {
        "IMAGE_PROVIDER": "vertex_ai",
        "VIDEO_PROVIDER": "vertex_ai",
        "VERTEX_CREDENTIALS": "/path/to/service-account.json",
        "GCS_BUCKET_NAME": "ai-vision-mcp-{VERTEX_PROJECT_ID}"
      }
    }
  }
}
注意:您的密鑰屬於敏感信息,請勿與任何人分享。

替代品

B
Blueprint MCP
Blueprint MCP是一個基於Arcade生態的圖表生成工具,利用Nano Banana Pro等技術,通過分析代碼庫和系統架構自動生成架構圖、流程圖等可視化圖表,幫助開發者理解複雜系統。
Python
8.2K
4分
K
Klavis
Klavis AI是一個開源項目,提供在Slack、Discord和Web平臺上簡單易用的MCP(模型上下文協議)服務,包括報告生成、YouTube工具、文檔轉換等多種功能,支持非技術用戶和開發者使用AI工作流。
TypeScript
13.1K
5分
D
Devtools Debugger MCP
Node.js調試器MCP服務器,提供基於Chrome DevTools協議的完整調試功能,包括斷點設置、單步執行、變量檢查和表達式評估等
TypeScript
10.0K
4分
M
Mcpjungle
MCPJungle是一個自託管的MCP網關,用於集中管理和代理多個MCP服務器,為AI代理提供統一的工具訪問接口。
Go
0
4.5分
N
Nexus
Nexus是一個AI工具聚合網關,支持連接多個MCP服務器和LLM提供商,通過統一端點提供工具搜索、執行和模型路由功能,支持安全認證和速率限制。
Rust
0
4分
Z
Zen MCP Server
Zen MCP是一個多模型AI協作開發服務器,為Claude和Gemini CLI等AI編碼助手提供增強的工作流工具和跨模型上下文管理。它支持多種AI模型的無縫協作,實現代碼審查、調試、重構等開發任務,並能保持對話上下文在不同工作流間的延續。
Python
18.2K
5分
O
Opendia
OpenDia是一款開源瀏覽器擴展工具,允許AI模型直接控制用戶瀏覽器,利用現有登錄狀態、書籤等數據進行自動化操作,支持多種瀏覽器和AI模型,注重隱私保護。
JavaScript
11.3K
5分
N
Notte Browser
已認證
Notte是一個開源的全棧網絡AI代理框架,提供瀏覽器會話、自動化LLM驅動的代理、網頁觀察與操作、憑證管理等功能,旨在將互聯網轉化為代理友好的環境,並通過自然語言描述網站結構,降低LLM的認知負擔。
15.6K
4.5分
M
Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
23.6K
5分
B
Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
31.2K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
85.9K
5分
S
Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
25.1K
4.5分
N
Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
14.1K
4.5分
M
Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
16.2K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
18.9K
4.8分
C
Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
58.2K
4.7分
AIBase
智啟未來,您的人工智慧解決方案智庫
© 2025AIBase