Image Recognition MCP
I

Image Recognition MCP

一個基於Model Context Protocol的圖像識別服務器,通過OpenAI兼容的視覺模型提供圖像分析和描述功能,支持雲端和本地模型集成。
2分
5.1K

什麼是圖像識別MCP服務器?

這是一個智能圖像分析工具,能夠通過AI技術識別圖像中的內容並提供詳細的文字描述。它支持多種視覺模型,包括OpenAI官方模型和本地部署的模型(如LM Studio、Ollama等),讓AI助手能夠'看懂'圖片。

如何使用圖像識別MCP服務器?

您只需要配置好API密鑰或本地模型服務器,然後通過簡單的命令或接口發送圖像URL或本地文件路徑,服務器就會返回對圖像的詳細描述。它可以集成到各種支持MCP協議的AI助手中,如Claude Desktop等。

適用場景

適用於需要圖像分析的各種場景:內容審核、圖像描述生成、視覺輔助、教育學習、創意設計輔助、社交媒體內容分析等。

主要功能

智能圖像分析
使用先進的AI視覺模型分析圖像內容,識別物體、場景、文字、人物等元素,並提供自然語言描述。
多模型支持
支持OpenAI官方視覺模型(如GPT-4o)和各種本地部署的OpenAI兼容模型(如LM Studio、Ollama等),靈活適應不同需求。
MCP協議兼容
完全遵循Model Context Protocol標準,可以無縫集成到支持MCP的AI助手和應用程序中。
安全文件訪問
提供安全的本地文件訪問控制,支持路徑白名單和文件類型限制,保護系統安全。
簡單易用的API
提供簡潔的接口設計,只需圖像URL或路徑和可選提示詞,即可獲得詳細的圖像描述。
優勢
支持多種視覺模型,包括雲端和本地部署選項
易於集成到現有的AI助手工作流中
提供詳細準確的圖像描述和分析
具有良好的安全控制和訪問限制
開源免費,可自定義擴展
侷限性
需要API密鑰或本地模型服務器支持
對網絡圖像需要穩定的網絡連接
某些複雜圖像可能分析不夠精確
本地模型可能需要較高的硬件配置

如何使用

安裝和配置
確保已安裝Node.js 18+,然後在MCP客戶端配置中添加服務器配置。需要設置OPENAI_API_KEY環境變量(即使是本地模型也需要佔位值)。
配置模型服務器
根據您的需求配置模型:使用OpenAI官方API或設置本地模型服務器(如LM Studio、Ollama)。
設置安全選項
根據需要配置安全選項:允許的本地文件路徑、允許的域名等,確保系統安全。
使用圖像分析功能
通過AI助手調用describe-image工具,提供圖像URL或本地路徑,即可獲得圖像描述。

使用案例

分析網絡圖片
分析來自互聯網的圖片,獲取內容描述
分析本地產品圖片
分析本地存儲的產品圖片,用於電商或庫存管理
教育場景圖像分析
分析教育材料中的圖像,輔助學習

常見問題

我需要OpenAI API密鑰嗎?
支持哪些圖像格式?
如何配置本地模型服務器?
服務器無法啟動怎麼辦?
如何確保本地文件訪問安全?
支持哪些AI助手?

相關資源

GitHub倉庫
項目源代碼和最新更新
Model Context Protocol文檔
MCP協議官方文檔
OpenAI視覺模型文檔
OpenAI視覺模型使用指南
LM Studio官網
本地模型服務器LM Studio
Ollama官網
本地模型服務器Ollama

安裝

複製以下命令到你的Client進行配置
{
  "mcpServers": {
    "image-recognition": {
      "command": "npx",
      "args": ["-y", "@akirose/image-recognition-mcp"],
      "env": {
        "OPENAI_API_KEY": "your-actual-openai-api-key-here"
      }
    }
  }
}

{
  "mcpServers": {
    "image-recognition": {
      "command": "npx",
      "args": ["-y", "@akirose/image-recognition-mcp"],
      "env": {
        "OPENAI_API_KEY": "your-actual-openai-api-key-here",
        "ALLOW_ALL_PATHS": "true"
      }
    }
  }
}
注意:您的密鑰屬於敏感信息,請勿與任何人分享。

替代品

B
Blueprint MCP
Blueprint MCP是一個基於Arcade生態的圖表生成工具,利用Nano Banana Pro等技術,通過分析代碼庫和系統架構自動生成架構圖、流程圖等可視化圖表,幫助開發者理解複雜系統。
Python
6.9K
4分
K
Klavis
Klavis AI是一個開源項目,提供在Slack、Discord和Web平臺上簡單易用的MCP(模型上下文協議)服務,包括報告生成、YouTube工具、文檔轉換等多種功能,支持非技術用戶和開發者使用AI工作流。
TypeScript
13.8K
5分
D
Devtools Debugger MCP
Node.js調試器MCP服務器,提供基於Chrome DevTools協議的完整調試功能,包括斷點設置、單步執行、變量檢查和表達式評估等
TypeScript
8.9K
4分
M
Mcpjungle
MCPJungle是一個自託管的MCP網關,用於集中管理和代理多個MCP服務器,為AI代理提供統一的工具訪問接口。
Go
0
4.5分
N
Nexus
Nexus是一個AI工具聚合網關,支持連接多個MCP服務器和LLM提供商,通過統一端點提供工具搜索、執行和模型路由功能,支持安全認證和速率限制。
Rust
0
4分
Z
Zen MCP Server
Zen MCP是一個多模型AI協作開發服務器,為Claude和Gemini CLI等AI編碼助手提供增強的工作流工具和跨模型上下文管理。它支持多種AI模型的無縫協作,實現代碼審查、調試、重構等開發任務,並能保持對話上下文在不同工作流間的延續。
Python
17.1K
5分
O
Opendia
OpenDia是一款開源瀏覽器擴展工具,允許AI模型直接控制用戶瀏覽器,利用現有登錄狀態、書籤等數據進行自動化操作,支持多種瀏覽器和AI模型,注重隱私保護。
JavaScript
12.3K
5分
N
Notte Browser
已認證
Notte是一個開源的全棧網絡AI代理框架,提供瀏覽器會話、自動化LLM驅動的代理、網頁觀察與操作、憑證管理等功能,旨在將互聯網轉化為代理友好的環境,並通過自然語言描述網站結構,降低LLM的認知負擔。
16.4K
4.5分
B
Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
30.8K
4.5分
M
Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
23.3K
5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
83.6K
5分
S
Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
25.9K
4.5分
N
Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
14.1K
4.5分
M
Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
17.0K
5分
C
Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
58.5K
4.7分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
18.7K
4.8分
AIBase
智啟未來,您的人工智慧解決方案智庫
© 2025AIBase