gpt-image-mcp - 通過MCP協議為LLM聊天機器人集成多模型圖像生成能力的服務器

Gpt Image MCP

Image Gen MCP Server是一個通用AI圖像生成服務，通過Model Context Protocol（MCP）標準協議為各類LLM聊天機器人提供跨平臺、多模型的圖像生成能力，支持OpenAI和Google的多種圖像模型，實現文本對話到可視化內容的無縫轉換。

圖像與視頻處理人工智能聊天機器人 #圖像生成 #跨平臺 #AI集成 #MCP協議 .Python

評分 : 2.5分

下載量 : 6.8K

更新時間 : 2025-07-24

打開站點

什麼是Image Gen MCP Server?

這是一個基於Model Context Protocol (MCP)的服務器，它讓任何支持MCP的AI聊天機器人客戶端都能生成高質量圖像。無論您使用的是Claude Desktop、自定義ChatGPT界面還是Llama應用，都可以通過這個服務器訪問多個AI圖像生成模型。

如何使用Image Gen MCP Server?

只需配置API密鑰並啟動服務器，即可通過MCP協議與各種AI聊天機器人客戶端集成。您可以通過命令行或圖形界面進行操作，輕鬆生成和編輯圖像。

適用場景

適用於內容創作、開發設計、企業集成和創意產業等多個領域。無論是博客作者、社交媒體經理、UI設計師還是遊戲開發者，都可以通過這個服務器提升工作效率。

主要功能

多平臺支持

兼容所有支持MCP協議的AI聊天機器人客戶端，如Claude Desktop、Continue.dev等。

多模型支持

支持OpenAI和Google Gemini的多種圖像生成模型，包括gpt-image-1、dall-e-3、imagen-4等。

圖像編輯功能

不僅可以生成圖像，還可以通過文本指令對現有圖像進行編輯。

多種輸出格式

支持PNG、JPEG和WebP等多種圖像格式輸出。

智能緩存

提供內存和Redis緩存支持，確保高效運行。

優勢

無需切換工具，實現文本和圖像的無縫集成

避免供應商鎖定，提高工作流程效率

支持多種AI圖像生成模型，滿足不同需求

提供統一的API接口，簡化集成過程

侷限性

需要配置API密鑰，可能對新手有一定難度

依賴於MCP協議的支持，目前僅限部分客戶端

圖像生成成本可能較高

如何使用

克隆倉庫

從GitHub上克隆Image Gen MCP Server的代碼倉庫。

安裝依賴

使用UV包管理器安裝所有必要的Python依賴項。

配置環境

複製示例環境文件並添加您的OpenAI和Google API密鑰。

啟動服務器

根據您的需求選擇適當的傳輸方式（STDIO、HTTP或SSE）啟動服務器。

使用案例

社交媒體營銷

為社交媒體帖子創建定製的視覺內容，無需離開聊天界面。

教育材料製作

在教學過程中快速生成教學材料和視覺輔助工具。

遊戲開發

為遊戲概念藝術和資產構思提供快速原型。

常見問題

如何獲取API密鑰？

支持哪些圖像格式？

如何選擇不同的圖像生成模型？

是否支持圖像編輯？

🚀 圖像生成MCP服務器

圖像生成MCP服務器旨在為AI聊天機器人賦能，實現通用的圖像生成功能。傳統的AI聊天機器人界面，無論其底層語言模型多麼強大，通常都侷限於純文本交互。而本服務器通過標準化的模型上下文協議（MCP），使任何基於大語言模型（LLM）的聊天機器人客戶端都能生成專業品質的圖像。

🚀 快速開始

前提條件

Python 3.10及以上版本
UV包管理器
OpenAI API密鑰（用於OpenAI模型）
Google Gemini API密鑰（用於Gemini模型，可選）

安裝步驟

克隆並設置項目：

git clone <repository-url>
cd image-gen-mcp
uv sync

注意：本項目使用UV進行快速、可靠的Python包管理。與傳統的pip/venv工作流相比，UV提供了更好的依賴解析、更快的安裝速度和更完善的環境隔離。

配置環境：

cp .env.example .env
# 編輯.env文件並添加你的API密鑰：
# - PROVIDERS__OPENAI__API_KEY用於OpenAI模型
# - PROVIDERS__GEMINI__API_KEY用於Gemini模型（可選）

測試設置：

uv run python scripts/dev.py setup
uv run python scripts/dev.py test

運行服務器

開發模式

# 用於Web開發和測試的HTTP傳輸
./run.sh dev

# 帶有開發工具（Redis Commander）的HTTP傳輸
./run.sh dev --tools

# 用於Claude Desktop集成的STDIO傳輸
./run.sh stdio

# 帶有監控的生產部署
./run.sh prod

手動執行

# STDIO傳輸（默認） - 用於Claude Desktop
uv run python -m gpt_image_mcp.server

# HTTP傳輸 - 用於Web部署
uv run python -m gpt_image_mcp.server --transport streamable-http --port 3001

# SSE傳輸 - 用於即時應用程序
uv run python -m gpt_image_mcp.server --transport sse --port 8080

# 自定義配置
uv run python -m gpt_image_mcp.server --config /path/to/.env --log-level DEBUG

# 為Web開發啟用CORS
uv run python -m gpt_image_mcp.server --transport streamable-http --cors

命令行選項

uv run python -m gpt_image_mcp.server --help

Image Gen MCP Server - 使用OpenAI的gpt-image-1模型生成和編輯圖像

選項:
  --config PATH         配置文件的路徑（.env格式）
  --log-level LEVEL     設置日誌級別（DEBUG, INFO, WARNING, ERROR, CRITICAL）
  --transport TYPE      傳輸方法（stdio, sse, streamable-http）
  --port PORT          HTTP傳輸的端口（默認值: 3001）
  --host HOST          HTTP傳輸的主機地址（默認值: 127.0.0.1）
  --cors               為Web部署啟用CORS
  --version            顯示版本信息
  --help               顯示幫助信息

示例:
  # Claude Desktop集成
  uv run python -m gpt_image_mcp.server

  # 帶有Redis緩存的Web部署
  uv run python -m gpt_image_mcp.server --transport streamable-http --port 3001

  # 帶有調試日誌和工具的開發模式
  uv run python -m gpt_image_mcp.server --log-level DEBUG --cors

MCP客戶端集成

本服務器可與任何支持MCP的聊天機器人客戶端配合使用。以下是配置示例：

Claude Desktop（Anthropic）

{
  "mcpServers": {
    "image-gen-mcp": {
      "command": "uv",
      "args": [
        "--directory",
        "/path/to/image-gen-mcp",
        "run",
        "image-gen-mcp"
      ],
      "env": {
        "OPENAI_API_KEY": "your-api-key-here"
      }
    }
  }
}

Continue.dev（VS Code擴展）

{
  "mcpServers": {
    "gpt-image": {
      "command": "uv",
      "args": ["--directory", "/path/to/image-gen-mcp", "run", "image-gen-mcp"],
      "env": {
        "OPENAI_API_KEY": "your-api-key-here"
      }
    }
  }
}

自定義MCP客戶端

對於其他支持MCP的應用程序，使用標準的MCP STDIO傳輸：

uv run python -m gpt_image_mcp.server

通用兼容性：本服務器遵循標準的MCP協議，確保與當前和未來支持MCP的客戶端在整個AI生態系統中兼容。

✨ 主要特性

🎨 多供應商圖像生成

多種AI模型：支持OpenAI（gpt-image-1、dall-e-3、dall-e-2）和Google Gemini（imagen-4、imagen-4-ultra、imagen-3）的圖像生成模型。
文本到圖像：根據文本描述生成高質量圖像。
圖像編輯：使用文本指令編輯現有圖像（OpenAI模型支持）。
多種格式：支持PNG、JPEG和WebP輸出格式。
質量控制：提供自動、高、中、低四種質量設置。
背景控制：支持透明、不透明或自動背景選項。
動態模型發現：在運行時查詢可用的模型和功能。

🔗 MCP集成

FastMCP框架：基於最新的MCP Python SDK構建。
多種傳輸方式：支持STDIO、HTTP和SSE傳輸。
結構化輸出：使用正確的模式驗證工具響應。
資源訪問：提供用於圖像檢索和管理的MCP資源。
提示模板：內置10多種常見用例的提示模板。

💾 存儲與緩存

本地存儲：具有組織良好的目錄結構和元數據。
基於URL的訪問：生成支持傳輸的圖像URL。
雙重訪問：即時提供Base64數據和持久的資源URI。
智能緩存：基於內存的緩存，支持TTL和Redis。
自動清理：可配置文件保留策略。

🚀 生產部署

Docker支持：提供適用於生產環境的Docker容器。
多傳輸方式：支持用於Claude Desktop的STDIO和用於Web部署的HTTP。
反向代理：使用Nginx進行反向代理，並配置速率限制。
監控：集成Prometheus和Grafana進行監控。
SSL/TLS：使用Certbot自動管理證書。

🛠️ 開發特性

類型安全：使用Pydantic模型提供完整的類型提示。
錯誤處理：全面的錯誤處理和日誌記錄。
配置管理：基於環境變量的配置管理。
測試：基於Pytest的測試套件，支持異步測試。
開發工具：支持熱重載、Redis Commander和調試日誌。

📦 安裝指南

克隆項目

git clone <repository-url>
cd image-gen-mcp

安裝依賴

uv sync

配置環境

cp .env.example .env
# 編輯.env文件並添加API密鑰

測試安裝

uv run python scripts/dev.py setup
uv run python scripts/dev.py test

💻 使用示例

基礎用法

# 通過MCP客戶端使用
result = await session.call_tool(
    "generate_image",
    arguments={
        "prompt": "A beautiful sunset over mountains, digital art style",
        "quality": "high",
        "size": "1536x1024",
        "style": "vivid"
    }
)

高級用法

使用提示模板

# 獲取針對社交媒體優化的提示
prompt_result = await session.get_prompt(
    "social_media_prompt",
    arguments={
        "platform": "instagram",
        "content_type": "product announcement",
        "brand_style": "modern minimalist"
    }
)

訪問生成的圖像

# 通過資源URI訪問
image_data = await session.read_resource("generated-images://img_20250630143022_abc123")

# 查看最近的圖像
history = await session.read_resource("image-history://recent?limit=5")

# 存儲統計信息
stats = await session.read_resource("storage-stats://overview")

📚 詳細文檔

可用工具

`list_available_models`

列出所有可用的圖像生成模型及其功能。

返回值：包含模型信息、功能和供應商詳細信息的字典。

`generate_image`

使用任何支持的模型根據文本描述生成圖像。

參數：

prompt（必需）：所需圖像的文本描述。
model（可選）：要使用的模型（例如，"gpt-image-1"、"dall-e-3"、"imagen-4"）。
quality："auto" | "high" | "medium" | "low"（默認值："auto"）。
size："1024x1024" | "1536x1024" | "1024x1536"（默認值："1536x1024"）。
style："vivid" | "natural"（默認值："vivid"）。
output_format："png" | "jpeg" | "webp"（默認值："png"）。
background："auto" | "transparent" | "opaque"（默認值："auto"）。

注意：參數的可用性取決於所選的模型。使用list_available_models檢查功能。

`edit_image`

使用文本指令編輯現有圖像。

參數：

image_data（必需）：Base64編碼的圖像或數據URL。
prompt（必需）：編輯指令。
mask_data：可選的掩碼，用於有針對性的編輯。
size、quality、output_format：與generate_image相同。

可用資源

generated-images://{image_id} - 訪問特定的生成圖像。
image-history://recent - 瀏覽最近的生成歷史記錄。
storage-stats://overview - 存儲使用情況和統計信息。
model-info://gpt-image-1 - 模型功能和定價信息。

提示模板

內置了適用於常見用例的提示模板：

創意圖像：用於藝術圖像生成。
產品攝影：用於商業產品圖像。
社交媒體圖形：針對特定平臺優化的帖子。
博客標題：文章標題圖像。
OG圖像：社交媒體預覽圖像。
英雄橫幅：網站英雄部分的圖像。
電子郵件標題：時事通訊標題。
視頻縮略圖：YouTube/視頻縮略圖。
信息圖表：數據可視化圖像。
藝術風格：特定藝術運動風格。

配置

通過環境變量或.env文件進行配置：

# =============================================================================
# 供應商配置
# =============================================================================
# OpenAI供應商（默認啟用）
PROVIDERS__OPENAI__API_KEY=sk-your-openai-api-key-here
PROVIDERS__OPENAI__BASE_URL=https://api.openai.com/v1
PROVIDERS__OPENAI__ORGANIZATION=org-your-org-id
PROVIDERS__OPENAI__TIMEOUT=300.0
PROVIDERS__OPENAI__MAX_RETRIES=3
PROVIDERS__OPENAI__ENABLED=true

# Gemini供應商（默認禁用）
PROVIDERS__GEMINI__API_KEY=your-gemini-api-key-here
PROVIDERS__GEMINI__BASE_URL=https://generativelanguage.googleapis.com/v1beta/
PROVIDERS__GEMINI__TIMEOUT=300.0
PROVIDERS__GEMINI__MAX_RETRIES=3
PROVIDERS__GEMINI__ENABLED=false
PROVIDERS__GEMINI__DEFAULT_MODEL=imagen-4

# =============================================================================
# 圖像生成設置
# =============================================================================
IMAGES__DEFAULT_MODEL=gpt-image-1
IMAGES__DEFAULT_QUALITY=auto
IMAGES__DEFAULT_SIZE=1536x1024
IMAGES__DEFAULT_STYLE=vivid
IMAGES__DEFAULT_MODERATION=auto
IMAGES__DEFAULT_OUTPUT_FORMAT=png
# 圖像託管的基礎URL（例如，https://cdn.example.com用於nginx/CDN）
IMAGES__BASE_HOST=

# =============================================================================
# 服務器配置
# =============================================================================
SERVER__NAME=Image Gen MCP Server
SERVER__VERSION=0.1.0
SERVER__PORT=3001
SERVER__HOST=127.0.0.1
SERVER__LOG_LEVEL=INFO
SERVER__RATE_LIMIT_RPM=50

# =============================================================================
# 存儲配置
# =============================================================================
STORAGE__BASE_PATH=./storage
STORAGE__RETENTION_DAYS=30
STORAGE__MAX_SIZE_GB=10.0
STORAGE__CLEANUP_INTERVAL_HOURS=24

# =============================================================================
# 緩存配置
# =============================================================================
CACHE__ENABLED=true
CACHE__TTL_HOURS=24
CACHE__BACKEND=memory
CACHE__MAX_SIZE_MB=500
# CACHE__REDIS_URL=redis://localhost:6379

部署

生產部署

服務器支持使用Docker、監控和反向代理進行生產部署：

# 快速生產部署
./run.sh prod

# 手動使用Docker Compose部署
docker-compose -f docker-compose.prod.yml up -d

生產環境棧包括：

圖像生成MCP服務器：主應用程序容器。
Redis：用於緩存和會話存儲。
Nginx：帶有速率限制的反向代理（單獨配置）。
Prometheus：指標收集。
Grafana：監控儀表盤。

訪問點：

主服務：http://localhost:3001（通過代理）
Grafana儀表盤：http://localhost:3000
Prometheus：http://localhost:9090（僅本地訪問）

VPS部署

對於使用SSL、監控和生產加固的VPS部署：

# 下載部署腳本
wget https://raw.githubusercontent.com/your-repo/image-gen-mcp/main/deploy/vps-setup.sh
chmod +x vps-setup.sh
./vps-setup.sh

包括的功能：

Docker容器化。
帶有SSL的Nginx反向代理。
自動證書管理（Certbot）。
系統監控和日誌記錄。
防火牆配置。
自動備份。

詳細說明請參閱VPS部署指南。

Docker配置

可用的Docker Compose配置文件：

# 使用HTTP傳輸的開發模式
docker-compose -f docker-compose.dev.yml up

# 帶有Redis Commander的開發模式
docker-compose -f docker-compose.dev.yml --profile tools up

# 用於桌面集成的STDIO傳輸
docker-compose -f docker-compose.dev.yml --profile stdio up

# 帶有監控的生產模式
docker-compose -f docker-compose.prod.yml up -d