MCPプロトコルでLLMチャットボットに多モデル画像生成機能を統合するGPT - Image

Gpt Image MCP

Image Gen MCP Serverは、Model Context Protocol（MCP）標準プロトコルを通じて、さまざまなLLMチャットボットにクロスプラットフォーム、多モデルの画像生成機能を提供する汎用AI画像生成サービスです。OpenAIとGoogleの複数の画像モデルをサポートし、テキスト対話からビジュアルコンテンツへのシームレスな変換を実現します。

画像とビデオ処理人工知能チャットボット #画像生成 #クロスプラットフォーム #AI統合 #MCPプロトコル .Python

スコア : 2.5ポイント

ダウンロード数 : 5

更新時間 : 2025-07-24

Image Gen MCP Serverとは？

これはModel Context Protocol (MCP)に基づくサーバーで、MCPをサポートするあらゆるAIチャットボットクライアントが高品質な画像を生成できるようにします。Claude Desktop、カスタムChatGPTインターフェイス、またはLlamaアプリを使用している場合でも、このサーバーを通じて複数のAI画像生成モデルにアクセスできます。

Image Gen MCP Serverの使い方は？

APIキーを設定してサーバーを起動するだけで、MCPプロトコルを介してさまざまなAIチャットボットクライアントと統合できます。コマンドラインまたはグラフィカルインターフェイスを使用して操作でき、簡単に画像を生成および編集できます。

適用シーン

コンテンツ作成、開発デザイン、企業統合、クリエイティブ産業など、複数の分野に適用できます。ブロガー、ソーシャルメディアマネージャー、UIデザイナー、ゲーム開発者など、誰でもこのサーバーを通じて作業効率を向上させることができます。

主な機能

多プラットフォーム対応Claude Desktop、Continue.devなど、MCPプロトコルをサポートするすべてのAIチャットボットクライアントと互換性があります。

多モデル対応gpt - image - 1、dall - e - 3、imagen - 4など、OpenAIとGoogle Geminiの複数の画像生成モデルをサポートします。

画像編集機能画像を生成するだけでなく、テキスト命令を使用して既存の画像を編集することもできます。

複数の出力形式PNG、JPEG、WebPなど、複数の画像形式での出力をサポートします。

スマートキャッシュメモリとRedisキャッシュのサポートを提供し、効率的な動作を保証します。

利点と制限

利点

ツールを切り替える必要なく、テキストと画像をシームレスに統合できる

ベンダーロックを回避し、ワークフローの効率を向上させる

複数のAI画像生成モデルをサポートし、さまざまなニーズに対応できる

統一されたAPIインターフェイスを提供し、統合プロセスを簡素化する

制限

APIキーの設定が必要で、初心者には少し難しい場合がある

MCPプロトコルのサポートに依存しており、現在は一部のクライアントに限定されている

画像生成コストが高くなる可能性がある

使い方

リポジトリをクローンする

GitHubからImage Gen MCP Serverのコードリポジトリをクローンします。

依存関係をインストールする

UVパッケージマネージャーを使用して、すべての必要なPython依存関係をインストールします。

環境を設定する

サンプル環境ファイルをコピーし、OpenAIとGoogleのAPIキーを追加します。

サーバーを起動する

必要に応じて適切な転送方式（STDIO、HTTP、またはSSE）を選択してサーバーを起動します。

使用例

ソーシャルメディアマーケティングチャット画面から離れることなく、ソーシャルメディアの投稿用にカスタムのビジュアルコンテンツを作成できます。

教育資料作成授業中に迅速に教育資料や視覚的な補助ツールを生成できます。

ゲーム開発ゲームのコンセプトアートやアセットのアイデア出しに迅速なプロトタイピングを提供します。

よくある質問

APIキーを取得する方法は？

どのような画像形式がサポートされていますか？

異なる画像生成モデルを選択する方法は？

画像編集はサポートされていますか？

🚀 Image Gen MCP Server

AIチャットボット向けの汎用的な画像生成を可能にする

従来のAIチャットボットのインターフェースは、基盤となる言語モデルがどれほど強力であっても、テキストのみの対話に限定されています。Image Gen MCP Serverは、標準化されたモデルコンテキストプロトコル（MCP）を通じて、任意のLLMベースのチャットボットクライアントが専門的な品質の画像を生成できるようにすることで、このギャップを埋めます。

Claude Desktop、カスタムChatGPTインターフェース、Llamaベースのアプリケーション、またはMCPをサポートする他の任意のLLMクライアントを使用している場合でも、このサーバーは、OpenAIのgpt - image - 1、dall - e - 3、dall - e - 2、およびGoogleのImagenシリーズ（imagen - 4、imagen - 4 - ultra、imagen - 3）を含む複数のAI画像生成モデルへのアクセスを民主化し、テキストのみの会話を豊かな視覚体験に変えます。

📦 パッケージマネージャー: このプロジェクトでは、高速で信頼性の高いPythonパッケージ管理のためにUVを使用しています。UVは、従来のpip/venvワークフローと比較して、より良い依存関係解決、より高速なインストール、および適切な環境分離を提供します。

🚀 クイックスタート

前提条件

Python 3.10以上
UVパッケージマネージャー
OpenAI APIキー（OpenAIモデル用）
Google Gemini APIキー（Geminiモデル用、オプション）

インストール

クローンとセットアップ:
```
git clone <repository-url>
cd image-gen-mcp
uv sync
```
注意: このプロジェクトでは、高速で信頼性の高いPythonパッケージ管理のためにUVを使用しています。UVは、pipと比較して、より良い依存関係解決とより高速なインストールを提供します。

環境の設定:

cp .env.example .env
# .envを編集し、APIキーを追加します:
# - PROVIDERS__OPENAI__API_KEY はOpenAIモデル用
# - PROVIDERS__GEMINI__API_KEY はGeminiモデル用（オプション）

セットアップのテスト:

uv run python scripts/dev.py setup
uv run python scripts/dev.py test

サーバーの起動

開発モード

# ウェブ開発とテスト用のHTTPトランスポート
./run.sh dev

# 開発ツール（Redis Commander）付きのHTTPトランスポート
./run.sh dev --tools

# Claude Desktop統合用のSTDIOトランスポート
./run.sh stdio

# モニタリング付きの本番デプロイ
./run.sh prod

手動実行

# STDIOトランスポート（デフォルト） - Claude Desktop用
uv run python -m gpt_image_mcp.server

# HTTPトランスポート - ウェブデプロイ用
uv run python -m gpt_image_mcp.server --transport streamable-http --port 3001

# SSEトランスポート - リアルタイムアプリケーション用
uv run python -m gpt_image_mcp.server --transport sse --port 8080

# カスタム設定で実行
uv run python -m gpt_image_mcp.server --config /path/to/.env --log-level DEBUG

# ウェブ開発用にCORSを有効にする
uv run python -m gpt_image_mcp.server --transport streamable-http --cors

コマンドラインオプション

uv run python -m gpt_image_mcp.server --help

Image Gen MCP Server - OpenAIのgpt-image-1モデルを使用して画像を生成および編集します

オプション:
  --config PATH         設定ファイルのパス（.env形式）
  --log-level LEVEL     ログレベルを設定します（DEBUG、INFO、WARNING、ERROR、CRITICAL）
  --transport TYPE      トランスポート方法（stdio、sse、streamable-http）
  --port PORT          HTTPトランスポート用のポート（デフォルト: 3001）
  --host HOST          HTTPトランスポート用のホストアドレス（デフォルト: 127.0.0.1）
  --cors               ウェブデプロイ用にCORSを有効にします
  --version            バージョン情報を表示します
  --help               ヘルプメッセージを表示します

例:
  # Claude Desktop統合
  uv run python -m gpt_image_mcp.server

  # Redisキャッシュ付きのウェブデプロイ
  uv run python -m gpt_image_mcp.server --transport streamable-http --port 3001

  # デバッグログとツール付きの開発
  uv run python -m gpt_image_mcp.server --log-level DEBUG --cors

MCPクライアントの統合

このサーバーは、任意のMCP互換チャットボットクライアントと動作します。以下は設定例です。

Claude Desktop (Anthropic)

{
  "mcpServers": {
    "image-gen-mcp": {
      "command": "uv",
      "args": [
        "--directory",
        "/path/to/image-gen-mcp",
        "run",
        "image-gen-mcp"
      ],
      "env": {
        "OPENAI_API_KEY": "your-api-key-here"
      }
    }
  }
}

Continue.dev (VS Code拡張機能)

{
  "mcpServers": {
    "gpt-image": {
      "command": "uv",
      "args": ["--directory", "/path/to/image-gen-mcp", "run", "image-gen-mcp"],
      "env": {
        "OPENAI_API_KEY": "your-api-key-here"
      }
    }
  }
}

カスタムMCPクライアント

他のMCP互換アプリケーションでは、標準のMCP STDIOトランスポートを使用します。

uv run python -m gpt_image_mcp.server

汎用互換性: このサーバーは標準のMCPプロトコルに従っており、AIエコシステム全体の現在および将来のMCP対応クライアントとの互換性を保証します。

✨ 主な機能

🎨 複数プロバイダーに対応した画像生成

複数のAIモデル: OpenAI（gpt-image-1、dall-e-3、dall-e-2）およびGoogle Gemini（imagen-4、imagen-4-ultra、imagen-3）をサポート
テキストから画像への変換: テキスト記述から高品質の画像を生成
画像編集: テキスト指示で既存の画像を編集（OpenAIモデル）
複数のフォーマット: PNG、JPEG、WebP出力フォーマットをサポート
品質コントロール: 自動、高、中、低の品質設定
背景コントロール: 自動、透明、不透明の背景オプション
動的モデル検出: 実行時に利用可能なモデルと機能を照会

🔗 MCP統合

FastMCPフレームワーク: 最新のMCP Python SDKを使用して構築
複数のトランスポート: STDIO、HTTP、SSEトランスポートをサポート
構造化出力: 適切なスキーマを持つ検証済みのツール応答
リソースアクセス: 画像の取得と管理のためのMCPリソース
プロンプトテンプレート: 一般的なユースケース用の10以上の組み込みテンプレート

💾 ストレージとキャッシュ

ローカルストレージ: メタデータ付きの整理されたディレクトリ構造
URLベースのアクセス: 画像用のトランスポート対応URL生成
二重アクセス: 即時のbase64データ + 永続的なリソースURI
スマートキャッシュ: TTLとRedisサポート付きのメモリベースのキャッシュ
自動クリーンアップ: 設定可能なファイル保持ポリシー

🚀 本番デプロイ

Dockerサポート: 本番環境に対応したDockerコンテナ
複数のトランスポート: Claude Desktop用のSTDIO、ウェブデプロイ用のHTTP
リバースプロキシ: レート制限付きのNginx設定
モニタリング: GrafanaとPrometheusの統合
SSL/TLS: Certbotによる自動証明書管理

🛠️ 開発機能

型安全性: Pydanticモデルによる完全な型ヒント
エラーハンドリング: 包括的なエラーハンドリングとロギング
設定管理: 環境ベースの設定管理
テスト: 非同期サポート付きのPytestベースのテストスイート
開発ツール: ホットリロード、Redis Commander、デバッグログ

💻 使用例

基本的な使用法

# MCPクライアントを介して使用
result = await session.call_tool(
    "generate_image",
    arguments={
        "prompt": "A beautiful sunset over mountains, digital art style",
        "quality": "high",
        "size": "1536x1024",
        "style": "vivid"
    }
)

高度な使用法

プロンプトテンプレートの使用

# ソーシャルメディア用の最適化されたプロンプトを取得
prompt_result = await session.get_prompt(
    "social_media_prompt",
    arguments={
        "platform": "instagram",
        "content_type": "product announcement",
        "brand_style": "modern minimalist"
    }
)

生成された画像へのアクセス

# リソースURIを介してアクセス
image_data = await session.read_resource("generated-images://img_20250630143022_abc123")

# 最近の画像を確認
history = await session.read_resource("image-history://recent?limit=5")

# ストレージ統計情報
stats = await session.read_resource("storage-stats://overview")

📚 ドキュメント

利用可能なツール

`list_available_models`

利用可能なすべての画像生成モデルとその機能をリストします。

戻り値: モデル情報、機能、およびプロバイダー詳細を含む辞書。

`generate_image`

サポートされている任意のモデルを使用して、テキスト記述から画像を生成します。

パラメーター:

prompt (必須): 目的の画像のテキスト記述
model (オプション): 使用するモデル（例: "gpt-image-1"、"dall-e-3"、"imagen-4"）
quality: "auto" | "high" | "medium" | "low" (デフォルト: "auto")
size: "1024x1024" | "1536x1024" | "1024x1536" (デフォルト: "1536x1024")
style: "vivid" | "natural" (デフォルト: "vivid")
output_format: "png" | "jpeg" | "webp" (デフォルト: "png")
background: "auto" | "transparent" | "opaque" (デフォルト: "auto")

注意: パラメーターの可用性は選択したモデルに依存します。機能を確認するには、list_available_modelsを使用してください。

`edit_image`

テキスト指示で既存の画像を編集します。

パラメーター:

image_data (必須): Base64エンコードされた画像またはデータURL
prompt (必須): 編集指示
mask_data: ターゲット編集用のオプションマスク
size, quality, output_format: generate_imageと同じ

利用可能なリソース

generated-images://{image_id} - 特定の生成された画像にアクセス
image-history://recent - 最近の生成履歴を閲覧
storage-stats://overview - ストレージ使用状況と統計情報
model-info://gpt-image-1 - モデルの機能と価格

プロンプトテンプレート

一般的なユースケース用の組み込みテンプレートが用意されています。

クリエイティブ画像: アート的な画像生成
商品写真: 商業用の商品画像
ソーシャルメディアグラフィックス: プラットフォーム最適化された投稿
ブログヘッダー: 記事のヘッダー画像
OG画像: ソーシャルメディアのプレビュー画像
ヒーローバナー: ウェブサイトのヒーローセクション
メールヘッダー: ニュースレターのヘッダー
ビデオサムネイル: YouTube/ビデオのサムネイル
インフォグラフィック: データ可視化画像
アートスタイル: 特定のアート運動のスタイル

設定

環境変数または.envファイルを介して設定できます。

# =============================================================================
# プロバイダー設定
# =============================================================================
# OpenAIプロバイダー（デフォルトで有効）
PROVIDERS__OPENAI__API_KEY=sk-your-openai-api-key-here
PROVIDERS__OPENAI__BASE_URL=https://api.openai.com/v1
PROVIDERS__OPENAI__ORGANIZATION=org-your-org-id
PROVIDERS__OPENAI__TIMEOUT=300.0
PROVIDERS__OPENAI__MAX_RETRIES=3
PROVIDERS__OPENAI__ENABLED=true

# Geminiプロバイダー（デフォルトで無効）
PROVIDERS__GEMINI__API_KEY=your-gemini-api-key-here
PROVIDERS__GEMINI__BASE_URL=https://generativelanguage.googleapis.com/v1beta/
PROVIDERS__GEMINI__TIMEOUT=300.0
PROVIDERS__GEMINI__MAX_RETRIES=3
PROVIDERS__GEMINI__ENABLED=false
PROVIDERS__GEMINI__DEFAULT_MODEL=imagen-4

# =============================================================================
# 画像生成設定
# =============================================================================
IMAGES__DEFAULT_MODEL=gpt-image-1
IMAGES__DEFAULT_QUALITY=auto
IMAGES__DEFAULT_SIZE=1536x1024
IMAGES__DEFAULT_STYLE=vivid
IMAGES__DEFAULT_MODERATION=auto
IMAGES__DEFAULT_OUTPUT_FORMAT=png
# 画像ホスティング用のベースURL（例: nginx/CDN用のhttps://cdn.example.com）
IMAGES__BASE_HOST=

# =============================================================================
# サーバー設定
# =============================================================================
SERVER__NAME=Image Gen MCP Server
SERVER__VERSION=0.1.0
SERVER__PORT=3001
SERVER__HOST=127.0.0.1
SERVER__LOG_LEVEL=INFO
SERVER__RATE_LIMIT_RPM=50

# =============================================================================
# ストレージ設定
# =============================================================================
STORAGE__BASE_PATH=./storage
STORAGE__RETENTION_DAYS=30
STORAGE__MAX_SIZE_GB=10.0
STORAGE__CLEANUP_INTERVAL_HOURS=24

# =============================================================================
# キャッシュ設定
# =============================================================================
CACHE__ENABLED=true
CACHE__TTL_HOURS=24
CACHE__BACKEND=memory
CACHE__MAX_SIZE_MB=500
# CACHE__REDIS_URL=redis://localhost:6379