🚀 モデルIDチートシート
AIコーディングエージェントが古いモデル名を誤って生成するのを防ぎます。 このMCPサーバーは、AIアシスタントに19のプロバイダーからの107のモデルに関する正確で最新のAPIモデルID、価格、仕様を即座に提供します。
Go言語で構築されています。単一の10MBのバイナリで、外部呼び出しは一切ありません。応答時間はミリ秒未満で、毎日自動更新されます。
- model = "gpt-4-turbo" # 誤った情報 - もう存在しません
+ model = "gpt-5.3-codex" # 正しい - 公式ドキュメントと照合済み
- model = "claude-3-opus-20240229" # 非推奨
+ model = "claude-opus-4-6" # 最新 - 最新のAnthropicの主力モデル
🚀 クイックスタート
以下のオプションから1つを選んでください。1分以内で起動します。
オプションA: Claude Code(1コマンド)
claude mcp add --transport sse --scope user model-id-cheatsheet \
https://universal-model-registry-production.up.railway.app/sse
動作を確認します:
claude mcp list
その後、新しいClaude Codeセッションを開始して、"最新のOpenAIモデルは何ですか?" と尋ねると、自動的にツールが使用されます。
オプションB: Cursor
~/.cursor/mcp.jsonに追加します:
{
"mcpServers": {
"model-id-cheatsheet": {
"url": "https://universal-model-registry-production.up.railway.app/sse"
}
}
}
変更を反映するためにCursorを再起動します。
オプションC: Windsurf
設定 > MCPサーバーに追加するか(または~/.codeium/windsurf/mcp_config.jsonを編集します):
{
"mcpServers": {
"model-id-cheatsheet": {
"serverUrl": "https://universal-model-registry-production.up.railway.app/sse"
}
}
}
オプションD: Codex CLI
~/.codex/config.tomlに追加します:
[mcp_servers.model-id-cheatsheet]
command = "uvx"
args = ["mcp-proxy", "--transport", "sse", "https://universal-model-registry-production.up.railway.app/sse"]
オプションE: OpenCode
~/.config/opencode/opencode.jsonに追加します:
{
"$schema": "https://opencode.ai/config.json",
"mcp": {
"model-id-cheatsheet": {
"type": "remote",
"url": "https://universal-model-registry-production.up.railway.app/sse"
}
}
}
オプションF: 任意のMCPクライアント
SSEエンドポイントに直接接続します(APIキーや認証は不要です):
https://universal-model-registry-production.up.railway.app/sse
または、Streamable HTTPトランスポートを使用します:
https://universal-model-registry-production.up.railway.app/mcp
設定の確認
接続したら、AIアシスタントに以下の質問を試してみてください:
- "Claude Opus 4.6の正しいモデルIDは何ですか?"
- "gpt-4oはまだ利用可能ですか?"
- "gpt-5.2とclaude-opus-4-6を比較してください"
- "ビジョン機能を持つ最も安いモデルは何ですか?"
エージェントが回答する前にget_model_infoやcheck_model_statusなどのツールを呼び出す場合は、正常に動作しています。
✨ 主な機能
AIエージェントは、モデルIDを記述する前に自動的に呼び出す6つのツールを獲得します:
| ツール |
機能 |
例のプロンプト |
get_model_info(model_id) |
完全な仕様: API ID、価格、コンテキストウィンドウ、機能 |
"Claude SonnetのモデルIDは何ですか?" |
list_models(provider?, status?, capability?) |
レジストリを閲覧およびフィルタリング |
"現在のすべてのGoogleモデルを表示してください" |
recommend_model(task, budget?) |
タスクに対するランク付けされた推奨 |
"安価な予算でコーディングに最適なモデル" |
check_model_status(model_id) |
モデルが現在使用可能、レガシー、または非推奨かを確認 |
"gpt-4oはまだ利用可能ですか?" |
compare_models(model_ids) |
並列比較表 |
"gpt-5.2とclaude-opus-4-6を比較してください" |
search_models(query) |
すべてのフィールドを対象とした自由テキスト検索 |
"推論モデルを検索してください" |
リソース
| URI |
説明 |
model://registry/all |
すべての107のモデルの完全なJSONダンプ |
model://registry/current |
現在使用可能(非推奨ではない)モデルのみをJSON形式で |
model://registry/pricing |
最安価な順にソートされた価格表(マークダウン形式) |
内部での動作
- エージェントにコードを書くように依頼するか、モデルに関する質問をする
- エージェントが自動的に適切なツール(例:
get_model_info)を呼び出す
- サーバーがミリ秒未満で検証済みのデータを返す(外部API呼び出しはありません)
- エージェントが正しい最新のモデルIDでコードを書く
サーバーの指示により、エージェントは*"トレーニングデータからのモデルIDを最初に検証せずに使用しないでください。"* というルールに従います。これにより、エージェントは書き込む前に必ず確認します。
💻 使用例
基本的な使用法
response = client.chat.completions.create(
model="gpt-5.4",
messages=[...]
)
高度な使用法
response = client.chat.completions.create(
model="gpt-5",
messages=[...]
)
response = client.chat.completions.create(
model="gpt-5-nano",
messages=[...]
)
🔧 技術詳細
リソース使用量
一般的な懸念事項: "これはエージェントを遅くしたり、トークンを消費したりしますか?"
| 指標 |
値 |
| バイナリサイズ |
~10MB |
| 実行時メモリ |
最小限(静的なメモリ内マップ、データベースなし) |
| 外部API呼び出し |
ゼロ(すべてのデータは組み込まれています) |
| 応答時間 |
ミリ秒未満 |
| ツール呼び出しごとのトークンコスト |
~200 - 500トークン(小さなテキスト応答) |
| ツールスキーマのオーバーヘッド |
システムプロンプトで~500 - 800トークン |
比較として、単一のウェブ検索は、すべての6つのツールスキーマの合計よりも多くのトークンを消費します。
対象モデル(合計107)
現在のモデル(79)
| プロバイダー |
モデル |
API ID |
| OpenAI (15) |
GPT-5.4, GPT-5.4 Pro, GPT-5.3 Instant, GPT-5.2, GPT-5.2 Pro, GPT-5.1, GPT-5.1 Codex, GPT-5.1 Mini, GPT-5, GPT-5 Mini, GPT-5 Nano, GPT-4.1 Mini, GPT-4.1 Nano, o3, o4-mini |
gpt-5.4, gpt-5.4-pro, gpt-5.3-chat-latest, gpt-5.2, gpt-5.2-pro, gpt-5.1, gpt-5.1-codex, gpt-5.1-mini, gpt-5, gpt-5-mini, gpt-5-nano, gpt-4.1-mini, gpt-4.1-nano, o3, o4-mini |
| Anthropic (4) |
Claude Opus 4.6, Claude Sonnet 4.6, Claude Sonnet 4.5, Claude Haiku 4.5 |
claude-opus-4-6, claude-sonnet-4-6, claude-sonnet-4-5-20250929, claude-haiku-4-5-20251001 |
| Mistral (11) |
Mistral Large 3, Mistral Medium 3, Mistral Small 3.2, Mistral Saba, Ministral 3B, Ministral 8B, Ministral 14B, Magistral Small 1.2, Magistral Medium 1.2, Devstral 2, Devstral Small 2 |
mistral-large-2512, mistral-medium-2505, mistral-small-2506, mistral-saba-2502, ministral-3b-2512, ministral-8b-2512, ministral-14b-2512, magistral-small-2509, magistral-medium-2509, devstral-2512, devstral-small-2512 |
| Amazon (6) |
Nova Micro, Nova Lite, Nova Pro, Nova Premier, Nova 2 Lite, Nova 2 Pro |
amazon-nova-micro, amazon-nova-lite, amazon-nova-pro, amazon-nova-premier, amazon-nova-2-lite, amazon-nova-2-pro |
| Google (5) |
Gemini 3.1 Pro, Gemini 3.1 Flash Lite, Gemini 3 Flash, Gemini 2.5 Pro, Gemini 2.5 Flash |
gemini-3.1-pro-preview, gemini-3.1-flash-lite-preview, gemini-3-flash-preview, gemini-2.5-pro, gemini-2.5-flash |
| Cohere (5) |
Command A, Command A Reasoning, Command A Vision, Command A Translate, Command R7B |
command-a-03-2025, command-a-reasoning-08-2025, command-a-vision-07-2025, command-a-translate-08-2025, command-r7b-12-2024 |
| xAI (4) |
Grok 4, Grok 4.1 Fast, Grok 4 Fast, Grok Code Fast 1 |
grok-4, grok-4.1-fast, grok-4-fast, grok-code-fast-1 |
| Microsoft (4) |
Phi-4, Phi-4 Multimodal, Phi-4 Reasoning, Phi-4 Reasoning Plus |
phi-4, phi-4-multimodal-instruct, phi-4-reasoning, phi-4-reasoning-plus |
| Perplexity (4) |
Sonar, Sonar Pro, Sonar Reasoning Pro, Sonar Deep Research |
sonar, sonar-pro, sonar-reasoning-pro, sonar-deep-research |
| Moonshot (3) |
Kimi K2.5, Kimi K2 Thinking, Kimi K2 (0905) |
kimi-k2.5, kimi-k2-thinking, kimi-k2-0905-preview |
| Tencent (3) |
Hunyuan TurboS, Hunyuan T1, Hunyuan A13B |
hunyuan-turbos, hunyuan-t1, hunyuan-a13b |
| Zhipu (3) |
GLM-5, GLM-4.7, GLM-4.7 FlashX |
glm-5, glm-4.7, glm-4.7-flashx |
| Meta (2) |
Llama 4 Maverick, Llama 4 Scout |
llama-4-maverick, llama-4-scout |
| DeepSeek (2) |
DeepSeek Reasoner, DeepSeek Chat |
deepseek-reasoner, deepseek-chat |
| NVIDIA (2) |
Nemotron 3 Nano 30B, Nemotron Ultra 253B |
nvidia/nemotron-3-nano-30b-a3b, nvidia/llama-3.1-nemotron-ultra-253b-v1 |
| AI21 (2) |
Jamba Large 1.7, Jamba Mini 1.7 |
jamba-large-1.7, jamba-mini-1.7 |
| MiniMax (2) |
MiniMax M2.5, MiniMax M2.5 Lightning |
minimax-m2.5, minimax-m2.5-lightning |
| Kuaishou (1) |
KAT-Coder Pro |
kat-coder-pro |
| Xiaomi (1) |
MiMo V2 Flash |
mimo-v2-flash |
レガシーおよび非推奨モデル(30)
エージェントが古いモデルIDを検出し、現在の代替品を提案できるように追跡されています:
- OpenAI:
gpt-5.3-codex(非推奨), gpt-5.2-codex(非推奨), gpt-5.1-codex-mini(非推奨), o3-pro(非推奨), o3-deep-research(非推奨), o3-mini(レガシー), gpt-4.1(非推奨), gpt-4o(非推奨), gpt-4o-mini(非推奨)
- Anthropic:
claude-opus-4-5(レガシー), claude-opus-4-1(レガシー), claude-opus-4-0(レガシー), claude-sonnet-4-0(レガシー), claude-3-7-sonnet-20250219(非推奨)
- Google:
gemini-3-pro-preview(非推奨), gemini-3-pro-image-preview(非推奨), gemini-2.5-flash-lite(非推奨), gemini-2.0-flash-lite(非推奨), gemini-2.0-flash(非推奨)
- xAI:
grok-4.1(非推奨), grok-3(レガシー), grok-3-mini(レガシー)
- Mistral:
mistral-small-2503(レガシー), codestral-2508(レガシー)
- MiniMax:
minimax-m2.1(レガシー), minimax-01(非推奨)
- Meta:
llama-3.3-70b(レガシー)
- DeepSeek:
deepseek-r1(レガシー), deepseek-v3(非推奨)
- Zhipu:
glm-4.6v(非推奨)
📦 インストール
サーバーをホストされたエンドポイントではなく、ローカルで実行する場合は、以下のオプションがあります:
オプション1: ソースからビルド(ローカル使用に推奨)
Go 1.23以上が必要です。
git clone https://github.com/aezizhu/universal-model-registry.git
cd universal-model-registry/go-server
go build -o model-id-cheatsheet ./cmd/server
次に、Claude Codeにローカルのstdioサーバーとして追加します(レイテンシーゼロ、ネットワーク不要):
claude mcp add --scope user model-id-cheatsheet -- /path/to/model-id-cheatsheet
または、他のクライアント用にSSEモードで実行します:
MCP_TRANSPORT=sse PORT=8000 ./model-id-cheatsheet
オプション2: Docker
git clone https://github.com/aezizhu/universal-model-registry.git
cd universal-model-registry
docker build -t model-id-cheatsheet .
docker run -p 8000:8000 model-id-cheatsheet
SSEエンドポイントはhttp://localhost:8000/sseになります。
オプション3: Railwayにデプロイ

または手動で:
railway login
railway init
railway up
📚 ドキュメント
最新情報の維持
モデルデータは太平洋時間の毎日午後7時に自動的にチェックされ、更新されます -- 人間の介入は必要ありません。
動作原理:
- Railway cronが毎日アップデーターを実行し、6つのプロバイダーの公開ドキュメントページをスクレイピングします(APIキーは不要です)
- ドキュメントから削除されたモデル --> PRを介して自動的に非推奨になります(コード内のステータスが
"deprecated"に変更されます)
- 新しいモデルが検出された --> レビュー用のGitHubイシューが作成されます
- CIが自動生成されたPRで実行されます --> テストが合格した場合 --> 自動的にmainブランチにマージされます
- Railwayがmainブランチから自動デプロイします
プロバイダーのAPIキーは必要ありません。 アップデーターは公開されているドキュメントページを読み取ってモデルの変更を検出します。PRとイシューを作成するためにGITHUB_TOKENとGITHUB_REPOのみが必要です。
自動更新パイプラインの詳細
Railway Cron(主要) -- ホストされたインスタンスは、Railway cronサービスを使用して毎日アップデーターを実行します。設定はconfigs/railway-updater.tomlを参照してください。
必要な環境変数(Railwayダッシュボードで設定):
GITHUB_TOKEN -- リポジトリスコープを持つGitHubパーソナルアクセストークン
GITHUB_REPO -- "owner/repo"形式のリポジトリ(例: "aezizhu/universal-model-registry")
チェックされるプロバイダー(公開ドキュメントを介して):
- OpenAI(GitHub SDKソースを介して)、Anthropic、Google、Mistral、xAI、DeepSeek
CI/CDワークフロー:
.github/workflows/ci.yml -- すべてのPRでテストを実行します
.github/workflows/auto-merge.yml -- CIが合格した後、ボットのPR(auto-updateラベル付き)を自動的にマージします
GitHub Actions(代替) -- 自前でホストするユーザー向けに、.github/workflows/auto-update.ymlにGitHub Actionsワークフローも含まれています。APIキーは不要で、GITHUB_TOKEN(GitHub Actionsによって自動的に提供されます)のみが必要です。
セキュリティ
- レート制限: IPアドレスごとに1分あたり60リクエスト
- 接続制限: IPアドレスごとに最大5つのSSE接続、合計100接続
- リクエストボディ制限: 最大64KB
- 入力サニタイズ: すべての文字列入力は安全な長さに切り捨てられます
- HTTP強化: ReadTimeout 15秒、ReadHeaderTimeout 5秒、IdleTimeout 120秒、最大ヘッダーサイズ64KB
- 非ルートDocker: コンテナは権限のないユーザーとして実行されます
- グレースフルシャットダウン: SIGINT/SIGTERMできれいに接続を解放します
技術スタック
- 言語: Go 1.23
- MCP SDK:
github.com/modelcontextprotocol/go-sdk v1.3.0(公式)
- トランスポート: stdio、SSE、Streamable HTTP
- バイナリサイズ: ~10MB
- テスト: 156個の単体テスト
- セキュリティ: IPごとのレート制限、接続制限、入力サニタイズ
- デプロイ: Docker(alpine)、Railway
コントリビューション
コントリビューションは大歓迎です!新しいモデルの追加、データの修正、サーバーの改善など、何でも歓迎です:
- リポジトリをフォークし、ローカルにクローンします
go-server/internal/models/data.goでモデルデータを編集します
go-server/internal/models/data_test.goでテストカウントを更新します
- テストを実行します:
cd go-server && go test ./... -v
- PRを提出します -- すぐにレビューします
古いモデルや不正な価格を見つけた場合は、イシューを開くだけでも大きな助けになります。
📄 ライセンス
MIT