DINO X MCP
DINO - X MCPは、DINO - XとGrounding DINO 1.6 APIを通じて大規模言語モデルに細粒度の物体検出と画像理解を可能にするプロジェクトです。正確な物体位置特定、数量カウント、属性分析、シーン理解を実現し、自然言語駆動の視覚タスクとワークフロー統合をサポートします。
2.5ポイント
7.4K

DINO - X MCPとは?

DINO - X MCPは多モーダルモデル制御プロトコルサーバーで、大規模言語モデルに正確な視覚理解能力を与えます。画像内の物体を検出し、人体の姿勢を識別し、シーンの内容を分析し、構造化データとして結果を返すことができます。

DINO - X MCPの使い方は?

簡単な自然言語指令を使って、特定の物体を検出したり、数量をカウントしたり、属性を分析したり、シーンの内容を識別したりすることができます。サーバーは物体の位置、カテゴリ、詳細情報を含む構造化データを返します。

適用シーン

正確な視覚理解が必要なシーン、例えば、スマート監視、コンテンツ審査、小売分析、工業品質検査、医療画像分析などに適しています。

主要機能

物体検出
画像内の様々な物体を検出し、バウンディングボックスの位置とカテゴリ情報を返します。
テキストガイド検出
自然言語の記述に基づいて特定の物体またはシーンを検出します。
姿勢推定
人体の17個のキーポイントを識別し、動作分析と姿勢識別に利用します。
属性分析
物体の色、サイズ、状態などの視覚属性を分析します。
利点
正確な物体位置特定能力は、一般的な多モーダルモデルを大きく上回ります。
自然言語対話をサポートし、専門的なアノテーション知識は必要ありません。
構造化された出力を提供し、後続の処理と分析が容易です。
他のMCPサーバーと統合し、複雑なワークフローを構築することができます。
制限
APIキーとネットワーク接続が必要です。
複雑なシーンでは誤検出や検出漏れが発生する可能性があります。
極小物体やぼやけた画像の検出精度に限界があります。

使い方

APIキーを取得する
DINO - Xプラットフォームにアクセスし、登録してAPIキーを取得します。
MCPクライアントを設定する
サポートされているAIアシスタントアプリにDINO - X MCPサーバーの設定を追加します。
検出リクエストを送信する
自然言語指令を使って画像分析をリクエストします。例えば、「画像内のすべての犬を検出する」

使用例

火災区域検出
森林画像内の火災区域を識別し、ラベル付けします。
倉庫の箱のカウント
倉庫画像を分析し、段ボール箱の数量をカウントします。
ヨガポーズ識別
人物が行っているヨガポーズを識別します。

よくある質問

使用するためにプログラミング知識は必要ですか?
どのような画像形式をサポートしていますか?
無料の利用枠はありますか?

関連リソース

DINO - Xプラットフォーム
APIキーと使用ドキュメントを取得する
GitHubリポジトリ
ソースコードと問題追跡
デモビデオ
機能のデモビデオ

インストール

以下のコマンドをクライアントにコピーして設定
{
  "mcpServers": {
    "dinox-mcp": {
      "command": "npx",
      "args": ["-y", "@deepdataspace/dinox-mcp"],
      "env": {
        "DINOX_API_KEY": "your-api-key-here",
        "IMAGE_STORAGE_DIRECTORY": "/path/to/your/image/directory"
      }
    }
  }
}

{
  "mcpServers": {
    "dinox-mcp": {
      "command": "node",
      "args": ["/path/to/DINO-X-MCP/build/index.js"],
      "env": {
        "DINOX_API_KEY": "your-api-key-here",
        "IMAGE_STORAGE_DIRECTORY": "/path/to/your/image/directory"
      }
    }
  }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

K
Klavis
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
TypeScript
7.6K
5ポイント
D
Devtools Debugger MCP
Node.jsデバッガーMCPサーバーは、Chrome DevToolsプロトコルに基づく完全なデバッグ機能を提供します。ブレークポイントの設定、ステップ実行、変数のチェック、式の評価などが含まれます。
TypeScript
5.4K
4ポイント
M
Mcpjungle
MCPJungleは自ホスト型のMCPゲートウェイで、複数のMCPサーバーを集中的に管理および代理し、AIエージェントに統一されたツールアクセスインターフェースを提供します。
Go
0
4.5ポイント
N
Nexus
NexusはAIツール集約ゲートウェイで、複数のMCPサーバーとLLMプロバイダーの接続をサポートし、統一されたエンドポイントを通じてツール検索、実行、およびモデルルーティング機能を提供し、セキュリティ認証とレート制限をサポートします。
Rust
0
4ポイント
Z
Zen MCP Server
Zen MCPは多モデルAI協調開発サーバーで、ClaudeやGemini CLIなどのAIコーディングアシスタントに強化されたワークフローツールとモデル間のコンテキスト管理を提供します。これは複数のAIモデルのシームレスな協調をサポートし、コードレビュー、デバッグ、リファクタリングなどの開発タスクを実現し、異なるワークフロー間で会話のコンテキストを維持することができます。
Python
13.1K
5ポイント
O
Opendia
OpenDiaはオープンソースのブラウザ拡張ツールで、AIモデルが直接ユーザーのブラウザを制御でき、既存のログイン状態、ブックマークなどのデータを利用して自動化操作を行います。複数のブラウザとAIモデルをサポートし、プライバシー保護に配慮しています。
JavaScript
10.7K
5ポイント
N
Notte Browser
認証済み
NotteはオープンソースのフルスタックネットワークAIエージェントフレームワークで、ブラウザセッション、自動化されたLLM駆動エージェント、ウェブページの監視と操作、資格情報管理などの機能を提供し、インターネットをエージェントに優しい環境に変え、自然言語でウェブサイトの構造を記述することでLLMの認知負荷を軽減することを目的としています。
14.3K
4.5ポイント
B
Bing Search MCP
Microsoft Bing検索APIを統合するためのMCPサーバーで、ウェブページ、ニュース、画像の検索機能をサポートし、AIアシスタントにウェブ検索機能を提供します。
Python
13.8K
4ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
42.4K
4.7ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
15.1K
4.8ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
13.3K
4.5ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
24.2K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
12.0K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
15.8K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
14.5K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
20.1K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIBase