Gemini Media Analysis

Google Gemini AIに基づくMCPサーバーで、画像、音声、ビデオ認識機能を提供し、複数の伝送方式とクライアント統合をサポートします。

画像とビデオ処理音声処理 #ビデオ認識 #AI分析 #マルチモーダル #Gemini .TypeScript

スコア : 2.5ポイント

ダウンロード数 : 8.9K

更新時間 : 2025-04-28

サイトを開く

MCPビデオ認識サーバーとは？

これはModel Context Protocol (MCP)に基づくスマートサーバーで、Google Gemini AIの強力な機能を利用して、画像、音声、ビデオコンテンツを分析します。これにより、マルチメディアファイル内のコンテンツを自動的に認識し、説明することができます。

MCPビデオ認識サーバーの使い方は？

簡単なAPI呼び出しまたはFLUJOなどの開発環境に統合することで、このサービスを利用できます。マルチメディアファイルのパスとオプションの分析ヒントを提供するだけで、サーバーは詳細なコンテンツ説明を返します。

適用シーン

コンテンツ審査、マルチメディアインデックス、支援機能（視覚障害者向けの画像/ビデオの説明）、メディアコンテンツ分析などのシーンに適用されます。

主要機能

画像認識

Google Gemini AIを使用して画像コンテンツを分析し、詳細な文字説明を提供します。

音声認識

音声ファイルの内容を文字起こしし、分析します。カスタムヒントによる分析をサポートします。

ビデオ認識

ビデオコンテンツを分析し、シーンの変化と主要なイベントを説明します。

利点

Google Gemini AIに基づいており、高品質な認識結果を提供します。

複数のメディアタイプ（画像/音声/ビデオ）をサポートします。

既存の開発環境（FLUJOなど）に容易に統合できます。

カスタム分析ヒントをサポートし、出力を柔軟に制御できます。

制限

Google APIキーが必要です。

外部APIサービスに依存しているため、使用制限がある可能性があります。

大きなファイルの処理には時間がかかる場合があります。

使い方

サーバーのインストール

手動でインストールするか、FLUJO統合環境を使用してインストールできます。

APIキーの設定

GOOGLE_API_KEY環境変数を設定します。

サーバーの起動

npmコマンドを使用してサーバーを起動します。

分析リクエストの送信

MCPプロトコルを通じて、ファイルパスと分析ヒントを含むリクエストを送信します。

使用例

画像コンテンツの説明

風景写真を分析し、詳細な説明を生成します。

会議録音の文字起こし

会議録音を文字に変換し、要点を抽出します。

ビデオコンテンツの分析

教学ビデオを分析し、主要な内容を抽出します。

よくある質問

Google Gemini APIキーをどのように取得できますか？

どのようなファイル形式をサポートしていますか？

大きなファイルの処理に制限はありますか？

私のアプリにどのように統合できますか？

🚀 MCP ビデオ認識サーバ

このサーバは、Model Context Protocol (MCP) に基づいて構築されており、Google の Gemini AI を使用して、画像、音声、およびビデオの認識ツールを提供します。

🚀 クイックスタート

このサーバは、Google Gemini AI を活用して画像、音声、ビデオの認識を行います。以下に、サーバの機能、インストール方法、使用方法を説明します。

✨ 主な機能

画像認識：Google Gemini AI を使用して画像を分析し、内容を記述します。
音声認識：Google Gemini AI を使用して音声を分析し、文字起こしを行います。
ビデオ認識：Google Gemini AI を使用してビデオを分析し、内容を記述します。

📦 インストール

手動インストール

リポジトリをクローンします：

git clone https://github.com/yourusername/mcp-video-recognition.git
cd mcp-video-recognition

依存関係をインストールします：
```
npm install
```
プロジェクトをビルドします：
```
npm run build
```

FLUJO でのインストール

「サーバーを追加」をクリックします。
Github URL をコピーして FLUJO に貼り付けます。
「解析」、「クローン」、「インストール」、「ビルド」、「保存」をクリックします。

設定ファイルによるインストール

Cline または他の MCP クライアントと設定ファイルを介して統合するには：

あなたの Cline 設定を開きます：
- VS Code では、File -> Preferences -> Settings に移動します。
- 「Cline MCP 設定」を検索します。
- 「settings.json で編集」をクリックします。

サーバー設定を mcpServers オブジェクトに追加します：

{
  "mcpServers": {
    "video-recognition": {
      "command": "node",
      "args": [
        "/path/to/mcp-video-recognition/dist/index.js"
      ],
      "disabled": false,
      "autoApprove": []
    }
  }
}

/path/to/mcp-video-recognition/dist/index.js を、プロジェクトディレクトリ内の index.js ファイルの実際のパスに置き換えます。Windows では正斜線 (/) またはダブルバックスラッシュ (\\) を使用します。
設定ファイルを保存します。Cline は自動的にサーバーに接続するはずです。

🔧 設定

以下の環境変数を使用してサーバーを設定します：

GOOGLE_API_KEY：Google Gemini API キー
TRANSPORT_TYPE：トランスポートタイプ（例：http、grpc）
PORT：サーバーのポート

💻 使用例

基本的な使用法

サーバーの起動

npm start

ツールの使用方法

画像認識

{
  "tool": "image_recognition",
  "params": {
    "input_path": "path/to/image.jpg"
  }
}

音声認識

{
  "tool": "audio_recognition",
  // 元のREADMEにここまでで終わっていたので、そのままにしています
}

Gmail MCP Server

Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。

TypeScript

24.3K

4.5ポイント

Edgeone Pages MCP Server

EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。

Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。

百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。

GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。

UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。

36.4K

5ポイント

Magic MCP

Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。

JavaScript

23.5K

5ポイント

Sequential Thinking MCP Server

MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。

Python

34.8K

4.5ポイント

智啓未来、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

Gemini Media Analysis

概要

インストール

コンテンツ詳細

代替品

MCPビデオ認識サーバーとは？

MCPビデオ認識サーバーの使い方は？

適用シーン

主要機能

使い方

使用例

よくある質問

関連リソース

インストール

🚀 MCP ビデオ認識サーバ

🚀 クイックスタート

✨ 主な機能

📦 インストール

手動インストール

FLUJO でのインストール

設定ファイルによるインストール

🔧 設定

💻 使用例

基本的な使用法

サーバーの起動

ツールの使用方法

画像認識

音声認識

代替品