Installation
Tools List
Content Details
Alternatives
Installation
{
"mcpServers": {
"DH-STDIO": {
"timeout": 60,
"type": "stdio",
"command": "uvx",
"args": [
"mcp-server-baidu-digitalhuman"
],
"env": {
"DH_API_AK": "${API Key}",
"DH_API_SK": "${Secret Key}"
}
}
}
}
🚀 百度数字人MCPサーバー
中国語 | English
概要
百度智能雲シーリングデジタルヒューマンオープンプラットフォームは、現在、MCPプロトコルに完全に適応しています。クリエイターの皆様のご参加をお待ちしています。シーリングデジタルヒューマンが提供するMCPサーバーには、MCPプロトコル標準に準拠した13のAPIインターフェースが含まれており、基本的なビデオ生成、高度なビデオ生成、声質クローニングなどがあります。MCP Python SDK開発に依存して、MCPプロトコルをサポートする任意のエージェントアシスタント(Claude、Cursor、Cline、千バンAppBuilderなど)をすばやくアクセスできます。
✨ 主な機能
当社では、さまざまなシナリオのニーズに応えるためのさまざまなツールを提供しています。これにより、大規模モデルでデジタルヒューマンサービスを迅速に統合し、簡単にデジタルヒューマンアプリケーションを構築できます。 もしデジタルヒューマンにさらなる期待があり、デジタルヒューマンサービスをより深く統合したい場合は、百度智能雲シーリングデジタルヒューマンオープンプラットフォームにアクセスしてお問い合わせください。MCPでもさらなる機能が徐々に公開される予定ですので、ご期待ください。
機能 | 機能説明 | 含まれるツール |
---|---|---|
2Dフューショットデジタルヒューマン | アップロードされた実人物の録画ビデオに基づいてデジタルポートレートを生成します。基本的なビデオ制作にのみ使用でき、デジタルヒューマンは汎用の唇駆動を使用します。 | • generateLite2dGeneralVideo • getLite2dGeneralStatus |
デジタルヒューマンビデオ合成 | 選択したデジタルポートレートと声質に基づいてデジタルヒューマンビデオを生成します。 | • generateDhVideo • getDhVideoStatus |
123デジタルヒューマンビデオ | 「123」と言う10秒から4分のライブ配信ビデオを提供します。ポートレート生成を必要とせずに、対応するデジタルヒューマンビデオを直接制作できます。 | • generateDh123Video • getDh123VideoStatus |
音声合成 | 提供されたテキストコンテンツと選択した声質に基づいて、ビデオを生成する必要なく、対応する音声を生成します。 | • generateText2Audioo • getText2AudioStatus |
ファイルアップロード | サービスタイプに基づいて必要なファイルをアップロードします。 | • uploadFiles |
音声クエリ | 利用可能なシステム音声をクエリします。 | • getVoices |
ポートレートクエリ | 利用可能なポートレートをクエリします。 | • getFigures |
音声クローニング | アップロードされた音声に基づいて声質を生成します。音声合成やビデオ制作に使用できます。 | • generateVoiceClone • getVoiceCloneStatus |
1. 2Dフューショットデジタルヒューマン
-
機能説明:アップロードされた実人物の録画ビデオに基づいてデジタルポートレートを生成します。基本的なビデオ制作にのみ使用でき、デジタルヒューマンは汎用の唇駆動を使用します。(透明背景のwebmビデオ)
-
サンプルプロンプト:
fileidがxxxのビデオファイルを使用して、「李四」という名前のデジタル人物を生成します。これは男の子の画像です。 IDがxxxのデジタル人物を確認してください。 どのポートレートを使用できますか。
-
ツール詳細: | ツール名 | ツール説明 | 入力パラメータ | 出力コンテンツ | |------|------|------|------| | generateLite2dGeneralVideo | アップロードされた実人物の録画ビデオに基づいてデジタルポートレートを生成します。基本的なビデオ制作にのみ使用でき、デジタルヒューマンは汎用の唇駆動を使用します。 | • name: 生成されるデジタルポートレートの名前。長さは50を超えない
• gender: デジタル人物の性別
• keepBackground: ビデオの背景を保持するかどうか。trueは保持、falseは削除、デフォルト値はfalse
• templateVideoId: デジタルポートレートを生成するために使用するビデオのファイルID | • figureId: アップロードされた実人物の録画ビデオに基づいて生成されたデジタルポートレートID | | getLite2dGeneralStatus | • デジタルポートレートの生成進捗をクエリします
• システムの2Dポートレートの利用可能状況をクエリするためにも使用できます。 | • figureId: ポートレートIDを指定してクエリします。空の場合は、アカウント下のすべてのポートレートをクエリします
• systemFigure: プラットフォームの公開ポートレートをクエリします。空: すべてをクエリ、true: プラットフォームの公開ポートレートを返す、false: カスタムポートレートを返す
• trainSuccess: トレーニングが完了し、利用可能なポートレートの状態をクエリするかどうか。(空: フィルタリングなし、true: 利用可能なポートレートのみを返す(プラットフォームの公開ポートレートとトレーニング成功状態のカスタムポートレート)、false: キューに入っている、トレーニング中、またはトレーニング失敗のカスタムポートレートのみを返す)
• pageNo: ページ番号。デフォルトは1
• pageSize: 各ページのサイズ。デフォルトは10 | • figureId: アップロードされた実人物の録画ビデオに基づいて生成されたデジタルポートレートID
• name: 生成されるデジタルポートレートの名前。長さは50を超えない
• gender: デジタルヒューマンの性別
• keepBackground: ビデオの背景を保持するかどうか。trueは保持、falseは削除、デフォルト値はfalse
• status: ステータス(LINE_UP(キューに入っている)、GENERATING、SUCCESS、FAILED)
• failedCode: 失敗エラーコード
• failedMessage: 制作失敗の理由 |
2. デジタルヒューマンビデオ合成
-
機能説明:選択したデジタルポートレートと声質に基づいてデジタルヒューマンビデオを生成します。
-
サンプルプロンプト:
デジタルポートレートIDがxxxの音声と声質人物IDがyyyを使用し、ビデオの内容は「皆さん、こんにちは。私はデジタル人物が放送する内容です」です。横画面の全身のカメラ位置を使用し、「https://digital-human-material.bj.bcebos.com/-%5BLjava.lang.String%3B%4046f6cc1e.png」のビデオ背景を使用し、自動アクションの追加をオンにし、字幕をオンにして、1080Pのデジタルヒューマンビデオを生成します。 taskidがxxxのデジタルヒューマンビデオを確認してください。
-
ツール詳細: | ツール名 | ツール説明 | 入力パラメータ | 出力コンテンツ | |------|------|------|------| | generateDhVideo | 選択したデジタルポートレートと声質に基づいてデジタルヒューマンビデオを生成します。 | • figureId: デジタルポートレートID
• driveType: デジタルヒューマンを駆動するデータタイプ。テキスト駆動または音声駆動をサポートします
• text: ドライバータイプがテキスト駆動の場合、必要なビデオコンテンツ。20000を超えないようにしてください
• person: ドライバータイプがテキスト駆動の場合、必要な声質ID
• inputAudioUrl: ドライバータイプが音声駆動の場合、必要な音声リンクURL
• width: 出力ビデオ解像度の幅
• hight: 出力ビデオ解像度の高さ
• cameraId: システムポートレートのカメラ設定。0: 横半身、1: 縦半身、2: 横全身、3: 縦全身
• enabled: 字幕を有効にするかどうか。trueは字幕を有効にする、デフォルト値はfalseで無効
• backgroundImageUrl: 背景画像のURL
• autoAnimoji: システムポートレートに自動的にアニメーションを追加する。trueは自動追加、デフォルト値はfalse | • taskId: 現在のビデオ合成タスクのID | | getDhVideoStatus | デジタルヒューマンビデオ合成の進捗をクエリします。 | • taskId: 現在のビデオ合成タスクのID | • taskId: 現在のビデオ合成のタスクID
• status: SUBMIT(合成のために送信)、GENERATING(合成中)、SUCCESS(合成成功)、FAILED(合成失敗)
• failedCode: エラーコード
• failedMessage: 制作失敗の理由
• videoUrl: タスクIDに対応する合成成功したビデオファイルのアドレス。7日間保存されます |
3. 123デジタルヒューマンビデオ合成
-
機能説明:「123」と言う10秒から4分のライブ配信ビデオを提供します。ポートレート生成を必要とせずに、対応するデジタルヒューマンビデオを直接制作できます。
-
サンプルプロンプト:
fileidがxxxのビデオファイルと声質IDがyyyの音声を使用し、ビデオの内容は「皆さん、こんにちは。私はデジタルヒューマンが放送する内容です」です。デジタルヒューマンビデオを生成します。 ビデオのアドレスはhttps://open-api-test.bj.bcebos.com/ae870923-2a3b-4d5e-b6a2-e44b4025647220250417_163529_trim.mp4、音声はyyy、ビデオの内容は「皆さん、こんにちは。私はデジタルヒューマンが放送する内容です」です。デジタルヒューマンビデオを生成します。 taskidがxxxの123デジタルヒューマンビデオを確認してください。
ウェブサイト上のガイドを確認できます。
-
ツール詳細: | ツール名 | ツール説明 | 入力パラメータ | 出力コンテンツ | |------|------|------|------| | generateDh123Video | 実人物の録画ビデオと選択した声質に基づいて、ポートレート生成を必要とせずに直接デジタルヒューマンビデオを生成できます。 | • templateVideoId: デジタルヒューマンビデオを生成するために使用するビデオに対応するファイルID
• driveType: デジタルヒューマンを駆動するデータタイプ。テキスト駆動または音声駆動をサポートします
• text: ドライバータイプがテキスト駆動の場合、必要なビデオコンテンツ。長さを入力する必要があり、20000を超えないようにしてください
• person: ドライバータイプがテキスト駆動の場合、必要な声質ID
• inputAudioUrl: ドライバータイプが音声駆動の場合、必要な音声リンクURL | • taskId: 現在のビデオ合成タスクのID | | getDh123VideoStatus | 123デジタルヒューマンのビデオ合成の進捗をクエリします。 | • taskId: 現在のビデオ合成タスクのID | • taskId: 現在のビデオ合成のタスクID
• status: ステータス: SUBMIT(合成のために送信)、RATING(合成中)、SUCCESS(合成成功)、FAILED
• failedCode: エラーコード
• failedMessage: 制作失敗の理由
• videoUrl: タスクIDに対応する合成成功したビデオファイルのアドレス。7日間保存されます |
4. 音声合成
-
機能説明:提供されたテキストコンテンツと選択した声質に基づいて、ビデオを生成する必要なく、対応する音声を生成します。
-
サンプルプロンプト:
声質人物のIDがxxxの音声で、内容は「皆さん、こんにちは。私はデジタルヒューマンが放送する内容です」で音声を生成します。 taskidがxxxの音声合成が完了したかどうかを確認してください。
-
ツール詳細: | ツール名 | ツール説明 | 入力パラメータ | 出力コンテンツ | |------|------|------|------| | generateText2Audio | 提供されたテキストコンテンツと選択した声質に基づいて、ビデオを生成する必要なく、対応する音声を生成します。 | • text: 必要なテキストコンテンツ。長さは2000を超えない
• person: 必要な声質ID | • taskId: 現在の音声合成のタスクID | | getText2AudioStatus | 音声合成の進捗をクエリします。 | • taskId: 現在のビデオ合成タスクのID | • status: SUBMIT、GENERATING、SUCCESS、FAILED
• failedCode: 失敗コード
• failedMessage: 制作失敗の理由
• audioUrl: タスクIDに対応する合成成功した音声ファイルのアドレス。7日間保存されます |
5. ファイルアップロード
-
機能説明:プラットフォームは、音声とビデオファイルのアップロードをサポートしています。これらのファイルは、後続の音声クローニング、デジタルヒューマン制作、123デジタルヒューマンビデオ制作などに使用できます。
-
サンプルプロンプト:
C:/Users/username/Desktop/test.mp3にあるtest.mp3ファイルを音声クローニングのためにアップロードします。
-
ツール詳細: | ツール名 | ツール説明 | 入力パラメータ | 出力コンテンツ | |------|------|------|------| | uploadFiles | サービスタイプに応じて必要なファイルをアップロードします。 | • file: アップロードするファイル
• providerType: このファイルを使用するサービスタイプ。現在は、「2Dフューショットデジタルヒューマン制作」、「音声クローニング」、「123デジタルヒューマンビデオ制作」の3つのサービスタイプに限定されています。
• sourceFileName: アップロードするファイルの名前。正しいファイル名と拡張子を入力する必要があります。例: test.mp3。 | • fileId: ファイルID
• fileName: アップロードしたファイルの名前 |
6. 音声クエリ
-
機能説明:利用可能なシステム音声をクエリします。
-
サンプルプロンプト:
以前にクローニングした音声はありますか。 20代の穏やかな女性の音声を使用したいです。
-
ツール詳細: | ツール名 | ツール説明 | 入力パラメータ | 出力コンテンツ | |------|------|------|------| | getVoices | 利用可能な音声IDをクエリします。 | • isSystem: "true"はシステムの声質IDをクエリ、"false"はクローニングした声質IDをクエリ、何も値を渡さない場合は、利用可能な声質IDをクエリします。 | • perId: 声質ID
• name: 声質名
• describe: 声質特性の説明
• gender: 性別
• systemProvided: システム音声かどうか |
7. ポートレートクエリ
-
機能説明:利用可能な2DデジタルポートレートIDをクエリします。
-
サンプルプロンプト:
以前に生成したポートレートはありますか。 利用可能なポートレートは何ですか。
-
ツール詳細: | ツール名 | ツール説明 | 入力パラメータ | 出力コンテンツ | |------|------|------|------| | getFigures | 利用可能なポートレートをクエリします。 | • isSystem: "true"はシステムのポートレートをクエリ、"false"は生成されたポートレートをクエリ、何も値を渡さない場合は、すべての利用可能なポートレートをクエリします。 | • figureId: 2DポートレートID
• name: 2Dポートレート名
• gender: 性別
• systemProvided: システムポートレートかどうか |
8. 音声クローニング
-
機能説明:アップロードされた音声に基づいて声質を生成します。音声合成やビデオ制作に使用できます。
-
サンプルプロンプト:
file IDがxxxの音声ファイルで音声をクローニングします。「李四」と名付け、30代の中年男性の声質で、「これは私がクローニングした音声です」というテキストで試聴します。 IDがxxxの音声がクローニングされたかどうかを確認してください。
-
ツール詳細: | ツール名 | ツール説明 | 入力パラメータ | 出力コンテンツ | |------|------|------|------| | generateVoiceClone | アップロードされた音声に基づいて音声を生成します。音声合成やビデオ制作に使用できます。 | • name: クローニングした音声の名前。長さは50を超えない
• gender: 声質の性別
• describe: クローニングした音声の説明。100を超えない
• uploadAudioId: 音声をクローニングするために使用する音声のファイルID
• example: 試聴に使用するテキスト。長さは100を超えない | • perId: クローニングした音声の声質ID | | getVoiceCloneStatus | タスクの声質IDに基づいて、音声クローニングタスクの現在の状態をクエリします。 | • isSuccess: クローニングに成功したタスクのみをクエリするかどうか(true: 成功したタスクのみをクエリ、false: すべてのクローニングタスクをクエリ)
• perId: 指定した声質IDのタスクをクエリします。 | • perId: クローニングした音声の声質ID
• name: 声質の名前
• describe: クローニングした音声の説明
• exampleText: 試聴に使用するテキスト
• examplAudioUrl: 試聴のテキストを使用して合成した音声ファイルのリンク
• status: 現在のタスクの状態、PREPARING、CLONING、SUCCESS、FAIL
• reason: クローニングが失敗した場合、失敗の理由がここに記載されます。
• gender: 音声をクローニングした声質の性別 |
🚀 クイックスタート
1. トライアルクレジットを申請する
- 百度智能雲シーリングデジタルヒューマンオープンプラットフォームにログインし、左下隅をクリックします。
- コンポーネント管理にアクセスして、取得したコンポーネントクォータを確認します。
2. APIキーとシークレットキーを取得する
- アプリケーション管理にアクセスして、使用する必要のあるコンポーネントを構成します。
- 作成が完了したら、APIキー(AppID)とキーおよびシークレットキー(AppKey)を取得できます。
3. MCP構成
前提条件
- Python 3.12以上
- シーリングオープンプラットフォームのAPIキーとシークレットキー
Pythonを使用して百度シーリングデジタルヒューマンMCPサーバーに参加できます。uvの使用をお勧めします。
ソースコードアクセス
シーリングデジタルヒューマンの機能をカスタマイズしたい場合は、ソースコードを使用してアクセスできます。
- UVをインストールします。 uvのインストールガイドを参照して、コマンドラインで'uvx'コマンドを実行できること、またはインストールした'uvx'ツールをパスから見つけることができることを確認します。
- コードをローカルコンピュータにチェックアウトします。
- MCPをサポートするエージェントアシスタントを使用してMCP構成を追加します。
{
"mcpServers": {
"DH-STDIO": {
"timeout": 60,
"type": "stdio",
"command": "uvx",
"args": [
"${path/to/dh-mcp-server}"
],
"env": {
"DH_API_AK": "${API Key}",
"DH_API_SK": "${Secret Key}"
}
}
}
}
- ${path/to/dh-mcp-server}を実際のローカルパスに置き換えます。
- ${API Key}と${Secret Key}を実際の'API Key'と'Secret Key'に置き換えます。
Pythonパッケージプラグイン
pypiに「mcp-server-baidu-digitalhuman」という百度シーリングMCPサーバーをリリースしています。任意のPythonパッケージ管理ツールを使用して取得できます。
- UVを使用してマウントします。
- pipでインストールします。
pip install mcp-server-baidu-digitalhuman
- MCPをサポートするエージェントアシスタントを使用してMCP構成を追加します。
{
"mcpServers": {
"DH-STDIO": {
"timeout": 60,
"type": "stdio",
"command": "uvx",
"args": [
"mcp-server-baidu-digitalhuman"
],
"env": {
"DH_API_AK": "${API Key}",
"DH_API_SK": "${Secret Key}"
}
}
}
}
4. 使用宣言
上記のツールを使用する前に、シーリングデジタルヒューマンカスタムコンポーネントクローニングプロトコルをお読みください。上記のツールを使用することで、この協定に同意したことになります。
開発
MCPインスペクターを使用してサーバーをローカルで実行し、テストおよびデバッグするには:
npx @modelcontextprotocol/inspector uvx ${path/to/dh-mcp-server}
これにより、開発モードでサーバーが起動し、MCPインスペクターを使用して利用可能なツールと機能をテストできます。
テスト
- 環境が構成されると、MCPエージェントは自動的に利用可能なすべてのツールのリストを取得します。
- ダイアログボックスにプロンプトを入力します:「利用可能なすべてのデジタルヒューマンの音声のリストをクエリする」
📄 ライセンス
このプロジェクトはMITライセンスの下でライセンスされています。詳細については、LICENSEファイルを参照してください。
討論とフィードバック
ご質問やご提案があれば、お気軽にお問い合わせください。 以下の方法でお問い合わせいただけます:
- カスタマーサービス電話:400-920-8999
- 協力相談:百度智能雲シーリングデジタルヒューマンオープンプラットフォーム相談
- 問題チケット:チケット作成
- 公式アシスタント:






Featured MCP Services







