🚀 抖音と小红书コンテンツ抽出MCPサーバー
このサーバーはModel Context Protocol (MCP) ベースで、抖音と小红书の共有リンクからビデオ、画像、テキストコンテンツを抽出することができます。

📋 プロジェクト声明
公式ドキュメントのURL: https://github.com/yzfly/douyin-mcp-server
このプロジェクトの README.md ファイルを参照して、プロジェクトの機能特性、使用方法、API設定の詳細情報を確認してください。
重要な注意事項: サードパーティのプラットフォームが自身のMCP Server機能のサポート度に制限があるために正常に使用できない場合は、該当するプラットフォーム側に連絡してください。このプロジェクトはいかなる形式の技術サポートや保証も提供せず、ユーザーはこのプロジェクトの使用によって生じるいかなる損失や損害も自己責任で負う必要があります。
法律声明:
- このプロジェクトはApache 2.0ライセンスで公開されています。
- このプロジェクトは学習と研究目的のみに使用され、いかなる違法または規制違反の目的にも使用されてはなりません。
- このプロジェクトの使用は関連する法律と規制を遵守しなければなりません。
- このプロジェクトの作者と貢献者は、プロジェクトのいかなる部分についても法律責任を負いません。
✨ 主な機能
抖音の機能
- 🎵 ノーウォーターマークのビデオ取得 - 抖音の共有リンクから高品質なノーウォーターマークのビデオを取得します。
- 🎧 音声自動抽出 - ビデオから音声コンテンツを自動的に抽出します。
- 📝 AIテキスト認識 - 高度な音声認識技術を使用してテキストコンテンツを抽出します。
小红书の機能
- 📱 ビデオ/画像と文章の抽出 - 小红书のビデオノートと画像と文章のノートをサポートします。
- 📝 コピー抽出 - ノートのコピーコンテンツを自動的に抽出します。
- 🖼️ 画像取得 - ノート内のすべての画像リンクを抽出し(ウォーターマークパラメータを自動的に削除)ます。
- 🎤 ビデオ音声認識 - ビデオノートから音声テキストを抽出します(APIキーが必要)。
- 🎬 ノーウォーターマークのビデオ - ビデオURLからウォーターマークパラメータを自動的に削除し、高品質なノーウォーターマークのビデオを取得します。
- 🤖 AIウォーターマーク除去 - AI技術を使用してビデオ内のウォーターマークをスマートに検出して除去します(OpenCVが必要)。
- 🔍 スマート解析 - 複数のリンク形式をサポートし、ノートのタイプとコンテンツを自動的に識別します。
共通機能
- 🧹 自動クリーンアップ - 処理過程での一時ファイルをスマートにクリーンアップします。
- 🔧 柔軟な設定 - カスタムAPI設定をサポートし、デフォルトで 阿里云百煉API を使用します。
🚀 クイックスタート
ステップ1:APIキーの取得
阿里云百煉API にアクセスして、あなたのAPIキーを取得してください:

ステップ2:APIキーの設定
config.json 設定ファイルを作成します:
{
"api_key": "sk-your-api-key-here",
"model": "paraformer-v2",
"language_hints": ["zh", "en"],
"temp_dir": "temp"
}
ステップ3:Claude Desktopの設定
Claude Desktop、Cherry StudioなどのMCP Serverをサポートするアプリの設定ファイルに以下の設定を追加します:
{
"mcpServers": {
"douyin-mcp": {
"command": "python3.11",
"args": ["-m", "douyin_mcp_server.server"]
}
}
}
ステップ4:使用開始
設定が完了したら、サポートされているアプリでMCPツールを正常に呼び出すことができます。
🔧 技術詳細
API設定の説明
現在のバージョン(>= 1.2.0)
最新バージョンはデフォルトで阿里云百煉APIを使用し、以下の利点があります:
- ✅ 認識精度が高い
- ✅ 処理速度が速い
- ✅ ローカルリソースの消費が少ない
設定手順:
- 阿里云百煉 にアクセスして、APIサービスを開通します。
- APIキーを取得し、
config.json ファイルの api_key フィールドに設定します。
旧バージョンの互換性(<= 1.1.0)
旧バージョンを使用する場合は、以下の設定を使用してください:
{
"mcpServers": {
"douyin-mcp": {
"command": "uvx",
"args": ["douyin-mcp-server@1.1.0"],
"env": {
"DOUYIN_API_KEY": "your-api-key-here"
}
}
}
}
注意: 旧バージョンは硅基流動APIを使用し、硅基流動 でアカウントを登録してAPIキーを取得する必要があります。
📖 1.1.0版本文档
ツールの説明
抖音ツール
get_douyin_download_link
抖音ビデオのノーウォーターマークのダウンロードリンクを取得します。
パラメータ:
share_link (string): 抖音の共有リンクまたはリンクを含むテキスト
戻り値:
特徴: APIキーなしで使用可能
extract_douyin_text
完全なテキスト抽出ツールで、ビデオからテキストへの変換をワンストップで行います。
処理フロー:
- 抖音の共有リンクを解析します。
- ビデオURLを直接使用して音声認識を行います。
- 抽出されたテキストコンテンツを返します。
パラメータ:
share_link (string): 抖音の共有リンクまたはリンクを含むテキスト
model (string, オプション): 音声認識モデル、デフォルトで paraformer-v2 を使用します。
設定要件:
config.json: 阿里云百煉APIキーを含む設定ファイル(必須)
parse_douyin_video_info
軽量級のビデオ情報解析ツールです。
パラメータ:
share_link (string): 抖音の共有リンク
特徴: ビデオの基本情報のみを解析し、ビデオファイルをダウンロードしません。
リソースアクセス
douyin://video/{video_id}: ビデオIDを通じて詳細情報を取得します。
小红书ツール
get_xiaohongshu_content
小红书のノートの完全なコンテンツ(ビデオ/画像と文章)を取得します。
パラメータ:
share_link (string): 小红书の共有リンクまたはリンクを含むテキスト
戻り値:
- JSON形式で、ビデオリンク、コピー、画像、作者などの情報を含みます。
特徴: APIキーなしで使用可能で、ビデオと画像と文章の両方のタイプをサポートします。
extract_xiaohongshu_text
小红书のノートのコピーコンテンツを抽出します。
パラメータ:
share_link (string): 小红书の共有リンクまたはリンクを含むテキスト
戻り値:
- ノートのコピーコンテンツ(純粋なテキスト、タイトル、説明、タグを含む)
特徴: APIキーなしで使用可能
extract_xiaohongshu_video_text
小红书のビデオノートから音声テキストコンテンツを抽出します。
パラメータ:
share_link (string): 小红书の共有リンクまたはリンクを含むテキスト
model (string, オプション): 音声認識モデル、デフォルトで paraformer-v2 を使用します。
戻り値:
- 抽出されたテキストコンテンツ(コピーと音声コンテンツを含む)
設定要件:
config.json: 阿里云百煉APIキーを含む設定ファイル(必須)
get_xiaohongshu_images
小红书のノート内のすべての画像リンクを取得します。
パラメータ:
share_link (string): 小红书の共有リンクまたはリンクを含むテキスト
戻り値:
特徴: APIキーなしで使用可能で、画像リンクは自動的にウォーターマークパラメータが削除されています。
remove_xiaohongshu_video_watermark
AI技術を使用して小红书のビデオウォーターマークを除去します。
パラメータ:
share_link (string): 小红书の共有リンクまたはリンクを含むテキスト
output_path (string, オプション): 出力ファイルのパス(オプション、デフォルトでtempディレクトリに保存)
戻り値:
- JSON形式の処理結果で、ノーウォーターマークのビデオパス、処理方法、信頼度などの情報を含みます。
特徴:
- 完全なAI機能を使用するにはOpenCV (opencv-python) をインストールする必要があります。
- OpenCVが利用できない場合は、基本的な処理方法が使用されます。
- ウォーターマークの位置をスマートに検出し、自動的に修復することができます。
リソースアクセス
xiaohongshu://note/{note_id}: ノートIDを通じて詳細情報を取得します。
📦 システム要件
実行環境
依存ライブラリ
requests - HTTPリクエスト処理
ffmpeg-python - 音声とビデオの処理
tqdm - 進捗バーの表示
mcp - Model Context Protocolのサポート
dashscope - 阿里云百煉APIクライアント
beautifulsoup4 - HTML解析(小红书コンテンツ抽出用)
⚠️ 注意事項
- 🔑 APIキーが必須:ビデオ音声認識機能には有効な阿里云百煉APIキーが必要です。
- 🆓 一部の機能は無料:ダウンロードリンクの取得、コピーの抽出などの機能はAPIキーが不要です。
- 📱 形式のサポート:ほとんどの抖音ビデオ形式と小红书のコンテンツ形式をサポートしています。
- 🚀 パフォーマンスの最適化:阿里云百煉APIを使用することで、より高速で正確な認識結果を得ることができます。
- 📝 小红书のサポート:ビデオノートと画像と文章のノートの両方のタイプをサポートしています。
📁 プロジェクト構造
プロジェクトファイルは以下のディレクトリにタイプ別に分類されています:
docs/ - ドキュメントディレクトリ:すべてのプロジェクトドキュメント(Markdownファイル)を保存します。
configs/ - 設定ディレクトリ:すべての設定ファイル(JSONファイル)を保存します。
scripts/ - スクリプトディレクトリ:すべての実行可能スクリプト(PythonとShellスクリプト)を保存します。
douyin_mcp_server/ - ソースコードディレクトリ:プロジェクトの主要なソースコードで、階層化アーキテクチャを採用しています。
詳細な説明は docs/DIRECTORY_STRUCTURE.md を参照してください。
🔧 開発ガイド
ローカル開発環境の構築
git clone https://github.com/AshinH/dy-xhs-mcp-server.git
cd dy-xhs-mcp-server
pip install -e .
テストの実行
python -m douyin_mcp_server.server
bash scripts/start_server.sh
Claude Desktopのローカル開発設定
プロジェクトのルートディレクトリに config.json 設定ファイルが存在することを確認し、Claude Desktopの設定ファイルに以下を追加します:
{
"mcpServers": {
"douyin-mcp": {
"command": "python3.11",
"args": [
"-m",
"douyin_mcp_server.server"
],
"cwd": "/path/to/your/douyin-mcp-server"
}
}
}
⚠️ 免責声明
使用上のリスク
- ユーザーはこのプロジェクトの使用を完全に自主的に決定し、すべてのリスクを自己責任で負います。
- 作者はユーザーがこのプロジェクトを使用することによって生じるいかなる損失、責任またはリスクについても一切の責任を負いません。
コードの品質
- このプロジェクトは現有的な知識と技術に基づいて開発されており、作者はコードの正確性と安全性を確保するために努力しています。
- しかし、コードに完全にエラーや欠陥がないことを保証することはできず、ユーザーは自己判断で評価とテストを行う必要があります。
サードパーティの依存関係
- このプロジェクトが依存するサードパーティのライブラリ、プラグインまたはサービスはそれぞれのオープンソースまたは商用ライセンスに従います。
- ユーザーはそれぞれの協定を自ら確認し、遵守する必要があります。
- 作者はサードパーティのコンポーネントの安定性、安全性およびコンプライアンスについて一切の責任を負いません。
法律コンプライアンス
- ユーザーは関連する法律と規制を自ら研究し、使用行為が合法的でコンプライアントであることを確認しなければなりません。
- いかなる法律違反によって生じる法律責任とリスクはすべてユーザーが自己責任で負うことになります。
- このツールを使用して知的財産権を侵害する行為は禁止されています。
- 開発者はいかなる違法コンテンツの取得または配布にも関与せず、サポートせず、承認しません。
データ処理
- このプロジェクトはユーザーのデータ収集、保存、転送などの処理活動のコンプライアンスについて一切の責任を負いません。
- ユーザーは関連する法律と規制を遵守し、データ処理行為が合法的で正当なものであることを確保する必要があります。
責任の制限
- ユーザーはプロジェクトの作者、貢献者または関連する当事者を使用行為と関連付けてはなりません。
- 作者に対して、プロジェクトの使用によって生じるいかなる損失や損害について責任を負うよう要求してはなりません。
- このプロジェクトに基づく二次開発、修正またはコンパイルされたプログラムは元の作者とは無関係です。
知的財産権
- このプロジェクトはユーザーにいかなる特許許諾も与えません。
- このプロジェクトの使用によって特許紛争または侵害が発生した場合、ユーザーはすべてのリスクと責任を自己責任で負うことになります。
- 書面による許可なしに、商業宣伝、推奨または再許諾に使用してはなりません。
サービスの終了
- 作者は、声明に違反するユーザーに対していつでもサービスを終了する権利を留保します。
- 違反したユーザーに対して、取得したコードおよび派生作品を破棄するよう要求することがあります。
- 作者は事前に通知することなくこの声明を更新する権利を留保します。
⚠️ 重要な注意:このプロジェクトを使用する前に、上記の免責声明をよく読み、完全に理解してください。疑問がある場合やいずれかの条項に同意できない場合は、このプロジェクトを使用しないでください。引き続き使用することは、上記の声明を完全に受け入れ、すべてのリスクと結果を自発的に負うことを意味します。
📄 ライセンス
Apache License 2.0
👨💻 作者
🤝 貢献
IssueとPull Requestの提出を歓迎します!あなたの参加と貢献を楽しみにしています。
📝 更新履歴
v1.3.0 (最新) - 2026-01-28
- 🏗️ アーキテクチャの再構築:階層化アーキテクチャ設計を採用し、コードの保守性と拡張性を向上させました。
- 新しい
config/ 層を追加:統一的な設定管理
- 新しい
utils/ 層を追加:ツール関数のモジュール化(HTTPクライアント、ウォーターマーク処理)
- 新しい
services/ 層を追加:業務ロジックの分離(抖音サービス、小红书サービス)
- 新しい
tools/ 層を追加:MCPツール関数のカプセル化
- 新しい
resources/ 層を追加:MCPリソースの処理
server.py を再構築:メインエントリーファイルで、すべてのモジュールを明確に組み立てます。
- 📚 ドキュメントの充実:新しい
ARCHITECTURE.md アーキテクチャ説明ドキュメントを追加しました。
- 🔧 コードの最適化:コードの再利用性とテスト可能性を向上させました。
- 🔚 小红书機能の充実:
- ✨ 新しいAIウォーターマーク除去機能(
remove_xiaohongshu_video_watermark)を追加しました。
- 🎬 ノーウォーターマークのビデオ取得能力を強化しました。
- 🖼️ 画像ウォーターマーク除去アルゴリズムを最適化しました。
- 🔍 コンテンツ解析の精度を向上させました。
v1.2.0 - 2025-XX-XX
- 🚀 パフォーマンスの向上:より高速で正確なビデオコピー抽出
- 🔄 APIのアップグレード:阿里云百煉APIに切り替え、認識精度を大幅に向上させました。
- 🔧 設定の更新:環境変数を
DOUYIN_API_KEY から DASHSCOPE_API_KEY に更新しました。
v1.1.0 - 2025-XX-XX
- 🐛 問題の修正:ビデオ抽出時のファイル名が長すぎる問題を修正しました。
v1.0.0 - 2025-XX-XX
- 🎉 初回リリース:初期バージョン
- ✨ 核心機能:抖音ビデオのテキスト抽出をサポート
- 🔗 リンクの取得:ノーウォーターマークのビデオダウンロードリンクの取得をサポート
- 🔐 環境設定:環境変数からAPIキーを読み取る
- 🧹 自動クリーンアップ:一時ファイルを自動的にクリーンアップ
- ⚙️ 柔軟な設定:カスタムAPI設定をサポート