🚀 抖音和小紅書內容提取 MCP 服務器
這是一個基於 Model Context Protocol (MCP) 的服務器,支持從抖音和小紅書分享鏈接中提取視頻、圖片和文本內容,為用戶提供便捷的內容獲取方式。
🚀 快速開始
步驟 1:獲取 API 密鑰
前往 阿里雲百鍊 API 獲取您的 API 密鑰:

步驟 2:配置 API 密鑰
創建 config.json 配置文件:
{
"api_key": "sk-your-api-key-here",
"model": "paraformer-v2",
"language_hints": ["zh", "en"],
"temp_dir": "temp"
}
步驟 3:配置 Claude Desktop
在 Claude Desktop、Cherry Studio 等支持 MCP Server 的應用配置文件中添加以下配置:
{
"mcpServers": {
"douyin-mcp": {
"command": "python3.11",
"args": ["-m", "douyin_mcp_server.server"]
}
}
}
步驟 4:開始使用
配置完成後,您就可以在支持的應用中正常調用 MCP 工具了。
✨ 主要特性
抖音功能
- 🎵 無水印視頻獲取:可從抖音分享鏈接獲取高質量無水印視頻。
- 🎧 智能音頻提取:能自動從視頻中提取音頻內容。
- 📝 AI 文本識別:運用先進的語音識別技術提取文本內容。
小紅書功能
- 📱 視頻/圖文提取:支持小紅書視頻筆記和圖文筆記。
- 📝 文案提取:自動提取筆記的文案內容。
- 🖼️ 圖片獲取:提取筆記中的所有圖片鏈接,並自動去除水印參數。
- 🎤 視頻語音識別:從視頻筆記中提取語音文本(需要 API 密鑰)。
- 🎬 無水印視頻:自動去除視頻 URL 中的水印參數,獲取高質量無水印視頻。
- 🤖 AI 水印移除:使用 AI 技術智能檢測並移除視頻中的水印(需要 OpenCV)。
- 🔍 智能解析:支持多種鏈接格式,自動識別筆記類型和內容。
通用功能
- 🧹 自動清理:智能清理處理過程中的臨時文件。
- 🔧 靈活配置:支持自定義 API 配置,默認使用 阿里雲百鍊 API。
📦 安裝指南
運行環境
依賴庫
requests - HTTP 請求處理
ffmpeg-python - 音視頻處理
tqdm - 進度條顯示
mcp - Model Context Protocol 支持
dashscope - 阿里雲百鍊 API 客戶端
beautifulsoup4 - HTML 解析(用於小紅書內容提取)
💻 使用示例
基礎用法
from douyin_mcp_server import get_douyin_download_link
share_link = "your_douyin_share_link"
result = get_douyin_download_link(share_link)
print(result)
📚 詳細文檔
項目聲明
官方文檔地址:https://github.com/yzfly/douyin-mcp-server
請以本項目的 README.md 文件為準,瞭解項目的功能特性、使用方法、API 配置說明等詳細信息。
重要提醒:第三方平臺如因自身 MCP Server 功能支持度限制而無法正常使用,請聯繫相應平臺方。本項目不提供任何形式的技術支持或保證,用戶需自行承擔使用本項目可能產生的任何損失或損害。
法律聲明:
- 本項目基於 Apache 2.0 協議發佈。
- 本項目僅供學習和研究使用,不得用於任何違法或違規目的。
- 本項目的使用必須遵守相關法律法規。
- 本項目的作者和貢獻者不對項目的任何部分承擔法律責任。
API 配置說明
當前版本(>= 1.2.0)
最新版本默認使用阿里雲百鍊 API,具有以下優勢:
- ✅ 識別效果更好
- ✅ 處理速度更快
- ✅ 本地資源消耗更小
配置步驟:
- 前往 阿里雲百鍊 開通 API 服務。
- 獲取 API Key 並配置到
config.json 文件中的 api_key 字段。
舊版本兼容(<= 1.1.0)
如果您需要使用舊版本,請使用以下配置:
{
"mcpServers": {
"douyin-mcp": {
"command": "uvx",
"args": ["douyin-mcp-server@1.1.0"],
"env": {
"DOUYIN_API_KEY": "your-api-key-here"
}
}
}
}
注意:舊版本使用硅基流動 API,需要在 硅基流動 註冊賬號並獲取 API Key。
📖 1.1.0 版本文檔
工具說明
抖音工具
get_douyin_download_link
- 參數:
share_link (string),抖音分享鏈接或包含鏈接的文本。
- 返回:JSON 格式的下載鏈接和視頻信息。
- 特點:無需 API 密鑰即可使用。
extract_douyin_text
- 處理流程:解析抖音分享鏈接,直接使用視頻 URL 進行語音識別,返回提取的文本內容。
- 參數:
share_link (string),抖音分享鏈接或包含鏈接的文本;model (string, 可選),語音識別模型,默認使用 paraformer-v2。
- 配置要求:
config.json,包含阿里雲百鍊 API 密鑰的配置文件(必需)。
parse_douyin_video_info
- 參數:
share_link (string),抖音分享鏈接。
- 特點:僅解析視頻基本信息,不下載視頻文件。
- 資源訪問:
douyin://video/{video_id},通過視頻 ID 獲取詳細信息。
小紅書工具
get_xiaohongshu_content
- 參數:
share_link (string),小紅書分享鏈接或包含鏈接的文本。
- 返回:JSON 格式,包含視頻鏈接、文案、圖片、作者等信息。
- 特點:無需 API 密鑰即可使用,支持視頻和圖文兩種類型。
extract_xiaohongshu_text
- 參數:
share_link (string),小紅書分享鏈接或包含鏈接的文本。
- 返回:筆記的文案內容(純文本,包含標題、描述、標籤)。
- 特點:無需 API 密鑰即可使用。
extract_xiaohongshu_video_text
- 參數:
share_link (string),小紅書分享鏈接或包含鏈接的文本;model (string, 可選),語音識別模型,默認使用 paraformer-v2。
- 返回:提取的文本內容(包含文案和語音內容)。
- 配置要求:
config.json,包含阿里雲百鍊 API 密鑰的配置文件(必需)。
get_xiaohongshu_images
- 參數:
share_link (string),小紅書分享鏈接或包含鏈接的文本。
- 返回:JSON 格式的圖片鏈接列表。
- 特點:無需 API 密鑰即可使用,圖片鏈接已自動去除水印參數。
remove_xiaohongshu_video_watermark
- 參數:
share_link (string),小紅書分享鏈接或包含鏈接的文本;output_path (string, 可選),輸出文件路徑(可選,默認保存到 temp 目錄)。
- 返回:JSON 格式的處理結果,包含無水印視頻路徑、處理方法和置信度等信息。
- 特點:需要安裝 OpenCV (opencv-python) 才能使用完整 AI 功能;如果 OpenCV 不可用,會使用基礎處理方法;支持智能檢測水印位置並自動修復。
- 資源訪問:
xiaohongshu://note/{note_id},通過筆記 ID 獲取詳細信息。
項目結構
項目文件已按類型歸類到以下目錄:
docs/ - 文檔目錄:存放所有項目文檔(Markdown 文件)。
configs/ - 配置目錄:存放所有配置文件(JSON 文件)。
scripts/ - 腳本目錄:存放所有可執行腳本(Python 和 Shell 腳本)。
douyin_mcp_server/ - 源代碼目錄:項目的主要源代碼,採用分層架構。
詳細說明請查看 docs/DIRECTORY_STRUCTURE.md
開發指南
本地開發環境搭建
git clone https://github.com/AshinH/dy-xhs-mcp-server.git
cd dy-xhs-mcp-server
pip install -e .
運行測試
python -m douyin_mcp_server.server
bash scripts/start_server.sh
Claude Desktop 本地開發配置
確保項目根目錄存在 config.json 配置文件,然後在 Claude Desktop 配置文件中添加:
{
"mcpServers": {
"douyin-mcp": {
"command": "python3.11",
"args": [
"-m",
"douyin_mcp_server.server"
],
"cwd": "/path/to/your/douyin-mcp-server"
}
}
}
注意事項
- 🔑 API 密鑰必需:視頻語音識別功能需要有效的阿里雲百鍊 API 密鑰。
- 🆓 部分功能免費:獲取下載鏈接、提取文案等功能無需 API 密鑰。
- 📱 格式支持:支持大部分抖音視頻格式和小紅書內容格式。
- 🚀 性能優化:使用阿里雲百鍊 API 獲得更快更準確的識別效果。
- 📝 小紅書支持:支持視頻筆記和圖文筆記兩種類型。
免責聲明
使用風險
- 使用者對本項目的使用完全自主決定,並自行承擔所有風險。
- 作者對使用者因使用本項目而產生的任何損失、責任或風險概不負責。
代碼質量
- 本項目基於現有知識和技術開發,作者努力確保代碼的正確性和安全性。
- 但不保證代碼完全沒有錯誤或缺陷,使用者需自行評估和測試。
第三方依賴
- 本項目依賴的第三方庫、插件或服務遵循各自的開源或商業許可。
- 使用者需自行查閱並遵守相應協議。
- 作者不對第三方組件的穩定性、安全性及合規性承擔責任。
法律合規
- 使用者必須自行研究相關法律法規,確保使用行為合法合規。
- 任何違反法律法規導致的法律責任和風險,均由使用者自行承擔。
- 禁止使用本工具從事任何侵犯知識產權的行為。
- 開發者不參與、不支持、不認可任何非法內容的獲取或分發。
數據處理
- 本項目不對使用者的數據收集、存儲、傳輸等處理活動的合規性承擔責任。
- 使用者應自行遵守相關法律法規,確保數據處理行為合法正當。
責任限制
- 使用者不得將項目作者、貢獻者或相關方與使用行為聯繫起來。
- 不得要求作者對使用項目產生的任何損失或損害負責。
- 基於本項目的二次開發、修改或編譯程序與原作者無關。
知識產權
- 本項目不授予使用者任何專利許可。
- 若使用本項目導致專利糾紛或侵權,使用者自行承擔全部風險和責任。
- 未經書面授權,不得用於商業宣傳、推廣或再授權。
服務終止
- 作者保留隨時終止向違反聲明的使用者提供服務的權利。
- 可能要求違規使用者銷燬已獲取的代碼及衍生作品。
- 作者保留在不另行通知的情況下更新本聲明的權利。
⚠️ 重要提醒:在使用本項目前,請認真閱讀並完全理解上述免責聲明。如有疑問或不同意任何條款,請勿使用本項目。繼續使用即視為完全接受上述聲明並自願承擔所有風險和後果。
📄 許可證
Apache License 2.0
👨💻 作者
🤝 貢獻
歡迎提交 Issue 和 Pull Request!我們期待您的參與和貢獻。
📝 更新日誌
v1.3.0 (最新) - 2026-01-28
- 🏗️ 架構重構:採用分層架構設計,提升代碼可維護性和可擴展性。
- 新增
config/ 層:統一配置管理。
- 新增
utils/ 層:工具函數模塊化(HTTP 客戶端、水印處理)。
- 新增
services/ 層:業務邏輯分離(抖音服務、小紅書服務)。
- 新增
tools/ 層:MCP 工具函數封裝。
- 新增
resources/ 層:MCP 資源處理。
- 重構
server.py:主入口文件,清晰組裝所有模塊。
- 📚 文檔完善:新增
ARCHITECTURE.md 架構說明文檔。
- 🔧 代碼優化:提升代碼複用性和可測試性。
- 🔚 小紅書功能完善:
- ✨ 新增 AI 水印移除功能(
remove_xiaohongshu_video_watermark)。
- 🎬 增強無水印視頻獲取能力。
- 🖼️ 優化圖片水印去除算法。
- 🔍 改進內容解析準確性。
v1.2.0 - 2025-XX-XX
- 🚀 性能提升:更快、更準確的視頻文案提取。
- 🔄 API 升級:切換到阿里雲百鍊 API,顯著提升識別準確率。
- 🔧 配置更新:環境變量從
DOUYIN_API_KEY 更新為 DASHSCOPE_API_KEY。
v1.1.0 - 2025-XX-XX
- 🐛 問題修復:修復提取視頻時文件名過長導致的錯誤。
v1.0.0 - 2025-XX-XX
- 🎉 首次發佈:初始版本。
- ✨ 核心功能:支持抖音視頻文本提取。
- 🔗 鏈接獲取:支持獲取無水印視頻下載鏈接。
- 🔐 環境配置:從環境變量讀取 API 密鑰。
- 🧹 自動清理:自動清理臨時文件。
- ⚙️ 靈活配置:支持自定義 API 配置。