Kokoro Tts MCP
什麼是Kokoro TTS MCP服務?
Kokoro TTS MCP服務是一個文本轉語音(TTS)解決方案,它接收文本輸入並生成對應的語音MP3文件。服務基於Model Context Protocol(MCP)構建,支持多種語音風格和語速調整,並能將生成的音頻文件自動上傳至AWS S3雲存儲。如何使用Kokoro TTS服務?
您可以通過簡單的命令行客戶端或直接調用MCP協議來使用本服務。服務支持即時文本轉換或從文件讀取內容,生成的音頻文件可保存在本地或雲端。適用場景
本服務適用於需要語音合成的各種場景,如:有聲讀物生成、語音助手回覆、教育內容製作、無障礙訪問等。特別適合需要批量處理文本或自動化語音生成的工作流程。主要功能
多語音支持提供多種預設語音風格(如af_heart, en_female等),滿足不同場景需求
語速調節可調整語音播放速度(0.5-2.0倍速),獲得最佳聽覺體驗
S3雲存儲集成支持自動將生成的MP3文件上傳至AWS S3存儲,便於分享和管理
智能文件管理自動清理舊文件功能,可設置保留天數或上傳後立即刪除本地副本
優勢與侷限性
優勢
簡單易用的命令行接口,便於集成到自動化流程
支持多種語言和語音風格選擇
靈活的雲存儲選項,減輕本地存儲壓力
開源模型支持,無需支付額外授權費用
侷限性
需要安裝ffmpeg等依賴工具
首次使用需下載較大的語音模型文件
高級語音定製功能有限
如何使用
環境準備
安裝必要的依賴項,包括Python環境和ffmpeg工具
下載語音模型
從GitHub獲取Kokoro Onnx權重文件並放入項目目錄
配置服務
創建.env文件或設置環境變量,配置AWS憑證和語音參數
啟動服務
使用uvicorn運行MCP服務器
使用客戶端
通過命令行客戶端發送文本進行語音合成
使用案例
生成歡迎語音為網站創建多語言歡迎語音
批量處理文檔將長篇文檔轉換為有聲讀物
自動化語音提醒集成到通知系統中生成語音提醒
常見問題
如何更改默認語音?
生成的音頻文件保存在哪裡?
服務支持哪些語言?
如何禁用S3上傳功能?
相關資源
Kokoro Onnx項目
語音模型源代碼和權重文件
HuggingFace演示空間
在線體驗Kokoro TTS效果
FFmpeg安裝指南
獲取和安裝FFmpeg工具
精選MCP服務推薦

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
702
4.5分

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
1.7K
5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
3.8K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
258
4.5分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
119
4.5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
249
4.8分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
5.2K
4.7分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
1.7K
5分