MCP Audio
什麼是MCP-Audio?
MCP-Audio 是一個符合 AIO-2030 標準的 MCP 插件,用於將音頻文件(如 .wav 或 .mp3)轉換為文本。它通過 SiliconFlow 的語音識別 API 實現語音到文字的轉換。如何使用MCP-Audio?
用戶可以通過上傳音頻文件或使用 Base64 編碼的音頻數據來調用該服務。同時,它支持 AIO 協議,可以與其他 AI 工具無縫集成。適用場景
適用於需要語音識別的場景,如語音助手、會議記錄、客服錄音分析等。主要功能
多格式支持支持 .wav 和 .mp3 音頻文件的語音識別。
AIO 協議兼容遵循 AIO-2030 標準,可與 AIO 生態系統中的其他工具無縫集成。
Base64 支持支持 Base64 編碼的音頻數據輸入,方便在不同平臺間傳輸。
安全配置管理通過 .env 文件管理 API 密鑰,確保密鑰安全。
優勢與侷限性
優勢
易於集成到 AIO 生態系統中
支持多種音頻格式和輸入方式
提供清晰的 JSON-RPC 輸出格式
支持 Docker 容器化部署
侷限性
僅支持特定的語音識別 API(SiliconFlow)
需要額外的環境配置(如 .env 文件)
不支持即時語音流處理
如何使用
克隆項目
從 GitHub 上克隆 MCP-Audio 項目並進入目錄。
安裝依賴
創建虛擬環境並安裝所需的 Python 包。
配置環境變量
複製 .env.example 文件並設置正確的 API 密鑰和 URL。
啟動服務器
運行 MCP 服務器以開始接收音頻請求。
測試服務
使用提供的測試腳本驗證服務是否正常工作。
使用案例
會議記錄生成將會議錄音上傳至 MCP-Audio 服務,自動生成會議紀要。
語音助手交互用戶通過語音輸入指令,MCP-Audio 將語音轉換為文字後供後續處理。
常見問題
MCP-Audio 是否支持即時語音識別?
如何獲取 API 密鑰?
MCP-Audio 是否支持中文語音識別?
相關資源
GitHub 項目倉庫
查看完整代碼和項目文檔。
AIO-2030 規範文檔
瞭解 AIO-2030 標準及其 API 調用規範。
SiliconFlow 文檔
瞭解 SiliconFlow 語音識別 API 的詳細說明。
精選MCP服務推薦

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
726
4.5分

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
1.7K
5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
3.9K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
299
4.5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
267
4.8分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
142
4.5分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
1.7K
5分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
5.3K
4.7分