mcp-audio - 符合AIO-2030標準MCP插件，支持多音頻格式API調用實現語音轉文字

探索

MCP Audio

mcp-audio是一個符合AIO-2030標準的MCP插件，提供語音轉文字功能，支持多種音頻格式和API調用方式。

語音處理開發者工具 #語音識別 #音頻處理 #AI插件 #JSON-RPC .Python

評分 : 2.5分

下載量 : 9.2K

更新時間 : 2025-07-24

打開站點

什麼是MCP-Audio？

MCP-Audio 是一個符合 AIO-2030 標準的 MCP 插件，用於將音頻文件（如 .wav 或 .mp3）轉換為文本。它通過 SiliconFlow 的語音識別 API 實現語音到文字的轉換。

如何使用MCP-Audio？

用戶可以通過上傳音頻文件或使用 Base64 編碼的音頻數據來調用該服務。同時，它支持 AIO 協議，可以與其他 AI 工具無縫集成。

適用場景

適用於需要語音識別的場景，如語音助手、會議記錄、客服錄音分析等。

主要功能

多格式支持

支持 .wav 和 .mp3 音頻文件的語音識別。

AIO 協議兼容

遵循 AIO-2030 標準，可與 AIO 生態系統中的其他工具無縫集成。

Base64 支持

支持 Base64 編碼的音頻數據輸入，方便在不同平臺間傳輸。

安全配置管理

通過 .env 文件管理 API 密鑰，確保密鑰安全。

優勢

易於集成到 AIO 生態系統中

支持多種音頻格式和輸入方式

提供清晰的 JSON-RPC 輸出格式

支持 Docker 容器化部署

侷限性

僅支持特定的語音識別 API（SiliconFlow）

需要額外的環境配置（如 .env 文件）

不支持即時語音流處理

如何使用

克隆項目

從 GitHub 上克隆 MCP-Audio 項目並進入目錄。

安裝依賴

創建虛擬環境並安裝所需的 Python 包。

配置環境變量

複製 .env.example 文件並設置正確的 API 密鑰和 URL。

啟動服務器

運行 MCP 服務器以開始接收音頻請求。

測試服務

使用提供的測試腳本驗證服務是否正常工作。

使用案例

會議記錄生成

將會議錄音上傳至 MCP-Audio 服務，自動生成會議紀要。

語音助手交互

用戶通過語音輸入指令，MCP-Audio 將語音轉換為文字後供後續處理。

常見問題

MCP-Audio 是否支持即時語音識別？

如何獲取 API 密鑰？

MCP-Audio 是否支持中文語音識別？

相關資源

GitHub 項目倉庫

查看完整代碼和項目文檔。

AIO-2030 規範文檔

瞭解 AIO-2030 標準及其 API 調用規範。

SiliconFlow 文檔

瞭解 SiliconFlow 語音識別 API 的詳細說明。

Markdownify MCP

Markdownify是一個多功能文件轉換服務，支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。

百度地圖MCP Server是國內首個兼容MCP協議的地圖服務，提供地理編碼、路線規劃等10個標準化API接口，支持Python和Typescript快速接入，賦能智能體實現地圖相關功能。

Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器，提供豐富的網頁抓取、搜索和內容提取功能。

TypeScript

153.7K

5分

Sequential Thinking MCP Server

一個基於MCP協議的結構化思維服務器，通過定義思考階段幫助分解複雜問題並生成總結

Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具，通過自然語言描述幫助開發者快速創建現代化UI組件，支持多種IDE集成。

JavaScript

23.4K

5分

Edgeone Pages MCP Server

EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務

一個基於Python的MCP服務器，通過Notion API提供高級待辦事項管理和內容組織功能，實現AI模型與Notion的無縫集成。

Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務，通過Model Context Protocol直接集成到提示中，解決LLM使用過時信息的問題。

智啟未來，您的人工智慧解決方案智庫

MCP Audio

概述

內容詳情

替代品

什麼是MCP-Audio？

如何使用MCP-Audio？

適用場景

主要功能

如何使用

使用案例

常見問題

相關資源

安裝

🚀 MCP-Audio插件

🚀 快速開始

本地環境搭建

1. 克隆倉庫並安裝依賴

2. 添加.env文件

3. 運行MCP服務器

4. 使用Docker

4.1 構建並運行容器

✨ 主要特性

📚 詳細文檔

API概述

POST /api/v1/mcp/voice_model

POST /api/v1/mcp/tools.call (AIO協議)

GET /api/v1/mcp/help

測試工具

Base64語音測試

健康檢查

MCP註冊（到AIO端點容器）

替代品