Fast Whisper MCP Server
什麼是Whisper Speech Recognition MCP Server?
這是一個基於Faster Whisper的高性能語音識別MCP服務器,提供快速且準確的音頻轉文字能力。如何使用Whisper Speech Recognition MCP Server?
啟動服務器後,通過配置工具如Claude Desktop集成,即可實現語音轉文字功能。適用場景
適用於會議記錄、教學錄音、語音助手開發等多種需要語音轉文字的場景。主要功能
集成Faster Whisper
利用Faster Whisper實現高效的語音轉文字功能。
批量處理加速
支持批量處理多個音頻文件,顯著提升轉錄速度。
自動CUDA加速
如果可用,自動啟用GPU加速以提高性能。
多模型大小支持
支持從小型(tiny)到大型(large-v3)等多種模型。
多種輸出格式
支持VTT、SRT和JSON等多種輸出格式。
文件夾批量轉錄
可以一次性對文件夾中的所有音頻文件進行轉錄。
模型實例緩存
避免重複加載模型,提升運行效率。
動態調整批處理大小
根據GPU內存大小自動調整批處理大小。
優勢
高效語音轉文字功能
支持多種模型大小
自動CUDA加速提升性能
支持多種輸出格式
動態調整批處理大小優化內存使用
侷限性
需要安裝特定版本的PyTorch和CUDA
對於極長音頻可能需要額外預處理
如何使用
安裝依賴
克隆或下載倉庫,創建虛擬環境並安裝依賴。
啟動服務器
在Windows上運行start_server.bat,在其他平臺運行python whisper_server.py。
配置Claude Desktop
編輯配置文件並添加服務器命令。
使用案例
批量轉錄音頻文件
將一個文件夾中的所有音頻文件一次性轉錄成SRT格式。
獲取模型信息
查看服務器支持的所有Whisper模型。
常見問題
服務器是否支持多種語言?
如何檢查CUDA版本?
相關資源
項目倉庫
源碼和文檔
Faster Whisper
優化版Whisper模型
PyTorch 安裝指南
官方PyTorch安裝教程

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
27.2K
4.5分

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
20.0K
5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
68.8K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
21.8K
4.5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
15.8K
4.8分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
16.7K
5分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
11.6K
4.5分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
46.4K
4.7分

