Mlx Whisper MCP
什麼是MLX Whisper MCP Server?
這是一個專為Apple Silicon Mac設計的智能音頻轉錄服務,可以將音頻文件、語音錄音或YouTube視頻內容自動轉換為文字。它使用先進的Whisper Large v3 Turbo模型,提供高準確率的轉錄和翻譯功能。如何使用MLX Whisper MCP Server?
您可以通過簡單的命令啟動服務,然後使用Claude Desktop等客戶端應用發送音頻文件或YouTube鏈接進行轉錄。服務會自動處理音頻並返回文字結果。適用場景
適合需要將會議錄音、訪談內容、講座音頻或視頻內容轉換為文字的用戶。特別適合記者、研究人員、學生和內容創作者使用。主要功能
音頻文件轉錄直接轉錄存儲在電腦上的音頻文件,支持多種格式如MP3、WAV等。
Base64音頻轉錄支持通過Base64編碼的音頻數據進行轉錄,適合網頁應用集成。
YouTube視頻轉錄自動下載並轉錄YouTube視頻中的語音內容。
語音翻譯可將外語語音內容翻譯為英文文本。
優勢與侷限性
優勢
使用高質量的Whisper Large v3 Turbo模型,轉錄準確率高
專為Apple Silicon優化,運行效率高
支持多種音頻輸入方式,使用靈活
自動保存轉錄文本,方便後續查閱
侷限性
僅支持Apple Silicon Mac設備(M系列芯片)
處理超長音頻時可能出現內存壓力
部分受限制的YouTube視頻可能無法下載
如何使用
安裝必要軟件
確保已安裝Python 3.12或更高版本,並安裝uv工具。
啟動服務
使用uv命令運行服務腳本。
配置Claude Desktop
在Claude Desktop配置文件中添加MCP服務器設置。
使用案例
會議記錄轉錄將錄製的會議音頻轉換為文字記錄
外語視頻翻譯將外語YouTube視頻內容翻譯為英文文本
語音備忘錄轉文字將手機錄製的語音備忘錄轉換為文字
常見問題
為什麼服務無法啟動?
轉錄結果不準確怎麼辦?
如何保留下載的YouTube視頻文件?
支持哪些音頻格式?
相關資源
MLX Whisper項目主頁
MLX Whisper的官方代碼庫
Whisper模型介紹
OpenAI Whisper模型的官方介紹
uv工具文檔
uv工具的官方文檔
精選MCP服務推薦

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
1.7K
5分

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
697
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
3.8K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
249
4.5分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
5.2K
4.7分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
246
4.8分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
1.7K
5分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
113
4.5分