V

Voice MCP

一個支持與Claude等LLM進行語音交互的MCP服務器,只需OpenAI API密鑰和麥克風/揚聲器即可實現即時語音對話。
2.5分
2

什麼是Voice MCP?

Voice MCP 是一個 Model Context Protocol (MCP) 服務器,它允許用戶通過語音與Claude和其他大型語言模型進行交互。只需一個OpenAI API密鑰和麥克風/揚聲器即可實現語音對話。

如何使用Voice MCP?

您可以通過簡單的命令行操作將Voice MCP添加到Claude桌面應用中。配置完成後,您可以直接通過語音與Claude交談,獲取語音回覆。

適用場景

適用於需要語音交互的場景,如日常問答、語音助手、教育輔導等。特別適合希望用語音與AI進行自然交流的用戶。

主要功能

語音對話支持與Claude進行即時語音對話,提供自然流暢的交流體驗。
多種傳輸方式支持本地麥克風或LiveKit房間通信,滿足不同場景需求。
兼容性強支持任何OpenAI兼容的STT/TTS服務,包括本地或雲服務。
低延遲提供低延遲的語音交互體驗,確保對話的即時性。
MCP集成與Claude桌面應用及其他MCP客戶端無縫集成,提升用戶體驗。

優勢與侷限性

優勢
支持語音交互,提升用戶體驗
兼容性強,可使用多種STT/TTS服務
低延遲,保證即時對話
易於集成到Claude桌面應用中
侷限性
需要麥克風和揚聲器設備
部分功能依賴於外部服務(如LiveKit)
可能需要額外的系統權限配置

如何使用

獲取OpenAI API密鑰
在OpenAI官網註冊並獲取API密鑰,用於語音識別和語音合成服務。
安裝Voice MCP
通過uvx、Docker或pip安裝Voice MCP服務器。
配置Claude Desktop
將Voice MCP添加到Claude桌面應用的配置文件中。
啟動並測試
啟動Voice MCP後,通過Claude桌面應用嘗試語音交互。

使用案例

日常問答用戶通過語音向Claude提問,例如詢問天氣、新聞或知識問題。
講述笑話用戶請求Claude講述一個笑話,並通過語音聽取結果。
語音互動學習學生通過語音與Claude進行語言學習或知識講解。

常見問題

我需要哪些設備才能使用Voice MCP?
如果我的麥克風無法工作怎麼辦?
Voice MCP是否支持中文?
如何調試Voice MCP?

相關資源

GitHub 項目頁面
Voice MCP 的源代碼和文檔
LiveKit 官方文檔
LiveKit 服務器的使用指南和配置說明
Claude 桌面應用文檔
Claude 桌面應用的使用指南和配置方法
安裝
複製以下命令到你的Client進行配置
{
  "mcpServers": {
    "voice-mcp": {
      "command": "uvx",
      "args": ["voice-mcp"],
      "env": {
        "OPENAI_API_KEY": "your-openai-key"
      }
    }
  }
}

{
  "mcpServers": {
    "voice-mcp": {
      "command": "docker",
      "args": [
        "run", "--rm", "-i",
        "--device", "/dev/snd",
        "-e", "PULSE_RUNTIME_PATH=/run/user/1000/pulse",
        "-v", "/run/user/1000/pulse:/run/user/1000/pulse",
        "ghcr.io/mbailey/voice-mcp:latest"
      ],
      "env": {
        "OPENAI_API_KEY": "your-openai-key"
      }
    }
  }
}

{
  "mcpServers": {
    "voice-mcp": {
      "command": "voice-mcp",
      "env": {
        "OPENAI_API_KEY": "your-openai-key"
      }
    }
  }
}
注意:您的密鑰屬於敏感信息,請勿與任何人分享。
Z
Zen MCP Server
Zen MCP是一個多模型AI協作開發服務器,為Claude和Gemini CLI等AI編碼助手提供增強的工作流工具和跨模型上下文管理。它支持多種AI模型的無縫協作,實現代碼審查、調試、重構等開發任務,並能保持對話上下文在不同工作流間的延續。
Python
11
5分
O
Opendia
OpenDia是一款開源瀏覽器擴展工具,允許AI模型直接控制用戶瀏覽器,利用現有登錄狀態、書籤等數據進行自動化操作,支持多種瀏覽器和AI模型,注重隱私保護。
JavaScript
9
5分
N
Notte Browser
已認證
Notte是一個開源的全棧網絡AI代理框架,提供瀏覽器會話、自動化LLM驅動的代理、網頁觀察與操作、憑證管理等功能,旨在將互聯網轉化為代理友好的環境,並通過自然語言描述網站結構,降低LLM的認知負擔。
656
4.5分
B
Bing Search MCP
一個用於集成微軟Bing搜索API的MCP服務器,支持網頁、新聞和圖片搜索功能,為AI助手提供網絡搜索能力。
Python
231
4分
C
Cloudflare
Changesets是一個用於管理多包或單包倉庫版本和發佈的構建工具。
TypeScript
1.5K
5分
E
Eino
Eino是一個專為Golang設計的LLM應用開發框架,旨在通過簡潔、可擴展、可靠且高效的組件抽象和編排能力,簡化AI應用開發流程。它提供豐富的組件庫、強大的圖形編排功能、完整的流處理支持以及高度可擴展的切面機制,覆蓋從開發到部署的全週期工具鏈。
Go
3.4K
5分
M
Modelcontextprotocol
已認證
該項目是一個集成Sonar API的MCP服務器實現,為Claude提供即時網絡搜索能力。包含系統架構、工具配置、Docker部署及多平臺集成指南。
TypeScript
1.1K
5分
S
Serena
Serena是一個強大的開源編碼代理工具包,能夠將LLM轉化為可直接在代碼庫上工作的全功能代理。它提供類似IDE的語義代碼檢索和編輯工具,支持多種編程語言,並可通過MCP協議或Agno框架與多種LLM集成。
Python
811
5分
精選MCP服務推薦
B
Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
726
4.5分
M
Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
1.7K
5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
3.9K
5分
S
Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
299
4.5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
267
4.8分
N
Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
142
4.5分
M
Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
1.7K
5分
C
Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
5.3K
4.7分
AIbase
智啟未來,您的人工智慧解決方案智庫
© 2025AIbase