MCP Voice Hooks
M

MCP Voice Hooks

为Claude Code提供语音交互模式的MCP服务,支持通过浏览器进行免提的连续双向语音对话,包含语音识别和文本转语音功能。
2.5分
6.6K

什么是 Voice Mode for Claude Code?

Voice Mode for Claude Code 是一个创新的语音交互界面,让您能够通过自然语音与 Claude Code 进行无缝对话。它利用现代浏览器的语音识别和文本转语音功能,在您与 Claude 协作编程时提供免提操作体验。您可以像与同事交谈一样与 Claude 交流,无需停止手头的工作。

如何使用 Voice Mode for Claude Code?

使用过程非常简单:安装 Claude Code 和 Voice Mode 后,启动 Claude Code,浏览器界面会自动打开。点击“开始监听”按钮,然后就可以开始说话了。您可以在两种模式间切换:自动发送模式(暂停时自动发送)或触发词模式(需要说出特定词语才发送)。

适用场景

这个工具特别适合以下场景:编程时双手忙碌无法打字;需要连续向 Claude 提供复杂指令;想要实时调整 Claude 的工作方向;在调试代码时快速描述问题;进行代码审查时提供口头反馈;教学或演示 Claude Code 功能。

主要功能

连续语音对话
支持不间断的语音输入,可以随时打断 Claude 当前工作,提供新指令或反馈,无需等待 Claude 完成当前任务。
免提操作
完全通过语音控制,无需键盘或鼠标操作,特别适合编程时双手忙碌的场景。
双模式语音输入
提供自动发送模式和触发词模式两种选择。自动模式在您暂停说话时自动发送,触发词模式允许您积累多条语音后一次性发送。
语音反馈选项
支持浏览器文本转语音和系统文本转语音两种方式,让 Claude 可以“说话”回复您,实现真正的双向对话。
高质量语音支持
支持下载和使用 Mac 系统的高质量 Siri 语音,提供更自然、更清晰的语音反馈体验。
零配置安装
无需下载额外软件或配置 API 密钥,所有语音功能都通过浏览器原生功能实现,安装简单快捷。
优势
完全免费使用,无需支付语音 API 费用
安装简单,几分钟内即可开始使用
支持高质量的 Siri 语音(仅限 Mac)
提供灵活的语音输入模式选择
与 Claude Code 深度集成,响应迅速
隐私友好,语音处理在本地浏览器完成
局限性
浏览器兼容性有限,Edge 浏览器在 Apple Silicon 上不支持语音识别
Safari 浏览器无法加载高质量语音(需使用系统语音替代)
需要稳定的网络连接(用于 Claude Code 通信)
语音识别准确性受环境噪音影响
目前主要针对英语语音优化

如何使用

安装 Claude Code
首先需要在您的计算机上安装 Claude Code 命令行工具。打开终端并运行安装命令。
安装 Voice Mode
安装 Voice Mode 的 MCP 服务器和钩子。这会配置 Claude Code 以支持语音功能。
启动 Claude Code
启动 Claude Code,Voice Mode 会自动在后台运行。
开始语音对话
浏览器会自动打开语音界面(http://localhost:5111)。点击“开始监听”按钮,然后开始说话。您需要在 Claude Code CLI 中发送第一条消息来启动对话。
配置语音模式(可选)
在浏览器界面中,您可以选择自动发送模式或触发词模式。触发词模式允许您积累多条语音后一次性发送。

使用案例

代码调试助手
在调试复杂代码时,通过语音快速描述问题,让 Claude 帮助分析错误原因并提供修复建议。
编程教学
学习新编程语言或框架时,通过语音提问获得实时指导和代码示例。
代码重构
在重构现有代码时,通过语音指令逐步指导 Claude 进行代码优化和改进。
文档生成
通过语音描述需求,让 Claude 为代码生成详细的文档和注释。

常见问题

我需要为语音功能付费吗?
支持哪些浏览器?
如何获得高质量的语音反馈?
触发词模式如何工作?
如何更改服务端口?
如何完全卸载 Voice Mode?
语音识别支持中文吗?
浏览器没有自动打开怎么办?

相关资源

演示视频
Voice Mode for Claude Code 的功能演示视频,展示实际使用效果
Claude Code 钩子文档
Anthropic 官方关于 Claude Code 钩子功能的详细文档
GitHub 仓库
Voice Mode 的源代码和最新更新
插件模式安装指南
通过修改 .claude/settings.local.json 文件启用插件模式的详细说明

安装

复制以下命令到你的Client进行配置
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

V
Vestige
Vestige是一个基于认知科学的AI记忆引擎,通过实现预测误差门控、FSRS-6间隔重复、记忆梦境等29个神经科学模块,为AI提供长期记忆能力。包含3D可视化仪表板和21个MCP工具,完全本地运行,无需云端。
Rust
7.4K
4.5分
M
Moltbrain
MoltBrain是一个为OpenClaw、MoltBook和Claude Code设计的长期记忆层插件,能够自动学习和回忆项目上下文,提供智能搜索、观察记录、分析统计和持久化存储功能。
TypeScript
7.5K
4.5分
B
Bm.md
一个功能丰富的Markdown排版工具,支持多种样式主题和平台适配,提供实时编辑预览、图片导出和API集成能力
TypeScript
15.7K
5分
S
Security Detections MCP
Security Detections MCP 是一个基于Model Context Protocol的服务器,允许LLM查询统一的安全检测规则数据库,涵盖Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升级为自主检测工程平台,可自动从威胁情报中提取TTPs、分析覆盖差距、生成SIEM原生格式检测规则、运行测试并验证。项目包含71+工具、11个预构建工作流提示和知识图谱系统,支持多SIEM平台。
TypeScript
6.0K
4分
P
Paperbanana
PaperBanana是一个自动化生成学术图表和统计图的智能框架,支持从文本描述生成高质量的论文插图,采用多智能体管道和迭代优化,提供CLI、Python API和MCP服务器等多种使用方式。
Python
7.7K
5分
B
Better Icons
一个提供超过20万图标搜索和检索的MCP服务器和CLI工具,支持150多个图标库,帮助AI助手和开发者快速获取和使用图标。
TypeScript
9.0K
4.5分
A
Assistant Ui
assistant-ui是一个开源TypeScript/React库,用于快速构建生产级AI聊天界面,提供可组合的UI组件、流式响应、无障碍访问等功能,支持多种AI后端和模型。
TypeScript
8.4K
5分
A
Apify MCP Server
Apify MCP服务器是一个基于模型上下文协议(MCP)的工具,允许AI助手通过数千个现成的爬虫、抓取器和自动化工具(Apify Actor)从社交媒体、搜索引擎、电商等网站提取数据。它支持OAuth和Skyfire代理支付,可通过HTTPS端点或本地stdio方式集成到Claude、VS Code等MCP客户端中。
TypeScript
7.6K
5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
90.3K
4.3分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
79.2K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
164.1K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
34.4K
4.8分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
52.1K
4.5分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
66.0K
5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
110.1K
4.7分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
67.6K
4.8分
AIBase
智启未来,您的人工智能解决方案智库
© 2026AIBase