mcp-simple-aivisspeech - 支持日语合成与多角色配置，助力AI助手集成的MCP服务器

探索

MCP Simple Aivisspeech

一个为AivisSpeech文本转语音引擎设计的MCP服务器，支持日语语音合成、多角色声音选择和参数配置，实现与AI助手的无缝集成。

语音处理开发者工具 #语音合成 #日语TTS #AI集成 #声音定制 .TypeScript

评分 : 2.5分

下载量 : 4.7K

更新时间 : 2025-07-24

打开站点

什么是MCP Simple AivisSpeech?

MCP Simple AivisSpeech是一个Model Context Protocol (MCP)服务器，它允许AI助手和应用程序将文本转换为自然的日语语音。该服务基于AivisSpeech引擎，提供多种语音选择和参数配置。

如何使用MCP Simple AivisSpeech?

通过简单的命令即可启动MCP服务器，并与AI助手集成。只需确保AivisSpeech引擎正在运行，然后按照说明进行配置即可开始使用。

适用场景

适用于需要将文本转换为自然日语语音的各种场景，如智能助手、语音通知系统、教育应用等。

主要功能

文本转语音

支持高质量的日语语音合成，可自定义语音参数。

多角色语音

提供多种语音角色和风格选择（默认：Anneli ノーマル）。

参数调节

可以调整速度、音高、音量和语调等参数。

跨平台音频

支持在macOS、Windows和Linux上自动播放音频。

任务通知

支持通过语音通知任务完成状态。

简单集成

通过MCP协议轻松集成到AI助手和应用中。

实时状态监控

可以实时检查AivisSpeech引擎的状态。

智能错误处理

提供有用的错误信息和语音建议。

优势

支持高质量的日语语音合成

提供多种语音角色和风格选择

可以自定义语音参数

跨平台支持音频播放

支持语音通知任务完成状态

易于集成到AI助手和应用中

实时监控AivisSpeech引擎状态

智能错误处理机制

局限性

需要AivisSpeech引擎运行在本地

需要一定的技术知识进行配置

部分功能可能需要额外设置

如何使用

安装Node.js

确保已安装Node.js 18.0.0或更高版本。

启动AivisSpeech引擎

下载并启动AivisSpeech引擎，确保其在http://127.0.0.1:10101上运行。

启动MCP服务器

在终端中运行以下命令以启动MCP服务器：npx @shinshin86/mcp-simple-aivisspeech@latest

注册MCP服务器

根据使用的工具（如Claude Code或Claude Desktop）进行MCP服务器注册。

使用案例

问候语转换

将'こんにちは、世界！'转换为自然的日语语音。

任务完成通知

在任务完成后播放语音通知。

自定义语音参数

调整语音速度、音高和音量以获得更自然的语音效果。

常见问题

如何确认AivisSpeech引擎正在运行？

如何解决音频播放失败的问题？

如何添加新的语音角色？

如何调整语音速度？

如何查看MCP服务器的状态？

🚀 MCP Simple AivisSpeech

MCP Simple AivisSpeech 是一个基于模型上下文协议（MCP）的服务器，可与 AivisSpeech 文本转语音引擎无缝集成。该项目能让 AI 助手和应用程序将文本转换为自然流畅的日语语音，并可自定义语音参数。

🚀 快速开始

前提条件

Node.js - 版本 18.0.0 或更高
AivisSpeech 引擎 - 在 http://127.0.0.1:10101（默认端口）上运行
音频系统 - 具备系统音频播放能力

配置 MCP Simple AivisSpeech

使用 Claude Code

在使用 Claude Code 时，需先手动启动 MCP 服务器。

使用 npx 可确保始终自动获取最新版本，无需手动更新。

在与使用 Claude Code 不同的终端中手动启动 AivisSpeech MCP 服务器

npx @shinshin86/mcp-simple-aivisspeech@latest

向 Claude Code 注册 MCP 服务器

claude mcp add aivisspeech -e AIVISSPEECH_URL=http://127.0.0.1:10101 -- npx @shinshin86/mcp-simple-aivisspeech@latest

默认情况下，服务器会添加到本地范围（仅当前项目）。若要使其在所有项目中可用，请使用 -s user 选项：

claude mcp add aivisspeech -s user -e AIVISSPEECH_URL=http://127.0.0.1:10101 -- npx @shinshin86/mcp-simple-aivisspeech@latest

你还可以在 CLAUDE.md 文件中添加语音通知，以自动实现任务完成通知：

## 任务完成行为
- 当所有任务完成时，始终使用 aivisspeech mcp 工具通过语音宣布“任务完成”
- 当需要用户输入或做出决策时，使用 aivisspeech mcp 工具通过语音宣布“等待你的决策”

### 通知时机
- 向用户提问时
- 所有任务完成时
- 出现错误或问题时

验证工具是否被识别

claude mcp list

# 或者启动 Claude Code 并使用
/mcp

如果显示 aivisspeech，则表示设置成功。

💡 提示：出于安全考虑，Claude Code 不会自动执行命令。如果忘记启动服务器，工具将不会显示。在开发过程中，请在终端中保持上述 npx 命令运行，或者使用 pm2 或 systemd --user 等进程管理器实现持久化运行。

使用 Claude Desktop

对于手动配置 Claude Desktop，你可以简单地添加以下配置：

使用 npx 可确保始终自动获取最新版本，无需手动更新。

{
  "mcpServers": {
    "aivisspeech": {
      "command": "npx",
      "args": ["@shinshin86/mcp-simple-aivisspeech@latest"],
      "env": {
        "AIVISSPEECH_URL": "http://127.0.0.1:10101"
      }
    }
  }
}

AivisSpeech 引擎设置

在使用此 MCP 服务器之前，请完成以下设置步骤，以确保 AivisSpeech 在本地运行。

从 https://aivis-project.com/ 下载 AivisSpeech
在本地机器上启动 AivisSpeech
引擎将在默认端口 10101 上启动
通过访问 http://127.0.0.1:10101/docs 验证引擎是否正在运行

✨ 主要特性

文本转语音转换 - 使用 AivisSpeech 进行高质量的日语语音合成
多种语音角色 - 支持各种说话者和语音风格（默认：Anneli ノーマル）
可配置参数 - 调整语速、音高、音量和语调
跨平台音频 - 在 macOS、Windows 和 Linux 上自动播放音频
任务通知 - 语音通知进程完成情况
易于集成 - 简单的 MCP 协议，便于 AI 助手集成
引擎状态监控 - 实时检查 AivisSpeech 引擎的状态
智能错误处理 - 提供有用的错误消息和说话者建议

📦 安装指南

本地开发

# 克隆仓库
git clone https://github.com/shinshin86/mcp-simple-aivisspeech.git
cd mcp-simple-aivisspeech

# 安装依赖
npm install

# 构建项目
npm run build

运行 MCP 服务器

# 运行 MCP 服务器
npm start

# 开发时热重载
npm run dev

# 检查是否一切正常
npm test

💻 使用示例

基础用法

{
  "text": "こんにちは、世界！",
  "speaker": 888753760,
  "speedScale": 1.2,
  "pitchScale": 0.05,
  "volumeScale": 1.5
}

高级用法

{
  "message": "データ処理が完了しました",
  "speaker": 888753760
}

📚 详细文档

可用工具

🎤 `speak`

将文本转换为语音并播放音频，可自定义语音参数。

此工具接受多个配置参数，包括以下选项：

text (必需)：要转换为语音的文本
speaker (可选)：说话者/语音 ID（默认：888753760 - Anneli ノーマル）
speedScale (可选)：语音速度乘数（0.5 - 2.0，默认：1.0）
pitchScale (可选)：音高调整（-0.15 - 0.15，默认：0.0）
volumeScale (可选)：音量级别（0.0 - 2.0，默认：1.0）
playAudio (可选)：是否播放生成的音频（默认：true）

👥 `get_speakers`

检索所有可用的语音角色及其风格列表。

此函数返回：包含说话者 ID、名称和可用语音风格的列表。

🔔 `notify_completion`

任务完成时播放语音通知。

此工具接受多个配置参数，包括以下选项：

message (可选)：要宣布的完成消息（默认："処理が完了しました"）
speaker (可选)：通知语音的说话者 ID（默认：888753760 - Anneli ノーマル）

📊 `check_engine_status`

检查 AivisSpeech 引擎的当前状态和版本。

此函数返回：引擎状态、版本信息和连接详细信息。

平台支持

音频播放系统

平台	音频命令	要求
macOS	`afplay`	内置（无需额外设置）
Windows	PowerShell Media.SoundPlayer	Windows PowerShell
Linux	`aplay`	ALSA utils（`sudo apt install alsa-utils`）

测试环境

macOS 12+（Intel & Apple Silicon）
Windows 10/11
Ubuntu 20.04+
Node.js 18.x, 20.x, 21.x

🔧 技术细节

可用脚本

# 开发与构建
npm run dev          # 热重载运行（tsx）
npm run build        # 将 TypeScript 编译到 dist/
npm start           # 运行编译后的服务器

# 代码质量
npm run lint        # 运行 ESLint
npm run test        # 运行 Vitest 测试（单次运行）
npm run test:watch  # 以监视模式运行测试
npm run test:ui     # 以 UI 模式运行测试
npm run test:coverage # 运行测试并生成覆盖率报告

# 实用工具
npm run clean       # 清理 dist/ 目录

本地与 NPX 使用

在生产环境中使用 MCP 客户端时，在 MCP 配置中使用 npx @shinshin86/mcp-simple-aivisspeech@latest。无需本地设置，且始终获取最新版本。

对于开发，克隆仓库并使用 npm run dev 进行热重载，或使用 npm run build && npm start 测试生产构建。

项目架构

mcp-simple-aivisspeech/
├── src/
│   ├── index.ts                  # MCP 服务器和工具处理程序
│   └── aivisspeech-client.ts     # AivisSpeech API 客户端
├── tests/
│   └── aivisspeech-client.test.ts # 单元测试
├── dist/                         # 编译输出
├── docs/                         # 文档
└── config files                  # TS、ESLint、Vitest 配置文件

API 客户端架构

AivisSpeechClient 类提供了全面的功能，具备以下关键能力：

HTTP 客户端 - 基于 Axios 的 API 通信
错误处理 - 全面的错误捕获和报告
类型安全 - 所有 API 响应均使用完整的 TypeScript 接口
连接管理 - 健康检查和状态监控

添加新功能

新工具：在 src/index.ts 的 CallToolRequestSchema 中添加处理程序
API 方法：扩展 AivisSpeechClient 类
类型：更新 aivisspeech-client.ts 中的接口
测试：添加相应的测试用例

🔧 故障排除

常见问题

AivisSpeech 引擎未找到

Error: Failed to get version: connect ECONNREFUSED 127.0.0.1:10101

解决此问题可考虑以下故障排除方法：确保 AivisSpeech 引擎在正确的端口上运行。

音频播放失败

Error: Audio player exited with code 1

解决此问题可考虑以下故障排除方法：

macOS - 检查 afplay 是否可用
Linux - 安装 ALSA utils（sudo apt install alsa-utils）
Windows - 确保 PowerShell 执行策略允许脚本运行

权限被拒绝

Error: spawn afplay EACCES

解决此问题可考虑以下故障排除方法：检查文件权限和系统音频设置。

调试模式

要启用详细日志记录，请运行以下命令：

DEBUG=mcp-aivisspeech npm run dev

📄 许可证

本项目采用 Apache 许可证 2.0 - 详情请参阅 LICENSE 文件。

🤝 贡献

我们欢迎社区的贡献。贡献者可以通过完成以下基本步骤开始：

分叉仓库
创建一个功能分支（git checkout -b feature/amazing-feature）
提交你的更改（git commit -m 'Add amazing feature'）
推送到分支（git push origin feature/amazing-feature）
打开一个拉取请求

开发指南

遵循现有的 TypeScript/ESLint 配置
为新功能添加测试
为 API 更改更新文档
确保跨平台兼容性

🙏 致谢

AivisSpeech 项目提供了出色的 TTS 引擎
模型上下文协议提供了集成框架
VOICEVOX MCP 提供了灵感和参考

📞 支持

问题反馈 - GitHub Issues
讨论交流 - GitHub Discussions
文档查阅 - AivisSpeech API 文档

❤️ 为日语 TTS 社区精心打造

Duckduckgo MCP Server

已认证

DuckDuckGo搜索MCP服务器，为Claude等LLM提供网页搜索和内容抓取服务

Framelink Figma MCP Server是一个为AI编程工具（如Cursor）提供Figma设计数据访问的服务器，通过简化Figma API响应，帮助AI更准确地实现设计到代码的一键转换。

Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器，提供丰富的网页抓取、搜索和内容提取功能。

百度地图MCP Server是国内首个兼容MCP协议的地图服务，提供地理编码、路线规划等10个标准化API接口，支持Python和Typescript快速接入，赋能智能体实现地图相关功能。

MiniMax Model Context Protocol (MCP) 是一个官方服务器，支持与强大的文本转语音、视频/图像生成API交互，适用于多种客户端工具如Claude Desktop、Cursor等。

Exa MCP Server是一个为AI助手（如Claude）提供网络搜索功能的服务器，通过Exa AI搜索API实现实时、安全的网络信息获取。

TypeScript

48.1K

5分

Edgeone Pages MCP Server

EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务

Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务，通过Model Context Protocol直接集成到提示中，解决LLM使用过时信息的问题。

智启未来，您的人工智能解决方案智库

MCP Simple Aivisspeech

概述

安装

工具列表

内容详情

替代品

什么是MCP Simple AivisSpeech?

如何使用MCP Simple AivisSpeech?

适用场景

主要功能

如何使用

使用案例

常见问题

相关资源

安装

🚀 MCP Simple AivisSpeech

🚀 快速开始

前提条件

配置 MCP Simple AivisSpeech

使用 Claude Code

使用 Claude Desktop

AivisSpeech 引擎设置

✨ 主要特性

📦 安装指南

本地开发

运行 MCP 服务器

💻 使用示例

基础用法

高级用法

📚 详细文档

可用工具

🎤 speak

👥 get_speakers

🔔 notify_completion

📊 check_engine_status

平台支持

音频播放系统

测试环境

🔧 技术细节

可用脚本

本地与 NPX 使用

项目架构

API 客户端架构

添加新功能

🔧 故障排除

常见问题

AivisSpeech 引擎未找到

音频播放失败

权限被拒绝

调试模式

📄 许可证

🤝 贡献

开发指南

🙏 致谢

📞 支持

替代品

🎤 `speak`

👥 `get_speakers`

🔔 `notify_completion`

📊 `check_engine_status`