VOICEVOX MCP Server

voicevox-mcp

このプロジェクトは、VOICEVOXエンジンと連携して音声合成やスピーカー情報の取得ができるMCP（Model Context Protocol）サーバーです。TypeScriptで実装されており、MCP SDKを利用しています。

機能

VOICEVOXエンジンのスピーカー情報取得（/speakers）
指定したスピーカーでテキストを音声合成し、ローカルで再生（/speak）
- Macのみ対応

セットアップ

VOICEVOXエンジンの起動（Docker推奨）

docker compose up -d

これで localhost:50021 でVOICEVOXエンジンが起動します。

依存パッケージのインストール & ビルド

npm install
npm run build 

使い方

Cursorの設定例

{
  "mcpServers": {
    "voicevox-mcp": {
      "command": "node",
      "args": ["${Path to Repository}/dist/index.js"],
      "env": {
        "SPEAKER_ID": 8,
        "SPEED_SCALE": 1.2,
        "VOICEVOX_API_URL": "http://localhost:50021" 
      }
    }
  }
}

VOICEVOX_API_URLは必要に応じて設定

MCPクライアントから speakers ツールでスピーカー一覧を取得できます。
speak ツールでテキストを音声合成し、ローカルで再生できます（afplayコマンドを使用しているため、Mac環境推奨）。

主な依存パッケージ

@modelcontextprotocol/sdk
zod
typescript

注意事項

今後改善
- VOICEVOXエンジンが localhost:50021 で動作していないと音声合成は利用できません。
- Mac以外の環境では afplay の部分を適宜変更してください。

ライセンス

MIT License

Install Server

HTTP connection URL

security – no known vulnerabilities

license - permissive license

quality - confirmed to work

How are these scores calculated?

local-only server

The server can only run on the client's local machine because it depends on local resources.

Tools

A Model Context Protocol server that integrates with VOICEVOX engine to provide text-to-speech synthesis and speaker information retrieval, allowing users to generate and play voice audio from text.

Related Resources

Reddit Discussion about this server

Related MCP Servers

Kokoro TTS MCP Server
giannisanni
-
security
F
license
-
quality
Provides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.
Last updated -
2
Python
Speech MCP Server
hammeiam
-
security
F
license
-
quality
A Model Context Protocol server that provides text-to-speech capabilities using the Kokoro TTS model, offering multiple voice options and customizable speech parameters.
Last updated -
239
JavaScript
TTS-MCP
nakamurau1
-
security
A
license
-
quality
A Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.
Last updated -
TypeScript
MIT License
Rime MCP
MatthewDailey
A
security
A
license
A
quality
A Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.
Last updated -
1
15
4
JavaScript
The Unlicense

View all related MCP servers

VOICEVOX MCP Server

voicevox-mcp

機能

セットアップ

VOICEVOXエンジンの起動（Docker推奨）

依存パッケージのインストール & ビルド

使い方

Cursorの設定例

注意事項

ライセンス

Tools

Related Resources

Related MCP Servers

Kokoro TTS MCP Server

Speech MCP Server

TTS-MCP

Rime MCP

New MCP Servers

MCP directory API