Provides Docker Compose setup for easily running the required VOICEVOX engine locally.
The MCP server is implemented in TypeScript for type safety and developer experience.
Uses Zod for runtime schema validation within the MCP server implementation.
voicevox-mcp
Este proyecto es un servidor MCP (Model Context Protocol) que trabaja con el motor VOICEVOX para sintetizar voz y obtener información del hablante. Se implementa en TypeScript y utiliza el SDK MCP.
función
- Obtener información de los altavoces para el motor VOICEVOX (/speakers)
- Sintetizar texto a voz en un altavoz específico y reproducirlo localmente (/speak)
- Sólo Mac
configuración
Iniciando el motor VOICEVOX (se recomienda Docker)
Esto iniciará el motor VOICEVOX en localhost:50021.
Instalar y crear dependencias
Cómo utilizar
Ejemplo de configuración del cursor
Establezca VOICEVOX_API_URL según sea necesario.
- Puede obtener una lista de oradores de su cliente MCP utilizando la herramienta de oradores.
- La herramienta de voz puede sintetizar texto a voz y reproducirlo localmente (se recomienda Mac ya que utiliza el comando afplay).
Dependencias principales
@modelcontextprotocol/sdk
zod
typescript
Precauciones
- Mejoras futuras
- La síntesis de voz no estará disponible a menos que el motor VOICEVOX se esté ejecutando en localhost:50021.
- Si está utilizando un entorno distinto a Mac, cambie la parte afplay según corresponda.
licencia
Licencia MIT
You must be authenticated.
local-only server
The server can only run on the client's local machine because it depends on local resources.
Un servidor de protocolo de contexto modelo que se integra con el motor VOICEVOX para proporcionar síntesis de texto a voz y recuperación de información del hablante, lo que permite a los usuarios generar y reproducir audio de voz a partir de texto.
Related Resources
Related MCP Servers
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityFlicense-qualityA Model Context Protocol server that provides text-to-speech capabilities using the Kokoro TTS model, offering multiple voice options and customizable speech parameters.Last updated -239JavaScript
- -securityAlicense-qualityA Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.Last updated -TypeScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.Last updated -11764JavaScriptThe Unlicense