Provides Docker Compose setup for easily running the required VOICEVOX engine locally.
The MCP server is implemented in TypeScript for type safety and developer experience.
Uses Zod for runtime schema validation within the MCP server implementation.
voicevox-mcp
Этот проект представляет собой сервер MCP (Model Context Protocol), который работает с движком VOICEVOX для синтеза голоса и получения информации о говорящем. Он реализован на TypeScript и использует MCP SDK.
функция
- Получить информацию о динамиках для движка VOICEVOX (/speakers)
- Синтезировать текст в речь на указанном динамике и воспроизводить ее локально (/speak)
- только для Mac
настраивать
Запуск движка VOICEVOX (рекомендуется Docker)
Это запустит движок VOICEVOX на localhost:50021.
Установка и сборка зависимостей
Как использовать
Пример установки курсора
При необходимости задайте VOICEVOX_API_URL.
- Вы можете получить список докладчиков из вашего клиента MCP с помощью инструмента «Динамики».
- Инструмент Speak может синтезировать текст в речь и воспроизводить ее локально (рекомендуется Mac, поскольку он использует команду afplay).
Основные зависимости
@modelcontextprotocol/sdk
zod
typescript
Меры предосторожности
- Будущие улучшения
- Синтез речи будет недоступен, если на localhost:50021 не запущен движок VOICEVOX.
- Если вы используете среду, отличную от Mac, измените часть afplay соответствующим образом.
лицензия
Лицензия Массачусетского технологического института
You must be authenticated.
local-only server
The server can only run on the client's local machine because it depends on local resources.
Сервер протокола контекстной модели, который интегрируется с движком VOICEVOX для обеспечения синтеза текста в речь и извлечения информации о говорящем, позволяя пользователям генерировать и воспроизводить голосовой аудиофайл из текста.
Related Resources
Related MCP Servers
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityFlicense-qualityA Model Context Protocol server that provides text-to-speech capabilities using the Kokoro TTS model, offering multiple voice options and customizable speech parameters.Last updated -239JavaScript
- -securityAlicense-qualityA Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.Last updated -TypeScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.Last updated -11764JavaScriptThe Unlicense