voicevox-mcp
Этот проект представляет собой сервер MCP (Model Context Protocol), который работает с движком VOICEVOX для синтеза голоса и получения информации о говорящем. Он реализован на TypeScript и использует MCP SDK.
функция
- Получить информацию о динамиках для движка VOICEVOX (/speakers)
- Синтезировать текст в речь на указанном динамике и воспроизводить ее локально (/speak)
- только для Mac
настраивать
Запуск движка VOICEVOX (рекомендуется Docker)
Это запустит движок VOICEVOX на localhost:50021.
Установка и сборка зависимостей
Как использовать
Пример установки курсора
При необходимости задайте VOICEVOX_API_URL.
- Вы можете получить список докладчиков из вашего клиента MCP с помощью инструмента «Динамики».
- Инструмент Speak может синтезировать текст в речь и воспроизводить ее локально (рекомендуется Mac, поскольку он использует команду afplay).
Основные зависимости
@modelcontextprotocol/sdk
zod
typescript
Меры предосторожности
- Будущие улучшения
- Синтез речи будет недоступен, если на localhost:50021 не запущен движок VOICEVOX.
- Если вы используете среду, отличную от Mac, измените часть afplay соответствующим образом.
лицензия
Лицензия Массачусетского технологического института
local-only server
The server can only run on the client's local machine because it depends on local resources.
Сервер протокола контекстной модели, который интегрируется с движком VOICEVOX для обеспечения синтеза текста в речь и извлечения информации о говорящем, позволяя пользователям генерировать и воспроизводить голосовой аудиофайл из текста.
Related Resources
Related MCP Servers
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityFlicense-qualityA Model Context Protocol server that provides text-to-speech capabilities using the Kokoro TTS model, offering multiple voice options and customizable speech parameters.Last updated -239JavaScript
- -securityAlicense-qualityA Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.Last updated -TypeScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.Last updated -1154JavaScriptThe Unlicense