Provides Docker Compose setup for easily running the required VOICEVOX engine locally.
The MCP server is implemented in TypeScript for type safety and developer experience.
Uses Zod for runtime schema validation within the MCP server implementation.
voicevox-mcp
Bei diesem Projekt handelt es sich um einen MCP-Server (Model Context Protocol), der mit der VOICEVOX-Engine zusammenarbeitet, um Sprache zu synthetisieren und Sprecherinformationen zu erhalten. Es ist in TypeScript implementiert und verwendet das MCP SDK.
Funktion
- Holen Sie sich Lautsprecherinformationen für die VOICEVOX-Engine (/speakers)
- Text auf einem angegebenen Lautsprecher in Sprache umwandeln und lokal abspielen (/speak)
- Nur Mac
aufstellen
Starten der VOICEVOX-Engine (Docker empfohlen)
Dadurch wird die VOICEVOX-Engine auf localhost:50021 gestartet.
Installieren und Erstellen von Abhängigkeiten
Anwendung
Beispiel für die Cursoreinstellung
Legen Sie VOICEVOX_API_URL nach Bedarf fest.
- Sie können mithilfe des Sprechertools eine Liste der Sprecher von Ihrem MCP-Client abrufen.
- Das Sprachtool kann Text in Sprache umwandeln und lokal wiedergeben (Mac wird empfohlen, da es den Befehl afplay verwendet).
Hauptabhängigkeiten
@modelcontextprotocol/sdk
zod
typescript
Vorsichtsmaßnahmen
- Zukünftige Verbesserungen
- Die Sprachsynthese ist nur verfügbar, wenn die VOICEVOX-Engine auf localhost:50021 ausgeführt wird.
- Wenn Sie eine andere Umgebung als Mac verwenden, ändern Sie den Afplay-Teil entsprechend.
Lizenz
MIT-Lizenz
You must be authenticated.
local-only server
The server can only run on the client's local machine because it depends on local resources.
Ein Model Context Protocol-Server, der in die VOICEVOX-Engine integriert ist, um Text-to-Speech-Synthese und Abrufen von Sprecherinformationen bereitzustellen, sodass Benutzer Sprachaudio aus Text generieren und wiedergeben können.
Related Resources
Related MCP Servers
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityFlicense-qualityA Model Context Protocol server that provides text-to-speech capabilities using the Kokoro TTS model, offering multiple voice options and customizable speech parameters.Last updated -239JavaScript
- -securityAlicense-qualityA Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.Last updated -TypeScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.Last updated -11764JavaScriptThe Unlicense