voicevox-mcp
Bei diesem Projekt handelt es sich um einen MCP-Server (Model Context Protocol), der mit der VOICEVOX-Engine zusammenarbeitet, um Sprache zu synthetisieren und Sprecherinformationen zu erhalten. Es ist in TypeScript implementiert und verwendet das MCP SDK.
Funktion
- Holen Sie sich Lautsprecherinformationen für die VOICEVOX-Engine (/speakers)
- Text auf einem angegebenen Lautsprecher in Sprache umwandeln und lokal abspielen (/speak)
- Nur Mac
aufstellen
Starten der VOICEVOX-Engine (Docker empfohlen)
Dadurch wird die VOICEVOX-Engine auf localhost:50021 gestartet.
Installieren und Erstellen von Abhängigkeiten
Anwendung
Beispiel für die Cursoreinstellung
Legen Sie VOICEVOX_API_URL nach Bedarf fest.
- Sie können mithilfe des Sprechertools eine Liste der Sprecher von Ihrem MCP-Client abrufen.
- Das Sprachtool kann Text in Sprache umwandeln und lokal wiedergeben (Mac wird empfohlen, da es den Befehl afplay verwendet).
Hauptabhängigkeiten
@modelcontextprotocol/sdk
zod
typescript
Vorsichtsmaßnahmen
- Zukünftige Verbesserungen
- Die Sprachsynthese ist nur verfügbar, wenn die VOICEVOX-Engine auf localhost:50021 ausgeführt wird.
- Wenn Sie eine andere Umgebung als Mac verwenden, ändern Sie den Afplay-Teil entsprechend.
Lizenz
MIT-Lizenz
local-only server
The server can only run on the client's local machine because it depends on local resources.
Ein Model Context Protocol-Server, der in die VOICEVOX-Engine integriert ist, um Text-to-Speech-Synthese und Abrufen von Sprecherinformationen bereitzustellen, sodass Benutzer Sprachaudio aus Text generieren und wiedergeben können.
Related Resources
Related MCP Servers
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityFlicense-qualityA Model Context Protocol server that provides text-to-speech capabilities using the Kokoro TTS model, offering multiple voice options and customizable speech parameters.Last updated -239JavaScript
- -securityAlicense-qualityA Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.Last updated -TypeScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.Last updated -1154JavaScriptThe Unlicense