Skip to main content
Glama

AivisSpeech MCP Server

by kentaro

Servidor MCP de AivisSpeech

Una implementación de servidor de Protocolo de Contexto de Modelo (MCP) para AivisSpeech. Este servidor funciona con AivisSpeech Engine para proporcionar una interfaz para la síntesis de voz. A través del protocolo MCP, las capacidades de síntesis de voz de AivisSpeech pueden ser utilizadas fácilmente por aplicaciones como asistentes de IA.

descripción general

El servidor MCP de AivisSpeech ofrece las siguientes funciones:

  • Puntos finales de API compatibles con el protocolo MCP
  • Síntesis de voz de alta calidad en colaboración con AivisSpeech Engine
  • Diseño seguro de tipos con TypeScript
  • Arquitectura fácil de configurar y altamente escalable

Prerrequisitos

  • Node.js 18.x o superior
  • npm 9.x o superior
  • AivisSpeech Engine (requiere instalación por separado)

instalar

# リポジトリをクローン git clone https://github.com/kentaro/aivis-speech-mcp.git cd aivis-speech-mcp # 依存関係のインストール npm install # ビルド npm run build # 環境変数の設定 cp .env.sample .env # .envファイルを編集して、必要な設定を行ってください # Cursor MCPの設定 cp .cursor/mcp.json.sample .cursor/mcp.json # mcp.jsonファイル内の"/path/to/aivis-speech-mcp/dist/index.js"を # 実際のプロジェクトパスに書き換えてください # 例: "C:/Users/username/path/to/aivis-speech-mcp/dist/index.js"

Configuración del entorno

En su archivo .env , configure lo siguiente:

# AivisSpeech API Configuration AIVIS_SPEECH_API_URL=http://localhost:10101 # AivisSpeech EngineのAPIエンドポイント # Speaker Configuration AIVIS_SPEECH_SPEAKER_ID=888753760 # デフォルトのスピーカーID

Configuración del cursor MCP

En .cursor/mcp.json , configure lo siguiente:

{ "mcpServers": { "AivisSpeech-MCP": { "command": "node", "args": ["/path/to/aivis-speech-mcp/dist/index.js"] } } }

Reemplace /path/to/aivis-speech-mcp/dist/index.js con la ruta a su proyecto. Para Windows, escape la barra invertida o utilice una barra diagonal. Ejemplo: "C:/Users/username/path/to/aivis-speech-mcp/dist/index.js"

Cómo utilizar

Modo de desarrollo

Durante el desarrollo puedes iniciar el servidor con recarga en caliente con el siguiente comando:

npm run dev

Construir

Para compilar para producción, ejecute el siguiente comando:

npm run build

Modo de producción

Después de la compilación, inicie el servidor en modo de producción con el siguiente comando:

npm start

prueba

Para ejecutar las pruebas utilice el siguiente comando:

npm test

arquitectura

El servidor MCP de AivisSpeech consta de los siguientes componentes:

  • Servicio MCP : proporciona un servidor que cumple con el Protocolo de contexto de modelo y procesa solicitudes de los clientes.
  • Servicio AivisSpeech : se comunica con la API del motor AivisSpeech y realiza la síntesis de voz.

Especificaciones API

Proporciona puntos finales de API que cumplen con el protocolo MCP. Las características principales incluyen:

  • Síntesis de voz (generación de voz a partir de texto)
  • Obtener información del orador
  • Configuración de estilo de audio

Para conocer las especificaciones detalladas de la API, consulte la Especificación de la API de AivisSpeech Engine .

Integración con el protocolo MCP

Este servidor implementa el Protocolo de Contexto de Modelo (MCP) y puede ser utilizado sin problemas por aplicaciones como asistentes de IA. Para obtener más información sobre el protocolo MCP, consulte la documentación oficial de MCP .

solución de problemas

Problemas comunes y soluciones:

  • No se puede conectar a AivisSpeech Engine : Verifique si AIVIS_SPEECH_API_URL en el archivo .env está configurado correctamente
  • Sin sonido : Verifique la configuración de audio de su sistema y asegúrese de que esté seleccionado el dispositivo de audio correcto
  • No se encontró ID de orador : asegúrese de que AivisSpeech Engine esté funcionando correctamente y verifique si hay ID de orador disponibles.

contribución

Informe errores o solicitudes de funciones a través de nuestro rastreador de problemas de GitHub. Las solicitudes de extracción también son bienvenidas.

licencia

Instituto Tecnológico de Massachusetts (MIT)

Expresiones de gratitud

-
security - not tested
F
license - not found
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Un servidor de protocolo de contexto de modelo que permite a los asistentes de IA utilizar las capacidades de síntesis de voz de alta calidad de AivisSpeech Engine a través de una interfaz API estandarizada.

  1. descripción general
    1. Prerrequisitos
      1. instalar
        1. Configuración del entorno
          1. Configuración del cursor MCP
            1. Cómo utilizar
              1. Modo de desarrollo
              2. Construir
              3. Modo de producción
              4. prueba
            2. arquitectura
              1. Especificaciones API
                1. Integración con el protocolo MCP
                  1. solución de problemas
                    1. contribución
                      1. licencia
                        1. Expresiones de gratitud

                          Related MCP Servers

                          • -
                            security
                            A
                            license
                            -
                            quality
                            A server that enables Claude 3.7 and other AI agents to access VOICEVOX-compatible speech synthesis engines (AivisSpeech, VOICEVOX, COEIROINK) through the Model Context Protocol.
                            Last updated -
                            2
                            TypeScript
                            MIT License
                            • Linux
                          • A
                            security
                            A
                            license
                            A
                            quality
                            A Model Context Protocol server that enables AI assistants to generate images, text, and audio through the Pollinations APIs without requiring authentication.
                            Last updated -
                            7
                            48
                            19
                            JavaScript
                            MIT License
                            • Linux
                            • Apple
                          • A
                            security
                            A
                            license
                            A
                            quality
                            A Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.
                            Last updated -
                            1
                            15
                            4
                            JavaScript
                            The Unlicense
                            • Apple
                            • Linux
                          • -
                            security
                            A
                            license
                            -
                            quality
                            A Model Context Protocol server that enables AI assistants like Claude to initiate and manage real-time voice calls using Twilio and OpenAI's voice models.
                            Last updated -
                            14
                            TypeScript
                            MIT License
                            • Apple

                          View all related MCP servers

                          MCP directory API

                          We provide all the information about MCP servers via our MCP API.

                          curl -X GET 'https://glama.ai/api/mcp/v1/servers/kentaro/aivis-speech-mcp'

                          If you have feedback or need assistance with the MCP directory API, please join our Discord server