Skip to main content
Glama

MS-Lucidia-Voice-Gateway-MCP

Puerta de enlace de voz MS Lucidia MCP

Un servidor de Protocolo de Contexto de Modelo (MCP) que proporciona funciones de texto a voz y de voz a texto mediante los servicios de voz integrados de Windows. Este servidor aprovecha la API de Voz de Windows (SAPI) nativa mediante comandos de PowerShell, lo que elimina la necesidad de API o servicios externos.

Características

  • Texto a voz (TTS) con voces SAPI de Windows
  • Conversión de voz a texto (STT) mediante el reconocimiento de voz de Windows
  • Interfaz web sencilla para realizar pruebas
  • Sin dependencias de API externas
  • Utiliza capacidades nativas de Windows

Prerrequisitos

  • Windows 10/11 con reconocimiento de voz habilitado
  • Node.js 16+
  • PowerShell

Instalación

  1. Clonar el repositorio:
git clone https://github.com/ExpressionsBot/MS-Lucidia-Voice-Gateway-MCP.git cd MS-Lucidia-Voice-Gateway-MCP
  1. Instalar dependencias:
npm install
  1. Construir el proyecto:
npm run build

Uso

Interfaz de prueba

  1. Inicie el servidor de pruebas:
npm run test
  1. Abra http://localhost:3000 en su navegador
  2. Utilice la interfaz web para probar las capacidades TTS y STT

Herramientas disponibles

texto a voz

Convierte texto en voz mediante Windows SAPI.

Parámetros:

  • text (obligatorio): El texto que se convertirá a voz
  • voice (opcional): La voz a utilizar (por ejemplo, "Microsoft David Desktop")
  • speed (opcional): Velocidad de voz de 0,5 a 2,0 (predeterminado: 1,0)

Ejemplo:

fetch('http://localhost:3000/tts', { method: 'POST', headers: { 'Content-Type': 'application/json' }, body: JSON.stringify({ text: "Hello, this is a test", voice: "Microsoft David Desktop", speed: 1.0 }) });
voz a texto

Graba audio y lo convierte en texto mediante el reconocimiento de voz de Windows.

Parámetros:

  • duration (opcional): Duración de la grabación en segundos (predeterminado: 5, máximo: 60)

Ejemplo:

fetch('http://localhost:3000/stt', { method: 'POST', headers: { 'Content-Type': 'application/json' }, body: JSON.stringify({ duration: 5 }) }).then(response => response.json()) .then(data => console.log(data.text));

Solución de problemas

  1. Asegúrese de que el reconocimiento de voz de Windows esté habilitado:
    • Abrir la configuración de Windows
    • Vaya a Tiempo y lenguaje > Habla
    • Habilitar el reconocimiento de voz
  2. Comprobar voces disponibles:
    • Abra PowerShell y ejecute: GXP7
  3. Prueba de reconocimiento de voz:
    • Abrir Reconocimiento de voz en la configuración de Windows
    • Ejecute el asistente de configuración si aún no lo ha hecho
    • Comprueba que Windows puede reconocer tu voz

Contribuyendo

  1. Bifurcar el repositorio
  2. Crea tu rama de funciones
  3. Confirme sus cambios
  4. Empujar hacia la rama
  5. Crear una nueva solicitud de extracción

Licencia

Instituto Tecnológico de Massachusetts (MIT)

-
security - not tested
F
license - not found
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Un servidor que proporciona funcionalidades de texto a voz y de voz a texto utilizando los servicios de voz nativos de Windows sin dependencias externas.

  1. Características
    1. Prerrequisitos
      1. Instalación
        1. Uso
          1. Interfaz de prueba
          2. Herramientas disponibles
        2. Solución de problemas
          1. Contribuyendo
            1. Licencia

              Related MCP Servers

              • -
                security
                F
                license
                -
                quality
                Provides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.
                Last updated -
                2
                Python
              • -
                security
                F
                license
                -
                quality
                A Model Context Protocol server that provides text-to-speech capabilities using the Kokoro TTS model, offering multiple voice options and customizable speech parameters.
                Last updated -
                239
                JavaScript
                • Apple
                • Linux
              • -
                security
                A
                license
                -
                quality
                A Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.
                Last updated -
                TypeScript
                MIT License

              View all related MCP servers

              MCP directory API

              We provide all the information about MCP servers via our MCP API.

              curl -X GET 'https://glama.ai/api/mcp/v1/servers/ExpressionsBot/MS-Lucidia-Voice-Gateway-MCP'

              If you have feedback or need assistance with the MCP directory API, please join our Discord server