MS-Lucidia-Voice-Gateway-MCP

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Used for version control and distribution of the MCP server code.

  • Hosts the repository for the MCP server, enabling collaboration and distribution.

  • Provides a runtime environment for the MCP server, allowing it to execute JavaScript code for handling text-to-speech and speech-to-text requests.

Puerta de enlace de voz MS Lucidia MCP

Un servidor de Protocolo de Contexto de Modelo (MCP) que proporciona funciones de texto a voz y de voz a texto mediante los servicios de voz integrados de Windows. Este servidor aprovecha la API de Voz de Windows (SAPI) nativa mediante comandos de PowerShell, lo que elimina la necesidad de API o servicios externos.

Características

  • Texto a voz (TTS) con voces SAPI de Windows
  • Conversión de voz a texto (STT) mediante el reconocimiento de voz de Windows
  • Interfaz web sencilla para realizar pruebas
  • Sin dependencias de API externas
  • Utiliza capacidades nativas de Windows

Prerrequisitos

  • Windows 10/11 con reconocimiento de voz habilitado
  • Node.js 16+
  • PowerShell

Instalación

  1. Clonar el repositorio:
git clone https://github.com/ExpressionsBot/MS-Lucidia-Voice-Gateway-MCP.git cd MS-Lucidia-Voice-Gateway-MCP
  1. Instalar dependencias:
npm install
  1. Construir el proyecto:
npm run build

Uso

Interfaz de prueba

  1. Inicie el servidor de pruebas:
npm run test
  1. Abra http://localhost:3000 en su navegador
  2. Utilice la interfaz web para probar las capacidades TTS y STT

Herramientas disponibles

texto a voz

Convierte texto en voz mediante Windows SAPI.

Parámetros:

  • text (obligatorio): El texto que se convertirá a voz
  • voice (opcional): La voz a utilizar (por ejemplo, "Microsoft David Desktop")
  • speed (opcional): Velocidad de voz de 0,5 a 2,0 (predeterminado: 1,0)

Ejemplo:

fetch('http://localhost:3000/tts', { method: 'POST', headers: { 'Content-Type': 'application/json' }, body: JSON.stringify({ text: "Hello, this is a test", voice: "Microsoft David Desktop", speed: 1.0 }) });

voz a texto

Graba audio y lo convierte en texto mediante el reconocimiento de voz de Windows.

Parámetros:

  • duration (opcional): Duración de la grabación en segundos (predeterminado: 5, máximo: 60)

Ejemplo:

fetch('http://localhost:3000/stt', { method: 'POST', headers: { 'Content-Type': 'application/json' }, body: JSON.stringify({ duration: 5 }) }).then(response => response.json()) .then(data => console.log(data.text));

Solución de problemas

  1. Asegúrese de que el reconocimiento de voz de Windows esté habilitado:
    • Abrir la configuración de Windows
    • Vaya a Tiempo y lenguaje > Habla
    • Habilitar el reconocimiento de voz
  2. Comprobar voces disponibles:
    • Abra PowerShell y ejecute: GXP7
  3. Prueba de reconocimiento de voz:
    • Abrir Reconocimiento de voz en la configuración de Windows
    • Ejecute el asistente de configuración si aún no lo ha hecho
    • Comprueba que Windows puede reconocer tu voz

Contribuyendo

  1. Bifurcar el repositorio
  2. Crea tu rama de funciones
  3. Confirme sus cambios
  4. Empujar hacia la rama
  5. Crear una nueva solicitud de extracción

Licencia

Instituto Tecnológico de Massachusetts (MIT)

-
security - not tested
F
license - not found
-
quality - not tested

Un servidor que proporciona funcionalidades de texto a voz y de voz a texto utilizando los servicios de voz nativos de Windows sin dependencias externas.

  1. Features
    1. Prerequisites
      1. Installation
        1. Usage
          1. Testing Interface
          2. Available Tools
        2. Troubleshooting
          1. Contributing
            1. License
              ID: vtxakkcnxi