Puerta de enlace de voz MS Lucidia MCP

Un servidor de Protocolo de Contexto de Modelo (MCP) que proporciona funciones de texto a voz y de voz a texto mediante los servicios de voz integrados de Windows. Este servidor aprovecha la API de Voz de Windows (SAPI) nativa mediante comandos de PowerShell, lo que elimina la necesidad de API o servicios externos.

Características

Texto a voz (TTS) con voces SAPI de Windows
Conversión de voz a texto (STT) mediante el reconocimiento de voz de Windows
Interfaz web sencilla para realizar pruebas
Sin dependencias de API externas
Utiliza capacidades nativas de Windows

Prerrequisitos

Windows 10/11 con reconocimiento de voz habilitado
Node.js 16+
PowerShell

Instalación

Clonar el repositorio:

git clone https://github.com/ExpressionsBot/MS-Lucidia-Voice-Gateway-MCP.git cd MS-Lucidia-Voice-Gateway-MCP

Instalar dependencias:

npm install

Construir el proyecto:

npm run build

Uso

Interfaz de prueba

Inicie el servidor de pruebas:

npm run test

Abra http://localhost:3000 en su navegador
Utilice la interfaz web para probar las capacidades TTS y STT

Herramientas disponibles

texto a voz

Convierte texto en voz mediante Windows SAPI.

Parámetros:

text (obligatorio): El texto que se convertirá a voz
voice (opcional): La voz a utilizar (por ejemplo, "Microsoft David Desktop")
speed (opcional): Velocidad de voz de 0,5 a 2,0 (predeterminado: 1,0)

Ejemplo:

fetch('http://localhost:3000/tts', { method: 'POST', headers: { 'Content-Type': 'application/json' }, body: JSON.stringify({ text: "Hello, this is a test", voice: "Microsoft David Desktop", speed: 1.0 }) });

voz a texto

Graba audio y lo convierte en texto mediante el reconocimiento de voz de Windows.

Parámetros:

duration (opcional): Duración de la grabación en segundos (predeterminado: 5, máximo: 60)

Ejemplo:

fetch('http://localhost:3000/stt', { method: 'POST', headers: { 'Content-Type': 'application/json' }, body: JSON.stringify({ duration: 5 }) }).then(response => response.json()) .then(data => console.log(data.text));

Solución de problemas

Asegúrese de que el reconocimiento de voz de Windows esté habilitado:
- Abrir la configuración de Windows
- Vaya a Tiempo y lenguaje > Habla
- Habilitar el reconocimiento de voz
Comprobar voces disponibles:
- Abra PowerShell y ejecute: GXP7
Prueba de reconocimiento de voz:
- Abrir Reconocimiento de voz en la configuración de Windows
- Ejecute el asistente de configuración si aún no lo ha hecho
- Comprueba que Windows puede reconocer tu voz

Contribuyendo

Bifurcar el repositorio
Crea tu rama de funciones
Confirme sus cambios
Empujar hacia la rama
Crear una nueva solicitud de extracción

Licencia

Instituto Tecnológico de Massachusetts (MIT)

This server cannot be installed

-

security - not tested

F

license - not found

-

quality - not tested

How are these scores calculated?

local-only server

The server can only run on the client's local machine because it depends on local resources.

Un servidor que proporciona funcionalidades de texto a voz y de voz a texto utilizando los servicios de voz nativos de Windows sin dependencias externas.

Related Resources

Reddit Discussion about this server

Related MCP Servers

Kokoro TTS MCP Server
giannisanni
-
security
F
license
-
quality
Provides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.
Last updated -
10
Gladia MCPofficial
-
security
A
license
-
quality
Official Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.
Edge-TTS MCP Server
yuiseki
-
security
F
license
-
quality
A Model Context Protocol server that provides text-to-speech functionality for AI agents using Microsoft Edge's text-to-speech technology, supporting multiple voices, languages, and voice customization.
Last updated -
5
VOICEVOX MCP Server
Yuki10Kobayashi
A
security
A
license
A
quality
A Model Context Protocol server that integrates with VOICEVOX engine to provide text-to-speech synthesis and speaker information retrieval, allowing users to generate and play voice audio from text.
Last updated -
2
MIT License

View all related MCP servers

MS-Lucidia-Voice-Gateway-MCP

Puerta de enlace de voz MS Lucidia MCP

Características

Prerrequisitos

Instalación

Uso

Interfaz de prueba

Herramientas disponibles

texto a voz

voz a texto

Solución de problemas

Contribuyendo

Licencia

Related Resources

Related MCP Servers

Kokoro TTS MCP Server

Gladia MCPofficial

Edge-TTS MCP Server

VOICEVOX MCP Server

Appeared in Searches

New MCP Servers

MCP directory API