Skip to main content
Glama

MS-Lucidia-Voice-Gateway-MCP

MS-Lucidia-语音网关-MCP

一个模型上下文协议 (MCP) 服务器,使用 Windows 内置语音服务提供文本转语音和语音转文本功能。此服务器通过 PowerShell 命令利用本机 Windows 语音 API (SAPI),从而无需外部 API 或服务。

特征

  • 使用 Windows SAPI 语音的文本转语音 (TTS)
  • 使用 Windows 语音识别进行语音转文本 (STT)
  • 用于测试的简单 Web 界面
  • 无外部 API 依赖
  • 使用原生 Windows 功能

先决条件

  • 启用语音识别的 Windows 10/11
  • Node.js 16+
  • PowerShell

安装

  1. 克隆存储库:
git clone https://github.com/ExpressionsBot/MS-Lucidia-Voice-Gateway-MCP.git cd MS-Lucidia-Voice-Gateway-MCP
  1. 安装依赖项:
npm install
  1. 构建项目:
npm run build

用法

测试接口

  1. 启动测试服务器:
npm run test
  1. 在浏览器中打开http://localhost:3000
  2. 使用 Web 界面测试 TTS 和 STT 功能

可用工具

文本转语音

使用 Windows SAPI 将文本转换为语音。

参数:

  • text (必需):要转换为语音的文本
  • voice (可选):要使用的语音(例如“Microsoft David Desktop”)
  • speed (可选):语速从 0.5 到 2.0(默认值:1.0)

例子:

fetch('http://localhost:3000/tts', { method: 'POST', headers: { 'Content-Type': 'application/json' }, body: JSON.stringify({ text: "Hello, this is a test", voice: "Microsoft David Desktop", speed: 1.0 }) });
语音转文本

录制音频并使用 Windows 语音识别将其转换为文本。

参数:

  • duration (可选):录制持续时间(秒)(默认值:5,最大值:60)

例子:

fetch('http://localhost:3000/stt', { method: 'POST', headers: { 'Content-Type': 'application/json' }, body: JSON.stringify({ duration: 5 }) }).then(response => response.json()) .then(data => console.log(data.text));

故障排除

  1. 确保 Windows 语音��别已启用:
    • 打开 Windows 设置
    • 前往“时间和语言”>“语音”
    • 启用语音识别
  2. 检查可用的声音:
    • 打开 PowerShell 并运行:GXP7
  3. 测试语音识别:
    • 在 Windows 设置中打开语音识别
    • 如果尚未完成,请运行安装向导
    • 测试 Windows 是否可以识别你的声音

贡献

  1. 分叉存储库
  2. 创建你的功能分支
  3. 提交你的更改
  4. 推送到分支
  5. 创建新的 Pull 请求

执照

麻省理工学院

-
security - not tested
F
license - not found
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

使用 Windows 原生语音服务提供文本转语音和语音转文本功能的服务器,无需外部依赖。

  1. 特征
    1. 先决条件
      1. 安装
        1. 用法
          1. 测试接口
          2. 可用工具
        2. 故障排除
          1. 贡献
            1. 执照

              Related MCP Servers

              • -
                security
                F
                license
                -
                quality
                Provides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.
                Last updated -
                2
                Python
              • -
                security
                F
                license
                -
                quality
                A Model Context Protocol server that provides text-to-speech capabilities using the Kokoro TTS model, offering multiple voice options and customizable speech parameters.
                Last updated -
                239
                JavaScript
                • Apple
                • Linux
              • -
                security
                A
                license
                -
                quality
                A Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.
                Last updated -
                TypeScript
                MIT License

              View all related MCP servers

              MCP directory API

              We provide all the information about MCP servers via our MCP API.

              curl -X GET 'https://glama.ai/api/mcp/v1/servers/ExpressionsBot/MS-Lucidia-Voice-Gateway-MCP'

              If you have feedback or need assistance with the MCP directory API, please join our Discord server