MS-Lucidia-Voice-Gateway-MCP

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Used for version control and distribution of the MCP server code.

  • Hosts the repository for the MCP server, enabling collaboration and distribution.

  • Provides a runtime environment for the MCP server, allowing it to execute JavaScript code for handling text-to-speech and speech-to-text requests.

MS-Lucidia-Voice-Gateway-MCP

Windows の組み込み音声サービスを使用して、テキスト読み上げ機能と音声テキスト変換機能を提供するモデルコンテキストプロトコル (MCP) サーバーです。このサーバーは、PowerShell コマンドを通じてネイティブの Windows Speech API (SAPI) を活用するため、外部 API やサービスは必要ありません。

特徴

  • Windows SAPI 音声を使用したテキスト読み上げ (TTS)
  • Windows 音声認識を使用した音声テキスト変換 (STT)
  • テスト用のシンプルなWebインターフェース
  • 外部APIへの依存なし
  • ネイティブのWindows機能を使用する

前提条件

  • 音声認識が有効になっているWindows 10/11
  • Node.js 16以上
  • パワーシェル

インストール

  1. リポジトリをクローンします。
git clone https://github.com/ExpressionsBot/MS-Lucidia-Voice-Gateway-MCP.git cd MS-Lucidia-Voice-Gateway-MCP
  1. 依存関係をインストールします:
npm install
  1. プロジェクトをビルドします。
npm run build

使用法

テストインターフェース

  1. テスト サーバーを起動します。
npm run test
  1. ブラウザでhttp://localhost:3000を開きます。
  2. Webインターフェースを使用してTTSおよびSTT機能をテストする

利用可能なツール

テキスト読み上げ

Windows SAPI を使用してテキストを音声に変換します。

パラメータ:

  • text (必須): 音声に変換するテキスト
  • voice (オプション): 使用する音声 (例: "Microsoft David Desktop")
  • speed (オプション):0.5~2.0の音声速度(デフォルト:1.0)

例:

fetch('http://localhost:3000/tts', { method: 'POST', headers: { 'Content-Type': 'application/json' }, body: JSON.stringify({ text: "Hello, this is a test", voice: "Microsoft David Desktop", speed: 1.0 }) });

音声テキスト変換

Windows 音声認識を使用して音声を録音し、テキストに変換します。

パラメータ:

  • duration (オプション):録画時間(秒)(デフォルト:5、最大:60)

例:

fetch('http://localhost:3000/stt', { method: 'POST', headers: { 'Content-Type': 'application/json' }, body: JSON.stringify({ duration: 5 }) }).then(response => response.json()) .then(data => console.log(data.text));

トラブルシューティング

  1. Windows 音声認識が有効になっていることを確認します。
    • Windowsの設定を開く
    • 「時間と言語」>「スピーチ」へ移動
    • 音声認識を有効にする
  2. 利用可能な音声を確認してください:
    • PowerShellを開いて実行: GXP7
  3. 音声認識をテストする:
    • Windows設定で音声認識を開く
    • まだ実行していない場合はセットアップウィザードを実行します
    • Windowsがあなたの声を認識できるかテストする

貢献

  1. リポジトリをフォークする
  2. 機能ブランチを作成する
  3. 変更をコミットする
  4. ブランチにプッシュする
  5. 新しいプルリクエストを作成する

ライセンス

マサチューセッツ工科大学

-
security - not tested
F
license - not found
-
quality - not tested

外部依存なしで Windows のネイティブ音声サービスを使用して、テキスト読み上げ機能および音声テキスト変換機能を提供するサーバー。

  1. Features
    1. Prerequisites
      1. Installation
        1. Usage
          1. Testing Interface
          2. Available Tools
        2. Troubleshooting
          1. Contributing
            1. License
              ID: vtxakkcnxi