Rime MCP

The Unlicense
144
1
  • Apple
  • Linux

ライムMCP

Rime APIを使用してテキスト読み上げ機能を提供するモデルコンテキストプロトコル(MCP)サーバー。このサーバーはオーディオをダウンロードし、システムのネイティブオーディオプレーヤーを使用して再生します。

特徴

  • テキストを音声に変換し、システムオーディオを通じて再生するspeakツールを公開します。
  • Rimeの高品質音声合成APIを使用

要件

  • Node.js 16.x 以上
  • 動作するオーディオ出力デバイス
  • macOS: afplayを使用

以下は、Claude からのテストされていないサンプル コードです 🤙✨

  • Windows: 組み込みの Media.SoundPlayer (PowerShell)
  • Linux: mpg123、mplayer、aplay、またはffplay

MCP構成

"ref": { "command": "npx", "args": ["rime-mcp"], "env": { RIME_API_KEY=your_api_key_here # Optional configuration RIME_GUIDANCE="<guide how the agent speaks>" RIME_WHO_TO_ADDRESS="<your name>" RIME_WHEN_TO_SPEAK="<tell the agent when to speak>" RIME_VOICE="cove" } }

オプションの環境変数はすべてツール定義の一部であり、

すべての音声オプションがここにリストされます

API キーはRime ダッシュボードから取得できます。

次の環境変数を使用して動作をカスタマイズできます。

  • RIME_GUIDANCE : スピークツールをいつ、どのように使用するかについての主な説明
  • RIME_WHO_TO_ADDRESS : スピーチの宛先 (デフォルト: "user")
  • RIME_WHEN_TO_SPEAK : ツールを使用するタイミング (デフォルト: 「発話を求められた時、またはコマンドを完了した時」)
  • RIME_VOICE : 使用するデフォルトの音声(デフォルト: "cove")

使用例

例1: コーディングエージェントのアナウンス

"RIME_WHEN_TO_SPEAK": "Always conclude your answers by speaking.", "RIME_GUIDANCE": "Give a brief overview of the answer. If any files were edited, list them."

例2: 最近の子供たちの話し方を学ぶ

RIME_GUIDANCE="Use phrases and slang common among Gen Alpha." RIME_WHO_TO_ADDRESS="Matt" RIME_WHEN_TO_SPEAK="when asked to speak"

例3: 文脈に応じた異なる言語

RIME_VOICE="use 'cove' when talking about Typescript and 'antoine' when talking about Python"

発達

  1. 依存関係をインストールします:
npm install
  1. サーバーを構築します。
npm run build
  1. ホットリロードを使用して開発モードで実行します。
npm run dev

ライセンス

マサチューセッツ工科大学

-
security - not tested
A
license - permissive license
-
quality - not tested

Rime の音声合成 API を使用して、AI モデルがデバイスのネイティブ オーディオ システムを通じて高品質のテキスト読み上げオーディオを生成および再生できるようにするモデル コンテキスト プロトコル サーバー。

  1. Features
    1. Requirements
      1. MCP Configuration
        1. Example use cases
          1. Example 1: Coding agent announcements
          2. Example 2: Learn how the kids talk these days
          3. Example 3: Different languages based on context
        2. Development
          1. License
            ID: 3a17xnerpt