Skip to main content
Glama
xx5921

Pipecat MCP Server

by xx5921

PyPI Discord

Pipecat MCP Server

Pipecat MCP Server 为你的 AI 助手(Claude Code / Codex CLI)赋予语音交互能力,基于 Pipecat 实现。它兼容所有 MCP 客户端。

核心概念:MCP Server 暴露语音和屏幕捕获工具给 AI 客户端,但它本身不提供麦克风和扬声器。音频输入输出由独立的传输层处理,默认使用 WebRTC,你可以通过浏览器连接到本地服务。

AI 客户端(Claude Code、Codex)负责控制对话,不是音频设备。要听到、说出或看到,你需要通过音频传输层连接。

架构流程

你(浏览器) ──WebRTC──▶ Pipecat Agent (STT/TTS) ◀──MCP──▶ Claude Code / Codex CLI
   ▲                        ▲                                ▲
   │                        │                                │
   音频                  语音工具                       AI 大脑
 (听/说)           (listen/speak/start/stop)          (理解/决策)

Related MCP server: neko-mcp

环境要求

  • Python 3.10+

  • uv 包管理器

  • MiMo API Key(STT + TTS 云端服务,中文识别效果好于本地 Whisper)

安装

方式一:从 PyPI 安装

uv tool install pipecat-ai-mcp-server

方式二:克隆仓库本地安装

git clone https://github.com/xx5921/pipecat-mcp-server.git
cd pipecat-mcp-server
uv tool install -e .

配置环境变量

在项目目录创建 .env 文件:

# MiMo API Key(必填,用于语音识别和合成)
MIMO_API_KEY=你的MiMo_API_Key

# WebRTC Runner 配置(可选,以下为默认值)
PIPECAT_RUNNER_HOST=localhost
PIPECAT_RUNNER_PORT=7860
PIPECAT_RUNNER_TRANSPORT=webrtc

启动服务

pipecat-mcp-server

服务启动后:

  • MCP Server 运行在 http://localhost:9090/mcp

  • Pipecat Runner(WebRTC)运行在 http://localhost:7860


连接 Claude Code

步骤 1:添加 MCP Server

claude mcp add pipecat --transport http http://localhost:9090/mcp --scope user

Scope 选项:

  • local:仅当前项目生效

  • user:所有项目生效

  • project:存储在项目的 .mcp.json

步骤 2:配置权限自动批准

创建 .claude/settings.local.json

{
  "permissions": {
    "allow": [
      "mcp__pipecat__start",
      "mcp__pipecat__listen",
      "mcp__pipecat__speak",
      "mcp__pipecat__stop",
      "mcp__pipecat__list_windows",
      "mcp__pipecat__screen_capture",
      "mcp__pipecat__capture_screenshot"
    ]
  }
}

步骤 3:启动语音对话

  1. 确保 pipecat-mcp-server 已启动

  2. 在浏览器打开 http://localhost:7860,点击连接(这是你的麦克风和扬声器)

  3. 在 Claude Code 中说:"开始语音对话" 或直接说你想做的事

Claude 会自动调用以下流程:

  1. start() → 启动 Pipecat 语音代理

  2. listen() → 等待你说话,返回转录文字

  3. Claude 思考并生成回复

  4. speak(text) → TTS 播报回复

  5. 循环 listen/speak 直到你说结束

  6. stop() → 关闭语音通道


连接 Codex CLI

步骤 1:添加 MCP Server

codex mcp add pipecat --url http://localhost:9090/mcp

步骤 2:配置信任级别

在 Codex 中进入你的项目目录,Codex 会询问是否信任该目录。选择 Yes,这会在 ~/.codex/config.toml 中添加:

[projects."/path/to/your/project"]
trust_level = "trusted"

步骤 3:启动语音对话

  1. 确保 pipecat-mcp-server 已启动

  2. 在浏览器打开 http://localhost:7860,点击连接

  3. 在 Codex 中输入 /talk 或说 "开始语音对话"


屏幕捕获与分析

你可以把屏幕(或某个窗口)共享给 AI 助手,让它帮你分析看到的内容。

可用工具:

  • list_windows() — 列出所有可捕获的窗口

  • screen_capture(window_id) — 开始捕获指定窗口(不传则捕获全屏)

  • capture_screenshot() — 截取当前画面并保存为图片

使用示例:

  • "列出我打开的窗口" → 返回窗口列表

  • "捕获我的浏览器窗口" → 开始流式传输该窗口

  • "这个报错是什么原因?" → AI 分析你的屏幕画面

  • "这个 UI 设计怎么样?" → AI 给你反馈

支持平台:

  • macOS — ScreenCaptureKit,支持窗口级捕获

  • Linux (X11) — Xlib 窗口和全屏捕获

  • Windows — 全屏捕获


自定义服务

切换 STT / TTS

编辑 agent.py 中的 _create_stt_service()_create_tts_service() 方法:

# 默认使用 MiMo 云端服务(中文识别效果好)
def _create_stt_service(self):
    return MiMoSTTService(
        api_key=os.environ.get("MIMO_API_KEY"),
        language="zh",
    )

def _create_tts_service(self):
    return MiMoTTSService(
        api_key=os.environ.get("MIMO_API_KEY"),
        voice="mimo_default",
        language="zh",
    )

切换传输层

默认 WebRTC。如需使用 Daily 房间,在 .env 中设置:

PIPECAT_RUNNER_TRANSPORT=daily
DAILY_API_KEY=你的Daily_API_Key
DAILY_ROOM_URL=你的Daily房间地址

常见问题

Q: 说话后听到两次回复? A: Pipeline 中不要放置 LLM 服务。本项目的架构中,AI 客户端(Claude/Codex)是"大脑",Pipeline 只需要 STT + TTS。

Q: 浏览器界面上看不到 AI 的文字回复? A: TTS 会消费 LLMTextFrame 并输出音频帧,文字无法到达 UI。agent.py 已修复此问题:speak() 会同时推送文字到 assistant_aggregator 用于 UI 显示。

Q: 如何修改 TTS 音色? A: 可选音色:mimo_default冰糖茉莉苏打白桦MiaChloeMiloDean。在 agent.py_create_tts_service() 中修改 voice 参数即可。


更多资源

A
license - permissive license
-
quality - not tested
B
maintenance

Maintenance

Maintainers
Response time
Release cycle
Releases (12mo)
Commit activity

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/xx5921/pipecat-mcp-server'

If you have feedback or need assistance with the MCP directory API, please join our Discord server