Referenced as hosting the project page, though not directly integrated with the MCP server's functionality
Controls OBS Studio through WebSocket API for automated scene switching, overlay management, and media element control during live streams
Utilizes OpenAI's text-to-speech capabilities to provide voice responses during presentations
Presentation Buddy - 人工智能流媒体制作助理
项目链接:
Presentation Buddy 是一个 OBS 控制系统,它使用 Claude AI 来自动化流媒体制作,让个人创作者专注于内容交付而不是技术管理。
技术概述
此实现使用:
- OBS Studio :行业标准流媒体软件
- 基于 TypeScript 的 MCP 服务器:连接 Claude AI 和 OBS 的轻量级中继服务
- Claude AI :用于自然语言理解和生产决策
- OBS WebSocket API :用于直接控制场景切换、叠加和媒体元素
- 本地处理:所有功能都在演示者的机器上运行,以最大程度地减少延迟
关键组件
- MCP 服务器:将 Claude 的决策转换为 OBS WebSocket 命令的中间件
- 场景管理:根据内容和口头提示自动切换
- 媒体控制:智能处理覆盖、字幕和画中画元素
- 语音响应:文本转语音功能,可在演示过程中提供 AI 响应
执行
服务器与 OBS 建立 WebSocket 连接,并向 Claude 开放 API。当 Claude 从演讲者的演讲或屏幕内容中识别出制作需求时,它会通过 MCP 服务器发送命令,实时控制 OBS。
灵感
独自生活很困难。
演讲时,你需要调整镜头角度、播放幻灯片、添加字幕,并保持观众的注意力——所有这些都需要同时完成。我们需要一位能够掌控制作室的伙伴,这样每位独立创作者都能专注于故事本身,而不是按钮。
它的作用
Presentation Buddy是一款由人工智能驱动的流媒体和主持人助手。
它会监听屏幕上和麦克风后面发生的事情,然后:
- 在最佳时刻切换场景
- 自动弹出字幕、图形或画中画窗口
- 当你需要休息时,甚至会提供简短的画外音
可以把它想象成一个永不疲倦的微型生产者。
我们如何构建它
- 克劳德·艾聆听着暗示。
- 轻量级中继将这些提示发送到最流行的直播工具 OBS Studio。
- OBS 接受“更改摄像头”、“显示字幕”、“开始重播”等命令,然后创造奇迹。
- 只需进行少量的文本转语音操作,人工智能就能发出自己的声音。
所有这些都在本地运行,因此不存在云延迟或花哨的硬件。
我们遇到的挑战
- 构建一个封装原生 OBS API 的 MCP 服务器
- 实时语音响应时间
- 克劳德很好地遵循了好情节
- 我们无法通过 MCP 向 Claude 提供屏幕截图
我们引以为豪的成就
- 从标题幻灯片到动态内容的现场演示,无需任何人工点击。
- 将单人设置转变为无压力的广播。
我们学到了什么
- 如何在 Claude 和 Cursor 上构建和配置 MCP
Presentation Buddy 的下一步计划
- 观众互动——让聊天投票触发覆盖和民意调查。
- 一键安装程序– 任何流媒体都可以在几分钟内结识他们的新好友。
立即从个人主播变为工作室专业人士。
安装和设置
- 克隆此存储库
- 使用
npm install
安装依赖项 - 配置 OBS WebSocket 连接设置
- 使用
npm start
启动 MCP 服务器 - 将您的 Claude AI 实例连接到 MCP 服务器
- 启动您的 OBS 会话并让 Presentation Buddy 掌控
Claude MCP 配置
要设置 Claude 与 Presentation Buddy,您需要在 Cursor 或其他 Claude 界面中配置 MCP(机器控制协议)。这样,Claude 就可以通过我们的服务器控制 OBS。
Claude MCP 配置
将以下配置添加到您的 Claude 设置中:
用您的实际 Node.js 和服务器路径替换路径:
/path/to/your/node
- Node.js 可执行文件的路径(例如,/Users/username/.nvm/versions/node/v20.17.0/bin/node
)/path/to/obs-mcp-server-ts/build/index.js
- 构建服务器 JavaScript 文件的路径
对于 TTS-MCP 配置,请确保:
- 插入您的实际 OpenAI API 密钥
- 选择您喜欢的声音(默认:nova)
- 选择合适的文本转语音模型(默认值:gpt-4o-mini-tts)
OBS 设置
- 安装 OBS Studio(建议使用 28 及以上版本)
- 在OBS中启用WebSocket服务器:
- 转到工具→WebSocket 服务器设置
- 启用 WebSocket 服务器
- 设置端口(默认值:4455)
- 如果需要,配置身份验证
- 在 OBS 中创建场景:
- 主摄像头
- 演示文稿/幻灯片
- 画中画
- 您希望克劳德控制任何额外的场景
测试连接
配置完成后:
- 启动 OBS Studio
- 运行 MCP 服务器 (
npm start
) - 打开 Claude 并配置 MCP
- 测试切换场景等简单命令
执照
该项目可在 MIT 许可下使用。
You must be authenticated.
Tools
基于 TypeScript 的中间件,将 Claude AI 的决策转换为 OBS WebSocket 命令,使个人创作者无需手动技术管理即可实现流媒体制作的自动化。
Related Resources
Related MCP Servers
- -securityFlicense-qualityA TypeScript server enabling integration with the Brevo (Sendinblue) API for managing contacts, sending emails, and tracking email events in multi-channel applications like Claude Desktop.Last updated -TypeScript
- -securityAlicense-qualityA TypeScript implementation of a Model Context Protocol server that provides a frictionless framework for developers to build and deploy AI tools and prompts, focusing on developer experience with zero boilerplate and automatic tool registration.Last updated -6TypeScriptMIT License
- -securityAlicense-qualityA server that provides tools to control OBS Studio remotely via the OBS WebSocket protocol, enabling management of scenes, sources, streaming, and recording through an MCP client interface.Last updated -2TypeScriptGPL 2.0
- AsecurityAlicenseAqualityA TypeScript server that enhances AI assistants' capabilities when working with Starwind UI components, providing tools for project initialization, component installation, documentation access, and more.Last updated -615TypeScriptMIT License