Presentation Buddy - 人工智能流媒体制作助理
项目链接:
Presentation Buddy 是一个 OBS 控制系统,它使用 Claude AI 来自动化流媒体制作,让个人创作者专注于内容交付而不是技术管理。
技术概述
此实现使用:
- OBS Studio :行业标准流媒体软件
- 基于 TypeScript 的 MCP 服务器:连接 Claude AI 和 OBS 的轻量级中继服务
- Claude AI :用于自然语言理解和生产决策
- OBS WebSocket API :用于直接控制场景切换、叠加和媒体元素
- 本地处理:所有功能都在演示者的机器上运行,以最大程度地减少延迟
关键组件
- MCP 服务器:将 Claude 的决策转换为 OBS WebSocket 命令的中间件
- 场景管理:根据内容和口头提示自动切换
- 媒体控制:智能处理覆盖、字幕和画中画元素
- 语音响应:文本转语音功能,可在演示过程中提供 AI 响应
执行
服务器与 OBS 建立 WebSocket 连接,并向 Claude 开放 API。当 Claude 从演讲者的演讲或屏幕内容中识别出制作需求时,它会通过 MCP 服务器发送命令,实时控制 OBS。
灵感
独自生活很困难。
演讲时,你需要调整镜头角度、播放幻灯片、添加字幕,并保持观众的注意力——所有这些都需要同时完成。我们需要一位能够掌控制作室的伙伴,这样每位独立创作者都能专注于故事本身,而不是按钮。
它的作用
Presentation Buddy是一款由人工智能驱动的流媒体和主持人助手。
它会监听屏幕上和麦克风后面发生的事情,然后:
- 在最佳时刻切换场景
- 自动弹出字幕、图形或画中画窗口
- 当你需要休息时,甚至会提供简短的画外音
可以把它想象成一个永不疲倦的微型生产者。
我们如何构建它
- 克劳德·艾聆听着暗示。
- 轻量级中继将这些提示发送到最流行的直播工具 OBS Studio。
- OBS 接受“更改摄像头”、“显示字幕”、“开始重播”等命令,然后创造奇迹。
- 只需进行少量的文本转语音操作,人工智能就能发出自己的声音。
所有这些都在本地运行,因此不存在云延迟或花哨的硬件。
我们遇到的挑战
- 构建一个封装原生 OBS API 的 MCP 服务器
- 实时语音响应时间
- 克劳德很好地遵循了好情节
- 我们无法通过 MCP 向 Claude 提供屏幕截图
我们引以为豪的成就
- 从标题幻灯片到动态内容的现场演示,无需任何人工点击。
- 将单人设置转变为无压力的广播。
我们学到了什么
- 如何在 Claude 和 Cursor 上构建和配置 MCP
Presentation Buddy 的下一步计划
- 观众互动——让聊天投票触发覆盖和民意调查。
- 一键安装程序– 任何流媒体都可以在几分钟内结识他们的新好友。
立即从个人主播变为工作室专业人士。
安装和设置
- 克隆此存储库
- 使用
npm install
安装依赖项 - 配置 OBS WebSocket 连接设置
- 使用
npm start
启动 MCP 服务器 - 将您的 Claude AI 实例连接到 MCP 服务器
- 启动您的 OBS 会话并让 Presentation Buddy 掌控
Claude MCP 配置
要设置 Claude 与 Presentation Buddy,您需要在 Cursor 或其他 Claude 界面中配置 MCP(机器控制协议)。这样,Claude 就可以通过我们的服务器控制 OBS。
Claude MCP 配置
将以下配置添加到您的 Claude 设置中:
用您的实际 Node.js 和服务器路径替换路径:
/path/to/your/node
- Node.js 可执行文件的路径(例如,/Users/username/.nvm/versions/node/v20.17.0/bin/node
)/path/to/obs-mcp-server-ts/build/index.js
- 构建服务器 JavaScript 文件的路径
对于 TTS-MCP 配置,请确保:
- 插入您的实际 OpenAI API 密钥
- 选择您喜欢的声音(默认:nova)
- 选择合适的文本转语音模型(默认值:gpt-4o-mini-tts)
OBS 设置
- 安装 OBS Studio(建议使用 28 及以上版本)
- 在OBS中启用WebSocket服务器:
- 转到工具→WebSocket 服务器设置
- 启用 WebSocket 服务器
- 设置端口(默认值:4455)
- 如果需要,配置身份验证
- 在 OBS 中创建场景:
- 主摄像头
- 演示文稿/幻灯片
- 画中画
- 您希望克劳德控制任何额外的场景
测试连接
配置完成后:
- 启动 OBS Studio
- 运行 MCP 服务器 (
npm start
) - 打开 Claude 并配置 MCP
- 测试切换场景等简单命令
执照
该项目可在 MIT 许可下使用。
Related MCP Servers
- -securityFlicense-qualityA TypeScript server enabling integration with the Brevo (Sendinblue) API for managing contacts, sending emails, and tracking email events in multi-channel applications like Claude Desktop.Last updated -TypeScript
- -securityAlicense-qualityA TypeScript implementation of a Model Context Protocol server that provides a frictionless framework for developers to build and deploy AI tools and prompts, focusing on developer experience with zero boilerplate and automatic tool registration.Last updated -6TypeScriptMIT License
- -securityAlicense-qualityA server that provides tools to control OBS Studio remotely via the OBS WebSocket protocol, enabling management of scenes, sources, streaming, and recording through an MCP client interface.Last updated -2TypeScriptGPL 2.0
- AsecurityAlicenseAqualityA TypeScript server that enhances AI assistants' capabilities when working with Starwind UI components, providing tools for project initialization, component installation, documentation access, and more.Last updated -619TypeScriptMIT License