Presentation Buddy — помощник по производству потокового контента на базе искусственного интеллекта
Ссылки проекта:
Presentation Buddy — это система управления OBS, которая использует искусственный интеллект Claude для автоматизации производства потокового вещания, позволяя создателям контента в одиночку сосредоточиться на доставке контента, а не на техническом управлении.
Технический обзор
В этой реализации используются:
- OBS Studio : программное обеспечение для потоковой передачи, являющееся отраслевым стандартом
- Сервер MCP на базе TypeScript : облегченная служба ретрансляции, соединяющая Claude AI с OBS
- Claude AI : для понимания естественного языка и принятия производственных решений
- OBS WebSocket API : для прямого управления переключением сцен, наложениями и элементами мультимедиа
- Локальная обработка : все функции выполняются на компьютере докладчика, что обеспечивает минимальную задержку.
Ключевые компоненты
- MCP Server : промежуточное программное обеспечение, которое преобразует решения Клода в команды OBS WebSocket.
- Управление сценами : автоматическое переключение на основе содержания и вербальных сигналов
- Управление мультимедиа : интеллектуальная обработка наложений, подписей и элементов «картинка в картинке»
- Голосовой ответ : возможности преобразования текста в речь для ответов ИИ во время презентаций
Выполнение
Сервер устанавливает соединение WebSocket с OBS и предоставляет API, к которому Клод может получить доступ. Когда Клод определяет потребность в производстве из речи ведущего или экранного контента, он отправляет команды через сервер MCP для управления OBS в реальном времени.
Вдохновение
Жить в одиночку тяжело.
Во время разговора от вас ожидают смены ракурсов, показа слайдов, добавления подписей и удержания внимания зрителей — все это одновременно. Нам нужен был напарник, который мог бы управлять производственной кабиной, чтобы каждый создатель мог сосредоточиться на истории, а не на кнопках.
Что он делает
Presentation Buddy — помощник на базе искусственного интеллекта для стримеров и докладчиков.
Он слушает, что происходит на экране и за микрофоном, затем:
- Переключает сцены в идеальный момент
- Автоматически выводит на экран титры, графику или окно «картинка в картинке»
- Даже обеспечивает короткие закадровые реплики, когда вам нужен перерыв
Подумайте об этом как о маленьком производителе, который никогда не устает.
Как мы это построили
- Искусственный интеллект Claude слушает сигналы.
- Легкий ретранслятор отправляет эти сигналы в OBS Studio — самый популярный инструмент для прямых трансляций.
- OBS берет команды — «сменить камеру», «показать субтитры», «начать повтор» — и творит чудеса.
- Благодаря функции преобразования текста в речь ИИ обретает собственный голос.
Все это работает локально, поэтому нет никаких задержек, связанных с облаком, или сложного оборудования.
Проблемы, с которыми мы столкнулись
- Создайте сервер MCP, оборачивающий собственные API OBS
- Время речевого отклика в реальном времени
- Хороший сюжет, который Клод хорошо понимает.
- Мы не смогли сделать это, предоставив снимок экрана Клоду через MCP
Достижения, которыми мы гордимся
- Демонстрация в реальном времени, которая позволяет перейти от титульного слайда к динамическому контенту без участия человека .
- Превратил однопользовательскую настройку в трансляцию без стресса.
Что мы узнали
- Как собрать и настроить MCP на Claude и Cursor
Что дальше для Presentation Buddy?
- Интерактивность для зрителей — позвольте голосам в чате запускать наложения и опросы.
- Установщик в один клик — любой стример может познакомиться со своим новым приятелем за считанные минуты.
От одиночного стримера до студийного профессионала — мгновенно.
Установка и настройка
- Клонировать этот репозиторий
- Установка зависимостей с помощью
npm install
- Настройте параметры подключения OBS WebSocket
- Запустите сервер MCP с помощью
npm start
- Подключите ваш экземпляр Claude AI к серверу MCP
- Начните сеанс OBS и позвольте Presentation Buddy взять управление в свои руки
Конфигурация Клода MCP
Чтобы настроить Claude с Presentation Buddy, вам нужно будет настроить параметры MCP (Machine Control Protocol) в Cursor или другом интерфейсе Claude. Это позволит Claude управлять OBS через наш сервер.
Конфигурация Клода MCP
Добавьте следующую конфигурацию в настройки Клода:
Замените пути на фактические пути Node.js и сервера:
/path/to/your/node
— путь к исполняемому файлу Node.js (например,/Users/username/.nvm/versions/node/v20.17.0/bin/node
)/path/to/obs-mcp-server-ts/build/index.js
— Путь к файлу JavaScript собранного сервера
Для конфигурации TTS-MCP обязательно:
- Введите ваш настоящий ключ API OpenAI
- Выберите предпочитаемый голос (по умолчанию: nova)
- Выберите подходящую модель для преобразования текста в речь (по умолчанию: gpt-4o-mini-tts)
Настройка OBS
- Установите OBS Studio (рекомендуется версия 28+)
- Включите сервер WebSocket в OBS:
- Перейдите в Инструменты → Настройки сервера WebSocket.
- Включить сервер WebSocket
- Установите порт (по умолчанию: 4455)
- При необходимости настройте аутентификацию
- Создавайте свои сцены в OBS:
- Основная камера
- Презентация/Слайды
- Картинка в картинке
- Любые дополнительные сцены, которые вы хотите, чтобы Клод контролировал
Тестирование соединения
После настройки:
- Запустить OBS Studio
- Запустите сервер MCP (
npm start
) - Откройте Claude с настроенным MCP
- Протестируйте простую команду, например переключение сцен.
Лицензия
Этот проект доступен по лицензии MIT.
Tools
Промежуточное программное обеспечение на основе TypeScript, которое преобразует решения Claude AI в команды OBS WebSocket, позволяя создателям контента в одиночку автоматизировать производство потокового контента без ручного технического управления.
- Технический обзор
- Вдохновение
- Что он делает
- Как мы это построили
- Проблемы, с которыми мы столкнулись
- Достижения, которыми мы гордимся
- Что мы узнали
- Что дальше для Presentation Buddy?
- Установка и настройка
- Конфигурация Клода MCP
- Лицензия
Related Resources
Related MCP Servers
- -securityFlicense-qualityA TypeScript server enabling integration with the Brevo (Sendinblue) API for managing contacts, sending emails, and tracking email events in multi-channel applications like Claude Desktop.Last updated -TypeScript
- -securityAlicense-qualityA TypeScript implementation of a Model Context Protocol server that provides a frictionless framework for developers to build and deploy AI tools and prompts, focusing on developer experience with zero boilerplate and automatic tool registration.Last updated -6TypeScriptMIT License
- -securityAlicense-qualityA server that provides tools to control OBS Studio remotely via the OBS WebSocket protocol, enabling management of scenes, sources, streaming, and recording through an MCP client interface.Last updated -2TypeScriptGPL 2.0
- AsecurityAlicenseAqualityA TypeScript server that enhances AI assistants' capabilities when working with Starwind UI components, providing tools for project initialization, component installation, documentation access, and more.Last updated -619TypeScriptMIT License