Integrations
Flyworks MCP: 무료 & 빠른 Zeroshot Lipsync 도구
개요
Flyworks MCP는 Flyworks API와 상호 작용하기 위한 편리한 인터페이스를 제공하는 모델 컨텍스트 프로토콜(MCP) 서버입니다. 사실적인 스타일과 만화 스타일을 포함한 다양한 디지털 아바타에 대한 빠르고 자유로운 립싱크 비디오 제작을 지원합니다.
데모
아바타 비디오(영상) 입력:
TTS가 포함된 오디오 클립我是一个飞影数字人。Welcome to Flyworks MCP server demo. This tool enables fast and free lipsync video creation for a wide range of digital avatars, including realistic and cartoon styles.
생성된 립싱크 비디오:
특징
- 디지털 아바타 비디오와 오디오를 입력으로 사용하여 립싱크 비디오를 만듭니다.
- 텍스트로 립싱크 영상 만들기(텍스트 음성 변환 기능 포함)
- 이미지나 비디오로 디지털 인간 아바타를 만드세요
- 비동기 및 동기 작동 모드 모두 지원
- 곧 더 많은 기능이 추가될 예정입니다.
요구 사항
- 파이썬 3.8 이상
- 종속성:
httpx
,mcp[cli]
설치
- 이 저장소를 복제하세요:지엑스피1
- 종속성 설치:또는Copy
uv
사용하면:서버 시작 중 시간 초과 문제가 발생하지 않도록 모든 종속성을 미리 설치하는 것이 좋습니다.CopyCopy
구성
Flyworks API 토큰을 환경 변수로 설정하세요.
혹은 .env
파일을 만들 수도 있습니다.
참고:
2aeda3bcefac46a3
토큰을 사용하여 도구에 대한 무료 체험판을 제공합니다. 하지만 이 무료 체험의 일일 할당량은 제한되어 있습니다. 또한, 생성된 비디오에는 워터마크가 표시되며 길이는 45초로 제한됩니다. 전체 이용을 원하시면 bd@flyworks.ai 로 문의하여 토큰을 받으세요.
용법
서버 실행
server.py
파일을 직접 실행합니다.
Claude 또는 다른 MCP 클라이언트와의 통합
Claude Desktop에서 사용
Claude > Settings > Developer > Edit Config > claude_desktop_config.json
으로 이동하여 다음을 포함합니다.
커서에서 사용
Cursor -> Preferences -> Cursor Settings -> MCP -> Add new global MCP Server
로 이동하여 위의 구성을 추가합니다.
your_api_token_here
실제 API 토큰으로 바꾸고 FLYWORKS_MCP_BASE_PATH
를 출력 파일이 저장될 시스템의 유효한 디렉토리로 업데이트하세요.
문제: uvx ENOENT 생성
터미널에서 다음 명령을 실행하여 절대 경로를 확인하세요.
절대 경로(예: /usr/local/bin/uvx)를 얻은 후 해당 경로를 사용하도록 구성을 업데이트합니다(예: "command": "/usr/local/bin/uvx").
도구 설명
1. 오디오로 립싱크 비디오 만들기 ( create_lipsync_video_by_audio
)
오디오 입력을 통해 립싱크 비디오를 제작하세요. 제공된 오디오에 맞춰 말하는 디지털 인간 아바타를 애니메이션으로 구현합니다.
매개변수 :
avatar
: 디지털 인간 아바타 ID입니다. 이 매개변수 또는 아바타 생성 매개변수를 제공해야 합니다.avatar_video_url
: 아바타를 만들 비디오의 URL입니다.avatar_image_url
: 아바타를 만들 이미지의 URL입니다.avatar_video_file
: 아바타를 만들 비디오 파일의 로컬 경로입니다.avatar_image_file
: 아바타를 만들 이미지 파일의 로컬 경로입니다.audio_url
: 오디오 파일의 원격 URL입니다. audio_url 또는 audio_file 중 하나를 제공해야 합니다.audio_file
: 오디오 파일의 로컬 경로입니다. audio_url 또는 audio_file 중 하나를 제공해야 합니다.title
: 생성된 비디오의 선택 제목입니다.async_mode
: true이면 task_id를 즉시 반환합니다. false이면 완료될 때까지 기다렸다가 비디오를 다운로드합니다. 기본값은 true입니다.output_path
: async_mode가 false인 경우 다운로드한 비디오를 저장할 위치입니다. 기본값은 "output.mp4"입니다.
참고사항 :
- 아바타를 생성하려면 avatar_video_url, avatar_image_url, avatar_video_file, avatar_image_file 중 하나만 제공하세요.
- 아바타 ID가 직접 제공되는 경우 이러한 매개변수는 무시됩니다.
반품 :
- async_mode가 true인 경우: 나중에 상태를 확인하기 위한 task_id 및 created_avatar(새 아바타가 생성된 경우)
- async_mode가 false인 경우: 다운로드된 비디오 경로, 작업 결과 및 created_avatar(해당되는 경우)
2. 텍스트로 립싱크 영상 만들기 ( create_lipsync_video_by_text
)
텍스트를 입력하여 립싱크 비디오를 제작합니다. 텍스트에서 오디오를 생성하고, 디지털 인간 아바타가 이를 말하도록 애니메이션을 적용합니다.
매개변수 :
avatar
: 디지털 인간 아바타 ID입니다. 이 매개변수 또는 아바타 생성 매개변수를 제공해야 합니다.avatar_video_url
: 아바타를 만들 비디오의 URL입니다.avatar_image_url
: 아바타를 만들 이미지의 URL입니다.avatar_video_file
: 아바타를 만들 비디오 파일의 로컬 경로입니다.avatar_image_file
: 아바타를 만들 이미지 파일의 로컬 경로입니다.text
: 아바타가 읽어줄 텍스트 내용입니다. 필수입니다.voice
: 텍스트 음성 변환에 사용할 음성 ID입니다. 지정하지 않으면 무작위 음성이 자동으로 선택됩니다.title
: 생성된 비디오의 선택 제목입니다.async_mode
: true이면 task_id를 즉시 반환합니다. false이면 완료될 때까지 기다렸다가 비디오를 다운로드합니다. 기본값은 true입니다.output_path
: async_mode가 false인 경우 다운로드한 비디오를 저장할 위치입니다. 기본값은 "output.mp4"입니다.
참고사항 :
- 아바타를 생성하려면 avatar_video_url, avatar_image_url, avatar_video_file, avatar_image_file 중 하나만 제공하세요.
- 아바타 ID가 직접 제공되는 경우 이러한 매개변수는 무시됩니다.
반품 :
- async_mode가 true인 경우: 나중에 상태를 확인하기 위한 task_id, 선택된 음성 ID 및 created_avatar(해당되는 경우)
- async_mode가 false인 경우: 다운로드된 비디오 경로, 작업 결과, 선택된 음성 ID 및 created_avatar(해당되는 경우)
작업 상태 확인
비동기 모드에서 실행되는 작업의 경우 도구에서 반환된 task_id와 함께 Flyworks API의 /creation/task
엔드포인트를 사용하여 작업 상태를 확인할 수 있습니다.
노트
- 작업 처리에 시간이 걸릴 수 있으니 양해 부탁드립니다.
- 비디오 파일 URL은 임시이므로 즉시 다운로드하여 저장해 주세요.
- 로컬 파일을 사용하는 경우 서버는 자동으로 이를 Flyworks 서버에 업로드합니다.
- 동기화 모드에서 도구는 작업이 완료될 때까지 기다렸다가 자동으로 비디오를 다운로드합니다.
- 동기화 모드에 허용되는 최대 대기 시간은 10분(600초)입니다.
- 비디오를 통한 아바타 생성은 일반적으로 더 나은 품질을 제공하지만 시간이 더 오래 걸립니다.
- 빠른 테스트를 위해 이미지를 통한 아바타 생성이 더 빠르지만 품질이 낮을 수 있습니다.
관련 링크
This server cannot be installed
다양한 디지털 아바타를 위한 빠르고 자유로운 립싱크 비디오 생성을 가능하게 하는 모델 컨텍스트 프로토콜 서버로, 오디오와 텍스트 입력을 모두 지원하여 동기화된 입술 움직임을 생성합니다.
Related MCP Servers
- -securityAlicense-qualityA Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.Last updated -TypeScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables retrieval of transcripts from YouTube videos. This server provides direct access to video transcripts and subtitles through a simple interface, making it ideal for content analysis and processing.Last updated -125810TypeScriptMIT License
- -securityFlicense-qualityA Model Context Protocol server that provides Claude with tools to interact with YouTube, built on the mcp-framework.Last updated -TypeScript
- -security-license-qualityModel Context Protocol server that enables generating videos from text prompts and/or images using AI models (Luma Ray2 Flash and Kling v1.6 Pro) with configurable parameters like aspect ratio, resolution, and duration.Last updated -1JavaScriptMIT License