Flyworks MCP

by Flyworks-AI
MIT License
2
  • Linux
  • Apple

Integrations

  • Supports configuration via .env files for storing the Flyworks API token and other settings

  • Provides a community support channel through their Discord server for users of the Flyworks MCP

  • Requires Python 3.8+ as the runtime environment for the MCP server

Flyworks MCP: herramienta de sincronización de labios Zeroshot rápida y gratuita

Descripción general

Flyworks MCP es un servidor de Protocolo de Contexto de Modelo (MCP) que proporciona una interfaz práctica para interactuar con la API de Flyworks. Facilita la creación rápida y gratuita de vídeos de sincronización labial para una amplia gama de avatares digitales, incluyendo estilos realistas y de dibujos animados.

Manifestación

Vídeo de avatar de entrada (metraje):

Clip de audio con texto a voz que dice我是一个飞影数字人。Welcome to Flyworks MCP server demo. This tool enables fast and free lipsync video creation for a wide range of digital avatars, including realistic and cartoon styles.

Vídeo de sincronización de labios generado:

Características

  • Crea vídeos sincronizados con los labios utilizando videos y audios de avatares digitales como entradas
  • Crea vídeos sincronizados con los labios mediante texto (con texto a voz)
  • Crea avatares humanos digitales a partir de imágenes o vídeos.
  • Admite modos de funcionamiento asíncrono y sincronizado
  • Próximamente habrá más funciones...

Requisitos

  • Python 3.8+
  • Dependencias: httpx , mcp[cli]

Instalación

  1. Clonar este repositorio:
    git clone https://github.com/yourusername/flyworks-mcp.git cd flyworks-mcp
  2. Instalar dependencias:
    pip install httpx "mcp[cli]>=1.6.0"
    O usando uv :
    uv pip install httpx "mcp[cli]>=1.6.0"
    Para evitar problemas de tiempo de espera durante el inicio del servidor, recomendamos preinstalar todas las dependencias:
    pip install pygments pydantic-core httpx "mcp[cli]>=1.6.0"

Configuración

Establezca su token de API de Flyworks como una variable de entorno:

# Linux/macOS export FLYWORKS_API_TOKEN="your_token_here" # Windows (Command Prompt) set FLYWORKS_API_TOKEN=your_token_here # Windows (PowerShell) $env:FLYWORKS_API_TOKEN="your_token_here"

Alternativamente, puede crear un archivo .env .

Nota: Ofrecemos acceso de prueba gratuito a nuestra herramienta con el token 2aeda3bcefac46a3 . Sin embargo, tenga en cuenta que el cupo diario para este acceso gratuito es limitado. Además, los videos generados tendrán una marca de agua y una duración limitada de 45 segundos. Para obtener acceso completo, contáctenos en bd@flyworks.ai para adquirir su token.

Uso

Ejecución del servidor

Ejecute el archivo server.py directamente:

python server.py
Integración con Claude u otros clientes de MCP
Uso en Claude Desktop

Vaya a Claude > Settings > Developer > Edit Config > claude_desktop_config.json para incluir lo siguiente:

{ "mcpServers": { "flyworks": { "command": "uvx", "args": [ "flyworks-mcp", "-y" ], "env": { "FLYWORKS_API_TOKEN": "your_api_token_here", "FLYWORKS_API_BASE_URL": "https://hfw-api.hifly.cc/api/v2/hifly", "FLYWORKS_MCP_BASE_PATH": "/path/to/your/output/directory" } } } }
Uso en el cursor

Vaya a Cursor -> Preferences -> Cursor Settings -> MCP -> Add new global MCP Server para agregar la configuración anterior.

Asegúrese de reemplazar your_api_token_here con su token API real y actualice FLYWORKS_MCP_BASE_PATH a un directorio válido en su sistema donde se guardarán los archivos de salida.

Problemas: spawn uvx ENOENT

Confirme su ruta absoluta ejecutando este comando en su terminal:

which uvx

Una vez que obtenga la ruta absoluta (por ejemplo, /usr/local/bin/uvx), actualice su configuración para usar esa ruta (por ejemplo, "comando": "/usr/local/bin/uvx").

Descripción de la herramienta

1. Crear un vídeo de sincronización de labios mediante audio ( create_lipsync_video_by_audio )

Crea un video de sincronización labial con entrada de audio. Anima un avatar humano digital para que hable en sincronía con el audio proporcionado.

Parámetros :

  • avatar : ID de avatar humano digital. Se debe proporcionar este ID o los parámetros de creación del avatar.
  • avatar_video_url : URL de un vídeo para crear el avatar.
  • avatar_image_url : URL de una imagen para crear el avatar.
  • avatar_video_file : Ruta local a un archivo de vídeo para crear el avatar.
  • avatar_image_file : Ruta local a un archivo de imagen para crear el avatar.
  • audio_url : URL remota del archivo de audio. Se debe proporcionar audio_url o audio_file.
  • audio_file : Ruta local del archivo de audio. Se debe proporcionar audio_url o audio_file.
  • title : Título opcional para el vídeo creado.
  • async_mode : Si es verdadero, devuelve task_id inmediatamente. Si es falso, espera a que se complete la descarga y descarga el video. El valor predeterminado es verdadero.
  • output_path : Dónde guardar el vídeo descargado si async_mode es falso. El valor predeterminado es "output.mp4".

Notas :

  • Para la creación de avatar, proporcione exactamente UNO de los siguientes: avatar_video_url, avatar_image_url, avatar_video_file o avatar_image_file.
  • Si se proporciona directamente el ID del avatar, estos parámetros se ignorarán.

Devoluciones :

  • Si async_mode es verdadero: task_id para verificar el estado más tarde y created_avatar (si se creó un nuevo avatar)
  • Si async_mode es falso: ruta del video descargado, resultado de la tarea y avatar creado (si corresponde)
2. Crear un vídeo de sincronización de labios mediante texto ( create_lipsync_video_by_text )

Crea un video de sincronización de labios con entrada de texto. Genera audio a partir del texto y anima un avatar humano digital para que lo diga.

Parámetros :

  • avatar : ID de avatar humano digital. Se debe proporcionar este ID o los parámetros de creación del avatar.
  • avatar_video_url : URL de un vídeo para crear el avatar.
  • avatar_image_url : URL de una imagen para crear el avatar.
  • avatar_video_file : Ruta local a un archivo de vídeo para crear el avatar.
  • avatar_image_file : Ruta local a un archivo de imagen para crear el avatar.
  • text : Contenido del texto que el avatar pronunciará. Obligatorio.
  • voice : ID de voz para la conversión de texto a voz. Si no se proporciona, se seleccionará automáticamente una voz aleatoria.
  • title : Título opcional para el vídeo creado.
  • async_mode : Si es verdadero, devuelve task_id inmediatamente. Si es falso, espera a que se complete la descarga y descarga el video. El valor predeterminado es verdadero.
  • output_path : Dónde guardar el vídeo descargado si async_mode es falso. El valor predeterminado es "output.mp4".

Notas :

  • Para la creación de avatar, proporcione exactamente UNO de los siguientes: avatar_video_url, avatar_image_url, avatar_video_file o avatar_image_file.
  • Si se proporciona directamente el ID del avatar, estos parámetros se ignorarán.

Devoluciones :

  • Si async_mode es verdadero: task_id para verificar el estado más tarde, ID de voz seleccionada y created_avatar (si corresponde)
  • Si async_mode es falso: ruta del video descargado, resultado de la tarea, ID de voz seleccionada y avatar creado (si corresponde)

Comprobación del estado de la tarea

Para las tareas que se ejecutan en modo asincrónico, puede verificar su estado utilizando el punto final /creation/task de la API de Flyworks con el task_id devuelto por la herramienta.

Notas

  • El procesamiento del trabajo puede tardar algún tiempo, tenga paciencia.
  • Las URL de los archivos de video son temporales, descárguelas y guárdelas lo antes posible.
  • Al utilizar archivos locales, el servidor los cargará automáticamente a los servidores de Flyworks
  • En el modo de sincronización, la herramienta esperará a que se complete la tarea y descargará automáticamente el video.
  • El tiempo de espera máximo permitido para el modo de sincronización es de 10 minutos (600 segundos)
  • La creación de avatares a través de videos suele ofrecer una mejor calidad pero lleva más tiempo.
  • Para pruebas rápidas, la creación de avatares a través de imágenes es más rápida pero puede tener menor calidad.

Enlaces relacionados

-
security - not tested
A
license - permissive license
-
quality - not tested

Un servidor de protocolo de contexto de modelo que permite la creación rápida y gratuita de vídeos con sincronización de labios para una amplia gama de avatares digitales, admitiendo entradas de audio y texto para generar movimientos de labios sincronizados.

  1. Descripción general
    1. Manifestación
      1. Características
        1. Requisitos
          1. Instalación
            1. Configuración
              1. Uso
                1. Ejecución del servidor
                2. Integración con Claude u otros clientes de MCP
              2. Descripción de la herramienta
                1. 1. Crear un vídeo de sincronización de labios mediante audio ( create_lipsync_video_by_audio )
                2. 2. Crear un vídeo de sincronización de labios mediante texto ( create_lipsync_video_by_text )
              3. Comprobación del estado de la tarea
                1. Notas
                  1. Enlaces relacionados

                    Related MCP Servers

                    • -
                      security
                      A
                      license
                      -
                      quality
                      A Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.
                      Last updated -
                      TypeScript
                      MIT License
                    • A
                      security
                      A
                      license
                      A
                      quality
                      A Model Context Protocol server that enables retrieval of transcripts from YouTube videos. This server provides direct access to video transcripts and subtitles through a simple interface, making it ideal for content analysis and processing.
                      Last updated -
                      1
                      258
                      10
                      TypeScript
                      MIT License
                      • Linux
                      • Apple
                    • -
                      security
                      F
                      license
                      -
                      quality
                      A Model Context Protocol server that provides Claude with tools to interact with YouTube, built on the mcp-framework.
                      Last updated -
                      TypeScript
                      • Apple
                    • -
                      security
                      -
                      license
                      -
                      quality
                      Model Context Protocol server that enables generating videos from text prompts and/or images using AI models (Luma Ray2 Flash and Kling v1.6 Pro) with configurable parameters like aspect ratio, resolution, and duration.
                      Last updated -
                      1
                      JavaScript
                      MIT License

                    View all related MCP servers

                    ID: y9enz2ldhd