Skip to main content
Glama

CLI

Comprobación de instalación

Comprobación de versión

veo-mcp-server

veo-mcp-server --help

veo-mcp-server --version

nanobanana-imagen-mcp

nanobanana-imagen-mcp --help

nanobanana-imagen-mcp --version


¿Qué es esto?

Gemini Media MCP es un kit de herramientas integral que lleva los modelos de generación de medios de IA más potentes de Google a cualquier asistente de IA compatible con MCP. Genera vídeos 4K con VEO 3.1, crea imágenes impresionantes con NanoBanana Pro 2 y elabora prompts profesionales con habilidades integradas, todo desde un único repositorio.

Qué incluye

Servidores MCP

Servidor

Descripción

Herramientas

VEO 3.1

Generación de vídeo por IA (texto a vídeo, imagen a vídeo, extender, interpolar)

9 herramientas

NanoBanana

Generación de imágenes por IA con NanoBanana Pro 2 (modelos Pro + Flash)

4 herramientas

Habilidades de Claude Code (Marketplace de plugins)

Habilidad

Descripción

VEO Prompting

Ingeniería de prompts de 7 capas para vídeos cinematográficos con VEO 3.1

NanoBanana Prompting

Ingeniería de prompts de 7 capas para imágenes fotorrealistas con NanoBanana Pro 2

Instala las habilidades a través de Claude Code:

/plugin marketplace add u2n4/gemini-media-mcp

Inicio rápido

Este repositorio alberga dos servidores MCP independientes. Instala el que necesites, o ambos. Cada servidor se publica en PyPI por separado.

Opción A — uvx (sin instalación, recomendado)

Añade un bloque a la configuración de tu cliente MCP (Claude Desktop, Claude Code, Cursor, VS Code, Windsurf) usando el bloque de servidor apropiado a continuación (consulta las secciones Servidor VEO / Servidor NanoBanana).

Opción B — clonar + instalación editable

git clone https://github.com/u2n4/gemini-media-mcp.git
cd gemini-media-mcp

# Create a virtual environment (uv pip install requires one — or pass --system)
uv venv
source .venv/bin/activate     # macOS / Linux
# .venv\Scripts\activate     # Windows PowerShell

# Install one or both sub-packages
uv pip install -e servers/veo
uv pip install -e servers/nanobanana

Servidor VEO

uvx (sin instalación):

{
  "mcpServers": {
    "veo": {
      "command": "uvx",
      "args": ["veo-mcp-server"],
      "env": {
        "GEMINI_API_KEY": "your_key",
        "VIDEO_OUTPUT_DIR": "./videos"
      }
    }
  }
}

Claude Code:

claude mcp add veo -s user -e GEMINI_API_KEY=your_key -- uvx veo-mcp-server

pip install:

pip install veo-mcp-server

Servidor NanoBanana

uvx (sin instalación):

{
  "mcpServers": {
    "nanobanana": {
      "command": "uvx",
      "args": ["nanobanana-imagen-mcp"],
      "env": {
        "GEMINI_API_KEY": "your_key"
      }
    }
  }
}

Claude Code:

claude mcp add nanobanana -s user -e GEMINI_API_KEY=your_key -- uvx nanobanana-imagen-mcp

pip install:

pip install nanobanana-imagen-mcp

Servidor VEO

Generación de vídeo por IA impulsada por Google VEO 3.1. Utiliza un patrón de trabajo asíncrono donde la generación comienza en segundo plano y devuelve un ID de trabajo para el sondeo: sin tiempos de espera.

Herramientas

Herramienta

Descripción

veo_generate_video

Genera vídeo a partir de un prompt de texto. Admite 720p/1080p/4K, 16:9 o 9:16, duración de 4/6/8 segundos, prompts negativos, imágenes de referencia, control de semilla y generación por lotes (1-4 vídeos).

veo_image_to_video

Anima una imagen de referencia con un prompt de movimiento.

veo_interpolate_video

Crea una transición suave entre dos fotogramas (primer fotograma + último fotograma).

veo_extend_video

Extiende un vídeo VEO existente en ~7 segundos. Solo 720p, máximo 148 segundos en total.

veo_check_job

Comprueba el estado del trabajo asíncrono. Llama cada 15-20 segundos hasta que se complete o falle.

veo_list_jobs

Lista todos los trabajos de generación y su estado actual.

veo_api_status

Comprueba el estado de la clave API: claves configuradas, clave activa, claves restantes.

veo_pricing_info

Muestra el precio por segundo para modelos estándar y rápidos en todas las resoluciones.

veo_show_output_stats

Muestra estadísticas de generación: recuento de vídeos, tamaño total, detalles de archivos, estados de trabajo.

Configuración de VEO

Variable

Descripción

Predeterminado

GEMINI_API_KEY

Clave API principal (obligatoria)

--

GEMINI_API_KEY_BACKUP

Clave de respaldo para rotación automática

--

VIDEO_OUTPUT_DIR

Directorio de salida para vídeos

~/veo-videos

Modelos VEO

Nivel

Modelo

Mejor para

Estándar

veo-3.1-generate-preview

Salida de mayor calidad

Rápido

veo-3.1-fast-generate-preview

Generación más rápida

Servidor NanoBanana

Generación de imágenes por IA impulsada por NanoBanana Pro 2. Admite modelos Pro (calidad máxima) y Flash (rápido) con resolución 4K predeterminada.

Herramientas

Herramienta

Descripción

generate_image

Genera imágenes usando NanoBanana Pro 2 (Pro o Flash). Admite relación de aspecto, resolución (hasta 4K), prompts negativos, nivel de razonamiento, grounding e imágenes de referencia.

upload_file

Sube una imagen de referencia para edición o condicionamiento.

show_output_stats

Muestra estadísticas de generación: recuento de imágenes, tamaño total, detalles de archivos.

maintenance

Mantenimiento y limpieza del servidor: borrar cachés, eliminar archivos temporales.

Modelos

Modelo

Motor

Mejor para

Pro

Gemini 3 Pro Image

Calidad máxima, escenas complejas

Flash

Gemini 3.1 Flash Image

Generación rápida, escenas simples

Habilidades de Prompting

Habilidad de VEO Prompting

Sistema de ingeniería de prompts de 7 capas para VEO 3.1:

  1. Cinematografía (cámara, tipo de plano, lente, ángulos)

  2. Sujeto (personajes, objetos, señales de material)

  3. Acción (verbos basados en fuerza, tiempos de ritmo)

  4. Entorno (hora del día, clima, capas de profundidad)

  5. Iluminación y estado de ánimo (fuentes de luz física, temperatura de color)

  6. Diseño de audio (diálogo, efectos de sonido, ambiente, música)

  7. Controles técnicos (prompts negativos, anclas de estilo, tipos de película)

Habilidad de NanoBanana Prompting

Sistema de ingeniería de prompts de 7 capas para NanoBanana Pro 2:

  1. Estilo y dirección de arte (ADN visual)

  2. Descripción de la escena (entorno, atmósfera)

  3. Sujeto principal (elemento héroe con especificidad extrema)

  4. Cámara y lente (especificaciones de cámara real para realismo)

  5. Iluminación (natural, estudio, temperatura de color)

  6. Textura, material y color (detalle táctil)

  7. Prompts negativos (protecciones de calidad)

Arquitectura

gemini-media-mcp/
├── servers/
│   ├── veo/                       # VEO 3.1 MCP Server (PyPI: veo-mcp-server)
│   │   ├── pyproject.toml
│   │   ├── requirements.txt
│   │   └── src/
│   │       └── veo_mcp_server/
│   │           ├── __init__.py
│   │           ├── __main__.py
│   │           └── server.py
│   └── nanobanana/                # NanoBanana MCP Server (PyPI: nanobanana-imagen-mcp)
│       ├── pyproject.toml
│       ├── requirements.txt
│       └── nanobanana_mcp_server/ # Package
├── skills/
│   ├── veo-prompting/             # VEO prompting skill
│   │   └── SKILL.md
│   └── nanobanana-prompting/      # NanoBanana prompting skill
│       └── SKILL.md
├── plugins/                       # Claude Code Plugin Marketplace
│   ├── veo-prompting/
│   │   ├── .claude-plugin/
│   │   │   └── plugin.json
│   │   └── skills/
│   │       └── veo-prompting/
│   │           └── SKILL.md
│   └── nanobanana-prompting/
│       ├── .claude-plugin/
│       │   └── plugin.json
│       └── skills/
│           └── nanobanana-prompting/
│               └── SKILL.md
├── .claude-plugin/
│   └── marketplace.json
├── .env.example
├── .gitignore
├── CHANGELOG.md
├── CONTRIBUTING.md
├── LICENSE
├── README.md
├── llms.txt
└── llms-install.md

Contribución

Consulta CONTRIBUTING.md.

Licencia

MIT: consulta LICENSE.

Créditos

  • Servidor MCP NanoBanana: inspirado en la convención de nombres nano-banana utilizada en toda la comunidad MCP. Esta es una implementación independiente.

  • VEO 3.1 por Google DeepMind

Soporte

Si te resulta útil, ¡por favor dale una estrella a este repositorio!


Hecho con ❤️ en la Provincia Oriental de Arabia Saudita.

A
license - permissive license
-
quality - not tested
B
maintenance

Maintenance

Maintainers
Response time
0dRelease cycle
6Releases (12mo)

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/u2n4/gemini-media-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server