prime-intellect-mcp
prime-intellect-mcp
Permite que Claude Code alquile, gestione y termine pods de GPU de Prime Intellect por su cuenta, con límites estrictos de gasto que tú controlas.
Qué es esto
Un servidor MCP que conecta Claude Code (o cualquier cliente MCP) a tu cuenta de Prime Intellect. Con él, el agente puede:
🔍 Buscar el pod de GPU más barato que cumpla con tus requisitos
💸 Cotizar un precio antes de comprometer dinero
🛒 Aprovisionar el pod (solo después de que digas
confirm=True)🖥️ SSH para entrar en él (la cadena de conexión se entrega a la propia herramienta
Bashdel agente)🛑 Terminar el pod cuando el trabajo esté hecho, y avisar en voz alta si lo olvidas
Creado para un flujo de trabajo: decirle a Claude "alquila la H100 más barata, ejecuta mi script de entrenamiento y luego elimínala" y no despertarte con una factura de 400 $.
Instalar en 60 segundos
Solo necesitas esto para empezar a alquilar GPUs a través de Claude Code:
1. Obtén una clave API de Prime Intellect
Haz clic aquí para generar una → establece los permisos:
Ámbito | Nivel |
Instancias | Lectura y escritura |
Disponibilidad | Solo lectura |
Facturación | Solo lectura |
Claves SSH | Solo lectura |
Copia la clave: empieza por pit_….
2. Añade el servidor a Claude Code
Abre ~/Library/Application Support/Claude/claude_desktop_config.json (macOS) o el archivo .mcp.json de tu proyecto, y pega:
{
"mcpServers": {
"prime-intellect": {
"command": "uvx",
"args": ["prime-intellect-mcp"],
"env": {
"PRIME_API_KEY": "pit_PASTE_YOURS_HERE",
"PRIME_MAX_HOURLY_USD": "5",
"PRIME_MAX_TOTAL_USD": "40"
}
}
}
}Eso es todo. Reinicia Claude Code y pregunta: "¿Qué GPUs están disponibles ahora mismo por menos de 1 $/hora?"
¿No tienes
uvx? Instálalo concurl -LsSf https://astral.sh/uv/install.sh | sh(obrew install uv). Es un instalador de una sola línea para el gestor de paquetesuvy nunca más tendrás que gestionar un virtualenv.
✨ Añadir SSH (opcional, +2 min) — necesario para que Claude pueda ejecutar código en el pod
El servidor anterior ya puede aprovisionar/inspeccionar/terminar pods. Pero para que Claude Code pueda entrar por SSH en un pod en ejecución y ejecutar comandos en él, Prime Intellect necesita conocer la clave pública SSH de tu máquina.
3. Busca o genera una clave SSH en tu máquina
ls ~/.ssh/*.pub # if you have id_ed25519.pub or similar, you're set
# otherwise:
ssh-keygen -t ed25519 -C "you@example.com" # press Enter through the prompts4. Registra la clave pública en Prime Intellect
cat ~/.ssh/id_ed25519.pub # or whichever .pub file you haveCopia la salida (una línea que empieza por ssh-ed25519 …), luego pégala en el formulario Add SSH key en app.primeintellect.ai/dashboard/ssh-keys.
Eso es todo. Los futuros pods tendrán tu clave pública en authorized_keys, y la herramienta Bash de Claude Code podrá entrar directamente por SSH:
ssh ubuntu@<pod-ip-from-pod_status> "nvidia-smi"Próximamente en v0.2: una herramienta MCP
register_ssh_keyque realiza el paso 4 desde dentro de Claude (sin visitar el navegador). Consulta el rastreador de problemas para seguir el progreso.
Lo que Claude puede hacer ahora (las 9 herramientas)
Herramienta | Caso de uso |
| "¿Qué tipos de GPU ofrece Prime Intellect?" |
| "Muéstrame pods 1×H100 disponibles por menos de 3 $/hora." |
| "¿Cuánto crédito me queda?" |
| "Cotízame una 1×A100 con 200 GB de disco." (sin coste) |
| "Aprovisiona el pod de esa cotización." (requiere |
| "Muéstrame mis pods en ejecución." |
| "¿Está listo el pod X? Espera hasta que tenga información SSH." |
| "Elimina el pod X." (requiere |
| "¿Olvidé terminar algo?" |
Seguridad: nada se aprovisiona silenciosamente
Tres capas, en orden:
Cotizar primero.
pod_quotedevuelve un precio + un token de 60 segundos. Sin efectos secundarios. El importe en dólares está ahora en el contexto del agente.Confirmación explícita.
pod_create(ypod_terminate) requiereconfirm=True. Sin esto, obtienes una vista previa de prueba.Límites estrictos de variables de entorno.
PRIME_MAX_HOURLY_USDbloquea cualquier pod por encima de la tarifa.PRIME_MAX_TOTAL_USDbloquea cualquier (tarifa × horas_máximas_de_vida) por encima del presupuesto. El saldo de la billetera también se aplica. Ninguno de estos límites puede ser anulado por los argumentos de la herramienta: se leen en cada llamada.
Valores predeterminados: PRIME_MAX_HOURLY_USD=5, PRIME_MAX_TOTAL_USD=40. Configúralos en el bloque env de tu configuración.
Cada pod_create / pod_terminate se añade como JSON a ~/.prime-intellect-mcp/audit.log, para que tengas un historial completo de lo que el agente hizo con tu dinero.
Ejemplos de prompts (pega esto en Claude Code)
List the cheapest 1×H100 pods available right now. Show me the top 3 by hourly price.Quote a 1×A100 80GB with 100GB disk, 8 vCPU, 64GB RAM. Don't provision yet —
just show me what it would cost.I need to fine-tune a 7B model overnight. Find the cheapest 1×H100 with 200GB
disk, max $40 total budget, max 12 hours. Provision it, give me the SSH command,
and remind me to terminate when I'm done.Check if I have any running pods I forgot about and show me their hourly cost.Terminate pod abc123. Confirm before doing it.Solución de problemas
O bien tu configuración de Claude Code no detectó el bloque env, o escribiste PRIME_API_KEY como una variable diferente. Verifica con:
$ env | grep PRIMEdentro del mismo shell que lanza Claude Code, o pega la clave directamente en el bloque env del JSON (en lugar de usar ${PRIME_API_KEY}).
El agente eligió un pod por encima de tu límite estricto. O bien:
Elige una GPU más barata (
list_availabilitycon un filtro de región a menudo muestra filas más baratas con precios comunitarios), oAumenta
PRIME_MAX_HOURLY_USDen tu configuración y reinicia Claude Code.
Las cotizaciones duran 60 segundos; el agente esperó demasiado entre pod_quote y pod_create. Simplemente llama a pod_quote de nuevo; no tiene coste.
El aprovisionamiento no ha terminado completamente. El pod está activo pero todavía ejecutando su script de instalación. Llama a pod_status(pod_id, wait_for_ssh=True) y se bloqueará (consultando cada 5s) hasta que SSH esté disponible.
No le has informado a Prime Intellect sobre tu clave pública (o el pod se aprovisionó antes de que la registraras). Solución:
Verifica que tu clave pública esté registrada en app.primeintellect.ai/dashboard/ssh-keys.
Reaprovisiona: el
authorized_keysdel pod se establece en el momento de la creación, por lo que los pods existentes no recogerán las claves que registraste después.Si tu clave privada tiene una frase de contraseña, ejecuta
ssh-add --apple-use-keychain ~/.ssh/your_keyuna vez en macOS para que el agente la desbloquee silenciosamente a partir de ahora.
Recarga en app.primeintellect.ai/wallet e inténtalo de nuevo.
¿Por qué otro más?
Existe un prime-mcp-server 0.1.2 en PyPI. Es una prueba de concepto básica; esto no es un fork. Diferencias para uso desatendido durante la noche:
|
| |
Cotización en dos pasos → confirmar | ✅ | ❌ |
Límites estrictos de gasto en variables de entorno | ✅ | ❌ |
Verificación previa de saldo de billetera | ✅ | ❌ |
Detección de pods fuera de control | ✅ | ❌ |
Entrega de SSH al agente | ✅ | ❌ |
Pruebas | 32 unitarias + en vivo opcionales | Ninguna |
Desarrollo local
git clone https://github.com/kvrancic/prime-intellect-mcp
cd prime-intellect-mcp
uv sync
uv run pytest -m "not live" # 32 fast tests, no network, no spend
uv run ruff check .
uv run mypy srcPrueba de humo en vivo (aprovisiona la GPU más barata disponible, ejecuta nvidia-smi, termina; gasto de ~0,05 $):
PRIME_API_KEY=pit_... PRIME_LIVE_TEST=1 PRIME_LIVE_MAX_HOURLY=0.60 \
PRIME_MAX_HOURLY_USD=0.60 PRIME_MAX_TOTAL_USD=2.00 \
uv run pytest tests/test_smoke_live.py -v -sHoja de ruta
v0.2 — Herramienta MCP
register_ssh_key(elimina el paso del panel de control), Sandboxes (SDKprime-sandboxes), Hub de entornosv0.3 — Demonio de terminación automática opcional (aplicación del lado del servidor de
max_lifetime_hours); telemetría de costesv1.0+ — Despliegue alojado/OAuth cuando Prime Intellect lance OAuth; envío al directorio de conectores de Anthropic
Agradecimientos
Prime Intellect por el SDK de Python
primeque hace el 90% del trabajoMIT 6.8610 (NLP avanzado) por los créditos de Prime Intellect que hicieron posible probar esto
FastMCP por el framework
Licencia
MIT: consulta LICENSE.
Contribución
Se aceptan problemas y PRs. Por favor, ejecuta uv run pytest -m "not live" y uv run ruff check . antes de enviar.
Maintenance
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/kvrancic/prime-intellect-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server