Skip to main content
Glama
kvrancic

prime-intellect-mcp

by kvrancic

prime-intellect-mcp

Lassen Sie Claude Code Prime Intellect GPU-Pods selbstständig mieten, steuern und beenden — mit festen Ausgabenobergrenzen, die Sie kontrollieren.

PyPI Python License CI MCP


Was ist das?

Ein MCP-Server, der Claude Code (oder jeden anderen MCP-Client) mit Ihrem Prime Intellect-Konto verbindet. Damit kann der Agent:

  • 🔍 Finden: Den günstigsten GPU-Pod, der Ihren Anforderungen entspricht.

  • 💸 Angebot einholen: Einen Preis abfragen, bevor Geld ausgegeben wird.

  • 🛒 Bereitstellen: Den Pod provisionieren (nur nachdem Sie confirm=True bestätigt haben).

  • 🖥️ SSH: Sich per SSH verbinden (der Verbindungs-String wird an das Bash-Tool des Agenten übergeben).

  • 🛑 Beenden: Den Pod beenden, wenn die Arbeit erledigt ist — und laut warnen, falls Sie es vergessen.

Entwickelt für einen Workflow: Sagen Sie Claude: „Miete die günstigste H100, führe mein Trainingsskript aus und beende sie dann“, ohne dass Sie am nächsten Morgen mit einer Rechnung über 400 $ aufwachen.


Installation in 60 Sekunden

Sie benötigen nur so viel, um mit dem Mieten von GPUs über Claude Code zu beginnen:

1. Einen Prime Intellect API-Schlüssel abrufen

Klicken Sie hier, um einen zu generieren → Berechtigungen festlegen:

Bereich

Ebene

Instances

Lesen und Schreiben

Availability

Nur Lesen

Billing

Nur Lesen

SSH Keys

Nur Lesen

Kopieren Sie den Schlüssel — er beginnt mit pit_….

2. Den Server zu Claude Code hinzufügen

Öffnen Sie ~/Library/Application Support/Claude/claude_desktop_config.json (macOS) oder die .mcp.json Ihres Projekts und fügen Sie Folgendes ein:

{
  "mcpServers": {
    "prime-intellect": {
      "command": "uvx",
      "args": ["prime-intellect-mcp"],
      "env": {
        "PRIME_API_KEY": "pit_PASTE_YOURS_HERE",
        "PRIME_MAX_HOURLY_USD": "5",
        "PRIME_MAX_TOTAL_USD": "40"
      }
    }
  }
}

Das war's. Starten Sie Claude Code neu und fragen Sie: „Welche GPUs sind aktuell für unter 1 $/Std. verfügbar?“

Sie haben kein uvx? Installieren Sie es mit curl -LsSf https://astral.sh/uv/install.sh | sh (oder brew install uv). Es ist ein Einzeilen-Installer für den uv-Paketmanager, und Sie müssen sich nie wieder um eine virtuelle Umgebung (virtualenv) kümmern.


✨ SSH hinzufügen (optional, +2 Min.) — erforderlich, damit Claude tatsächlich Code auf dem Pod ausführen kann

Der obige Server kann bereits Pods bereitstellen, inspizieren und beenden. Damit Claude Code sich jedoch per SSH mit einem laufenden Pod verbinden und Befehle darauf ausführen kann, muss Prime Intellect den öffentlichen SSH-Schlüssel Ihres Computers kennen.

3. Einen SSH-Schlüssel auf Ihrem Computer finden oder generieren

ls ~/.ssh/*.pub          # if you have id_ed25519.pub or similar, you're set
# otherwise:
ssh-keygen -t ed25519 -C "you@example.com"   # press Enter through the prompts

4. Den öffentlichen Schlüssel bei Prime Intellect registrieren

cat ~/.ssh/id_ed25519.pub    # or whichever .pub file you have

Kopieren Sie die Ausgabe (eine Zeile, die mit ssh-ed25519 … beginnt) und fügen Sie sie in das Formular Add SSH key unter app.primeintellect.ai/dashboard/ssh-keys ein.

Das war's. Zukünftige Pods werden Ihren öffentlichen Schlüssel in der Datei authorized_keys haben, und das Bash-Tool von Claude Code kann sich direkt per SSH verbinden:

ssh ubuntu@<pod-ip-from-pod_status> "nvidia-smi"

Kommt in v0.2: ein register_ssh_key MCP-Tool, das Schritt 4 direkt aus Claude heraus erledigt (kein Browser-Besuch nötig). Folgen Sie dem Issue-Tracker, um auf dem Laufenden zu bleiben.


Was Claude jetzt tun kann (die 9 Tools)

Tool

Anwendungsfall

list_gpu_types

„Welche GPU-Typen bietet Prime Intellect an?“

list_availability

„Zeige mir 1×H100 Pods, die für unter 3 $/Std. verfügbar sind.“

get_wallet_balance

„Wie viel Guthaben habe ich noch?“

pod_quote

„Erstelle ein Angebot für eine 1×A100 mit 200 GB Festplatte.“ (kostenlos)

pod_create

„Stelle den Pod aus diesem Angebot bereit.“ (erfordert confirm=True)

pod_list

„Zeige mir meine laufenden Pods.“

pod_status

„Ist Pod X bereit? Warte, bis SSH-Informationen verfügbar sind.“

pod_terminate

„Beende Pod X.“ (erfordert confirm=True)

pod_check_runaway

„Habe ich vergessen, etwas zu beenden?“


Sicherheit: Nichts wird stillschweigend bereitgestellt

Drei Ebenen, in dieser Reihenfolge:

  1. Zuerst ein Angebot. pod_quote gibt einen Preis + ein 60-Sekunden-Token zurück. Keine Nebenwirkungen. Der Dollarbetrag befindet sich nun im Kontext des Agenten.

  2. Explizite Bestätigung. pod_create (und pod_terminate) erfordert confirm=True. Ohne dies erhalten Sie eine Trockenübung (Dry-Run-Vorschau).

  3. Feste Umgebungsvariablen-Obergrenzen. PRIME_MAX_HOURLY_USD blockiert jeden Pod, der über diesem Satz liegt. PRIME_MAX_TOTAL_USD blockiert jeden Pod, dessen (Satz × max_Laufzeit_Stunden) das Budget übersteigt. Das Wallet-Guthaben wird ebenfalls durchgesetzt. Keine dieser Obergrenzen kann durch Tool-Argumente außer Kraft gesetzt werden — sie werden bei jedem Aufruf gelesen.

Standardwerte: PRIME_MAX_HOURLY_USD=5, PRIME_MAX_TOTAL_USD=40. Legen Sie diese im env-Block Ihrer Konfiguration fest.

Jedes pod_create / pod_terminate wird als JSON an ~/.prime-intellect-mcp/audit.log angehängt, sodass Sie eine vollständige Historie darüber haben, was der Agent mit Ihrem Geld gemacht hat.


Beispiel-Prompts (fügen Sie diese in Claude Code ein)

List the cheapest 1×H100 pods available right now. Show me the top 3 by hourly price.
Quote a 1×A100 80GB with 100GB disk, 8 vCPU, 64GB RAM. Don't provision yet —
just show me what it would cost.
I need to fine-tune a 7B model overnight. Find the cheapest 1×H100 with 200GB
disk, max $40 total budget, max 12 hours. Provision it, give me the SSH command,
and remind me to terminate when I'm done.
Check if I have any running pods I forgot about and show me their hourly cost.
Terminate pod abc123. Confirm before doing it.

Fehlerbehebung

Entweder hat Ihre Claude Code-Konfiguration den env-Block nicht übernommen, oder Sie haben PRIME_API_KEY als eine andere Variable eingegeben. Überprüfen Sie dies mit:

$ env | grep PRIME

im selben Terminal, das Claude Code startet, oder fügen Sie den Schlüssel direkt in den JSON env-Block ein (anstatt ${PRIME_API_KEY} zu verwenden).

Der Agent hat einen Pod ausgewählt, der über Ihrer festen Obergrenze liegt. Entweder:

  • Wählen Sie eine günstigere GPU (list_availability mit einem Regionsfilter zeigt oft günstigere Community-Preise an), oder

  • Erhöhen Sie PRIME_MAX_HOURLY_USD in Ihrer Konfiguration und starten Sie Claude Code neu.

Angebote sind 60 Sekunden gültig; der Agent hat zu lange zwischen pod_quote und pod_create gewartet. Rufen Sie einfach erneut pod_quote auf — das verursacht keine Kosten.

Die Bereitstellung ist noch nicht vollständig abgeschlossen. Der Pod ist aktiv, führt aber noch sein Installationsskript aus. Rufen Sie pod_status(pod_id, wait_for_ssh=True) auf, und es wird blockiert (mit Abfrage alle 5 Sekunden), bis SSH verfügbar ist.

Sie haben Prime Intellect Ihren öffentlichen Schlüssel nicht mitgeteilt (oder der Pod wurde bereitgestellt, bevor Sie ihn registriert haben). Lösung:

  1. Überprüfen Sie, ob Ihr öffentlicher Schlüssel unter app.primeintellect.ai/dashboard/ssh-keys registriert ist.

  2. Erneute Bereitstellung — die authorized_keys des Pods werden zum Zeitpunkt der Erstellung festgelegt, daher übernehmen bestehende Pods keine Schlüssel, die Sie nachträglich registriert haben.

  3. Wenn Ihr privater Schlüssel eine Passphrase hat, führen Sie einmalig ssh-add --apple-use-keychain ~/.ssh/your_key auf macOS aus, damit der Agent ihn ab jetzt stillschweigend entsperrt.

Laden Sie Ihr Guthaben unter app.primeintellect.ai/wallet auf und versuchen Sie es erneut.


Warum noch eine Lösung?

Es gibt einen prime-mcp-server 0.1.2 auf PyPI. Dies ist ein einfacher Proof-of-Concept; dies ist kein Fork. Unterschiede für den unbeaufsichtigten Betrieb über Nacht:

prime-intellect-mcp

prime-mcp-server 0.1.2

Zwei-Schritte-Angebot → Bestätigung

Feste Ausgabenobergrenzen (Env-Var)

Wallet-Vorabprüfung

Erkennung von "Runaway"-Pods

SSH-Übergabe an Agent

Tests

32 Unit + optional Live

Keine


Lokale Entwicklung

git clone https://github.com/kvrancic/prime-intellect-mcp
cd prime-intellect-mcp
uv sync
uv run pytest -m "not live"        # 32 fast tests, no network, no spend
uv run ruff check .
uv run mypy src

Live-Rauchtest (stellt die günstigste verfügbare GPU bereit, führt nvidia-smi aus, beendet sie; ca. 0,05 $ Kosten):

PRIME_API_KEY=pit_... PRIME_LIVE_TEST=1 PRIME_LIVE_MAX_HOURLY=0.60 \
PRIME_MAX_HOURLY_USD=0.60 PRIME_MAX_TOTAL_USD=2.00 \
uv run pytest tests/test_smoke_live.py -v -s

Roadmap

  • v0.2register_ssh_key MCP-Tool (Dashboard-Schritt entfällt), Sandboxes (prime-sandboxes SDK), Environments Hub

  • v0.3 — Optionaler Auto-Terminate-Daemon (serverseitige Durchsetzung von max_lifetime_hours); Kosten-Telemetrie

  • v1.0+ — Gehostete/OAuth-Bereitstellung, sobald Prime Intellect OAuth anbietet; Einreichung beim Anthropic Connector-Verzeichnis


Danksagungen

Lizenz

MIT — siehe LICENSE.

Mitwirken

Issues und PRs sind willkommen. Bitte führen Sie uv run pytest -m "not live" und uv run ruff check . aus, bevor Sie etwas einreichen.

Install Server
A
license - permissive license
A
quality
B
maintenance

Maintenance

Maintainers
Response time
Release cycle
1Releases (12mo)

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/kvrancic/prime-intellect-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server