Volt HQ

El oráculo de precios de computación para agentes de IA.

Qué hace

Compara precios entre 9 proveedores (OpenAI, Anthropic, Groq, Together AI, DeepInfra, Fireworks AI, Cerebras, Hyperbolic, Akash) — más de 200 ofertas con precios de API en tiempo real
Recomienda el enrutamiento óptimo — le dice a su agente dónde obtener la misma calidad por menos, con estimaciones de ahorro
Realiza un seguimiento de gastos y presupuestos — resúmenes de gastos por proveedor/modelo, informes de ahorro y alertas de umbral

Instalación

Configure automáticamente Cursor y Claude Desktop con un solo comando:

npx volthq-mcp-server --setup

Detecta los clientes instalados y fusiona la configuración sin sobrescribir sus servidores MCP existentes.

Cursor — añada a .cursor/mcp.json:

{
  "mcpServers": {
    "volthq": {
      "command": "npx",
      "args": ["-y", "volthq-mcp-server"]
    }
  }
}

Claude Desktop — añada a claude_desktop_config.json:

{
  "mcpServers": {
    "volthq": {
      "command": "npx",
      "args": ["-y", "volthq-mcp-server"]
    }
  }
}

Herramientas

Herramienta	Descripción
`volt_check_price`	Compara precios entre proveedores para un modelo
`volt_recommend_route`	Obtiene la recomendación de proveedor óptima con estimación de ahorro
`volt_get_spend`	Resumen de gastos por proveedor y modelo (hoy/7d/30d)
`volt_get_savings`	Comparación de gasto real frente a gasto optimizado
`volt_set_budget_alert`	Establece alertas de umbral de presupuesto diario/semanal/mensual

Ejemplo

> volt_check_price { "model": "llama-70b" }

Price comparison for "llama-70b" — 14 offerings found
────────────────────────────────────────────────────────────
1. DeepInfra — Llama-70B
   Input: $0.20/M tokens | Output: $0.27/M tokens | Avg: $0.24/M
   Quality: 88% | Region: global

2. Hyperbolic — Llama-70B (FP8) on H100-SXM
   Input: $0.40/M tokens | Output: $0.40/M tokens | Avg: $0.40/M
   Quality: 85% | Region: global

3. Hyperbolic — Llama-70B (BF16) on H100-SXM
   Input: $0.55/M tokens | Output: $0.55/M tokens | Avg: $0.55/M
   Quality: 88% | Region: global

4. Groq — Llama-70B
   Input: $0.59/M tokens | Output: $0.79/M tokens | Avg: $0.69/M
   Quality: 88% | Region: global

5. Fireworks AI — Llama-70B
   Input: $0.90/M tokens | Output: $0.90/M tokens | Avg: $0.90/M
   Quality: 88% | Region: global

6. Together AI — Llama-70B
   Input: $0.88/M tokens | Output: $0.88/M tokens | Avg: $0.88/M
   Quality: 88% | Region: global

7. Akash — Llama-70B (FP8) on H100-SXM
   Input: $3.49/M tokens | Output: $8.72/M tokens | Avg: $6.11/M
   Quality: 85% | Region: global

8. Akash — Llama-70B (FP8) on A100-80GB
   Input: $5.24/M tokens | Output: $13.11/M tokens | Avg: $9.18/M
   Quality: 85% | Region: global

Cheapest is 97% less than most expensive option.

DeepInfra a $0.24/M, Hyperbolic a $0.40/M, Groq a $0.69/M, Fireworks AI a $0.90/M — todo frente a GPT-4o a $6.25/M.

Proveedores compatibles

OpenAI — GPT-4o, GPT-4o-mini
Anthropic — Claude Sonnet 4.6, Claude Haiku 4.5
Groq — Llama-70B, Llama-8B, Mixtral-8x7B
Together AI — Llama-70B, Llama-8B, DeepSeek-V3
DeepInfra — Más de 75 modelos con precios de API en tiempo real (Llama, DeepSeek, Qwen, Mistral, Gemma y más)
Fireworks AI — Llama-70B, Llama-8B, DeepSeek-V3
Cerebras — Llama-3.1-8B, Qwen-3-235B
Hyperbolic — DeepSeek-V3, DeepSeek-R1, Llama-70B, Llama-8B
Akash — Llama-70B, Llama-8B en H100 y A100 (precios de GPU en tiempo real)

Telemetría

Volt recopila metadatos de uso anónimos de forma predeterminada para mejorar las recomendaciones de enrutamiento. Esto incluye: nombre del proveedor, nombre del modelo, tiempo de respuesta de la herramienta y estado de éxito/fallo.

Lo que nunca se recopila: prompts, resultados, claves de API, recuentos de tokens o cualquier contenido que identifique al usuario. Las direcciones IP se codifican y truncan en el lado del servidor.

Para optar por no participar, establezca la variable de entorno:

VOLT_OBSERVATIONS=false

Enlaces

npm: volthq-mcp-server
Web: volthq.dev

Licencia

MIT

volthq-mcp-server