`mcp-sage`

Un servidor MCP (Protocolo de Contexto de Modelo) que proporciona herramientas para enviar solicitudes al modelo O3 de OpenAI o a Gemini 2.5 Pro de Google, según el número de tokens. Las herramientas integran todas las rutas de archivo referenciadas (de forma recursiva para las carpetas) en la solicitud. Esto resulta útil para obtener segundas opiniones o revisiones de código detalladas de un modelo capaz de gestionar gran cantidad de contexto con precisión.

Razón fundamental

Uso Claude Code con frecuencia. Es un producto excelente que se adapta bien a mi flujo de trabajo. Sin embargo, los modelos más recientes con gran cantidad de contexto parecen muy útiles para trabajar con bases de código más complejas donde se necesita más contexto. Esto me permite seguir usando Claude Code como herramienta de desarrollo y, al mismo tiempo, aprovechar las amplias capacidades de contexto de O3 y Gemini 2.5 Pro para ampliar el contexto limitado de Claude Code.

Selección de modelos

El servidor selecciona automáticamente el modelo apropiado según el recuento de tokens y las claves API disponibles:

Para contextos más pequeños (≤ 200 000 tokens): utiliza el modelo O3 de OpenAI (si OPENAI_API_KEY está configurado)
Para contextos más grandes (> 200 000 y ≤ 1 000 000 de tokens): utiliza Gemini 2.5 Pro de Google (si GEMINI_API_KEY está configurado)
Si el contenido supera 1 millón de tokens: devuelve un error informativo

Comportamiento de respaldo:

Clave API de respaldo :
- Si falta OPENAI_API_KEY, se utilizará Gemini para todos los contextos dentro de su límite de tokens de 1 millón
- Si falta GEMINI_API_KEY, solo se pueden procesar contextos más pequeños (≤ 200K tokens) con O3
- Si faltan ambas claves API, se devuelve un error informativo
Conectividad de red alternativa :
- Si la API de OpenAI no está disponible (error de red), el sistema recurre automáticamente a Gemini.
- Esto proporciona resiliencia frente a problemas de red temporales con un proveedor.
- Requiere que GEMINI_API_KEY esté configurado para que la opción de respaldo funcione

Inspiración

Este proyecto se inspira en otros dos proyectos de código abierto:

simonw/files-to-prompt para la compresión de archivos
asadm/vibemode por la idea y la solicitud para enviar el repositorio completo a Gemini para obtener sugerencias de edición al por mayor
PhialsBasement/Chain-of-Recursive-Thoughts, inspiración para la herramienta Sage-Plan

Descripción general

Este proyecto implementa un servidor MCP que expone tres herramientas:

`sage-opinion`

Toma un mensaje y una lista de rutas de archivos/directorios como entrada
Empaqueta los archivos en un formato XML estructurado
Mide el número de tokens y selecciona el modelo apropiado:
- O3 para ≤ 200K tokens
- Gemini 2.5 Pro para más de 200 000 y menos de 1 000 tokens
Envía el mensaje combinado + contexto al modelo seleccionado
Devuelve la respuesta del modelo.

`sage-review`

Toma una instrucción para cambios de código y una lista de rutas de archivos/directorios como entrada
Empaqueta los archivos en un formato XML estructurado
Mide el número de tokens y selecciona el modelo apropiado:
- O3 para ≤ 200K tokens
- Gemini 2.5 Pro para más de 200 000 y menos de 1 000 tokens
Crea un mensaje especializado que indica al modelo cómo formatear las respuestas usando bloques BUSCAR/REEMPLAZAR
Envía el contexto + instrucción combinado al modelo seleccionado
Devuelve sugerencias de edición formateadas como bloques de BÚSQUEDA/REEMPLAZAR para una fácil implementación

`sage-plan`

Toma un mensaje solicitando un plan de implementación y una lista de rutas de archivos/directorios como entrada
Empaqueta los archivos en un formato XML estructurado
Orquesta un debate multimodelo para generar un plan de implementación de alta calidad
Los modelos critican y refinan los planes de los demás a través de múltiples rondas.
Devuelve el plan de implementación ganador con pasos detallados.

sage-plan - Flujos de trabajo multimodelo y de autodebate

La herramienta sage-plan no le pide a un solo modelo un plan. En cambio, organiza un debate estructurado que se desarrolla en una o más rondas y luego le pide a un modelo de juez independiente (o al mismo modelo en modo CoRT) que elija al ganador.

1. Flujo de debate multimodelo

flowchart TD S0[Start Debate] -->|determine models, judge, budgets| R1 subgraph R1["Round 1"] direction TB R1GEN["Generation Phase *ALL models run in parallel*"] R1GEN --> R1CRIT["Critique Phase *ALL models critique others in parallel*"] end subgraph RN["Rounds 2 to N"] direction TB SYNTH["Synthesis Phase *every model refines own plan*"] SYNTH --> CONS[Consensus Check] CONS -->|Consensus reached| JUDGE CONS -->|No consensus & round < N| CRIT["Critique Phase *models critique in parallel*"] CRIT --> SYNTH end R1 --> RN JUDGE[Judgment Phase *judge model selects/merges plan*] JUDGE --> FP[Final Plan] classDef round fill:#e2eafe,stroke:#4169E1; class R1GEN,R1CRIT,SYNTH,CRIT round; style FP fill:#D0F0D7,stroke:#2F855A,stroke-width:2px style JUDGE fill:#E8E8FF,stroke:#555,stroke-width:1px

Fases clave en el debate multimodelo:

Fase de configuración

El sistema determina los modelos disponibles, selecciona un juez y asigna presupuestos de tokens.

Ronda 1

Fase de generación : cada modelo disponible (A, B, C, etc.) escribe su propio plan de implementación en paralelo
Fase de crítica : cada modelo revisa todos los demás planes (nunca el suyo propio) y produce críticas estructuradas en paralelo.

Rondas 2 a N (N por defecto es 3)

Fase de síntesis : cada modelo mejora su plan anterior utilizando las críticas que recibió (los modelos trabajan en paralelo)
Comprobación de consenso : el modelo del juez evalúa la similitud entre todos los planes actuales
- Si la puntuación es ≥ 0,9, el debate se detiene antes de tiempo y pasa al Juicio.
Fase de crítica : si no se llega a un consenso Y no estamos en la ronda final, cada modelo vuelve a criticar todos los demás planes (en paralelo).

Fase de juicio

Después de completar todas las rondas (o alcanzar un consenso temprano), el modelo de juez (O3 por defecto):
- Selecciona el mejor plan único O fusiona varios planes en uno superior
- Proporciona una puntuación de confianza para su selección/síntesis

2. Flujo de autodebate: modelo único disponible

flowchart TD SD0[Start Self-Debate] --> R1 subgraph R1["Round 1 - Initial Plans"] direction TB P1[Generate Plan 1] --> P2[Generate Plan 2 *different approach*] P2 --> P3[Generate Plan 3 *different approach*] end subgraph RN["Rounds 2 to N"] direction TB REF[Generate Improved Plan *addresses weaknesses in all previous plans*] DEC{More rounds left?} REF --> DEC DEC -->|Yes| REF end R1 --> RN DEC -->|No| FP[Final Plan = last plan generated] style FP fill:#D0F0D7,stroke:#2F855A,stroke-width:2px

Cuando solo hay un modelo disponible, se utiliza un enfoque de cadena de pensamientos recursivos (CoRT) :

Explosión inicial : el modelo genera tres planes distintos, cada uno con un enfoque diferente
Rondas de refinamiento : para cada ronda subsiguiente (2 a N, predeterminado N=3):
- El modelo revisa todos los planes anteriores
- Los critica internamente, identificando fortalezas y debilidades.
- Produce un nuevo plan mejorado que aborda las limitaciones de los planes anteriores.
Selección final : el último plan generado se convierte en el plan de implementación final

Qué sucede realmente en el código (referencia rápida)

Fase / Funcionalidad	Ubicación del código	Notas
Avisos de generación	indicaciones/debatePrompts.generatePrompt	Añade el encabezado "# Plan de Implementación (Modelo X)"
Indicaciones de crítica	indicaciones/debatePrompts.critiquePrompt	Utiliza las secciones "## Crítica del plan {ID}"
Indicaciones de síntesis	indicaciones/debatePrompts.synthesizePrompt	Modelo revisa su propio plan
Comprobación de consenso	debateOrchestrator.checkConsensus	El modelo Judge devuelve JSON con `consensusScore`
Juicio	indicaciones/debatePrompts.judgePrompt	Juez devuelve "#PlanDefinitivoDeImplementación" + confianza
Indicación de autodebate	indicaciones/debatePrompts.selfDebatePrompt	Bucle de cadena de pensamientos recursivos

Consideraciones sobre rendimiento y costos

⚠️ Importante: La herramienta sage-plan puede:

Toma una cantidad significativa de tiempo completarlo (5 a 10 minutos con varios modelos)
Consumir una cantidad sustancial de tokens API debido a múltiples rondas de debate
Incurren en costos más altos que los enfoques de modelo único

Uso típico de recursos:

Debate multimodelo: 2-4 veces más tokens que con un enfoque de modelo único
Tiempo de procesamiento: 5-10 minutos dependiendo de la complejidad y disponibilidad del modelo.
Costos de API: $0,30 a $1,50 por generación de plan (varía según los modelos utilizados y la complejidad del plan)

Prerrequisitos

Node.js (v18 o posterior)
Una clave API de Google Gemini (para contextos más amplios)
Una clave API de OpenAI (para contextos más pequeños)

Instalación

# Clone the repository git clone https://github.com/your-username/mcp-sage.git cd mcp-sage # Install dependencies npm install # Build the project npm run build

Variables de entorno

Establezca las siguientes variables de entorno:

OPENAI_API_KEY : Su clave API de OpenAI (para el modelo O3)
GEMINI_API_KEY : Su clave API de Google Gemini (para Gemini 2.5 Pro)

Uso

Después de compilar con npm run build , agregue lo siguiente a su configuración de MCP:

OPENAI_API_KEY=your_openai_key GEMINI_API_KEY=your_gemini_key node /path/to/this/repo/dist/index.js

También puedes utilizar variables de entorno configuradas en otro lugar, como en tu perfil de shell.

Incitación

Para obtener una segunda opinión sobre algo, simplemente solicite una segunda opinión.

Para obtener una revisión de código, solicite una revisión de código o una revisión de un experto.

Ambos se benefician al proporcionar rutas de archivos que desea que se incluyan en el contexto, pero si se omiten, el LLM del host probablemente inferirá qué incluir.

Depuración y monitorización

El servidor proporciona información de monitorización detallada mediante la función de registro de MCP. Estos registros incluyen:

Estadísticas de uso de tokens y selección de modelos
Número de archivos y documentos incluidos en la solicitud
Métricas del tiempo de procesamiento de solicitudes
Información de error cuando se superan los límites de tokens

Los registros se envían mediante el método notifications/message del protocolo MCP, lo que garantiza que no interfieran con la comunicación JSON-RPC. Los clientes MCP compatibles con el registro mostrarán estos registros correctamente.

Ejemplos de entradas de registro:

Token usage: 1,234 tokens. Selected model: o3-2025-04-16 (limit: 200,000 tokens) Files included: 3, Document count: 3 Sending request to OpenAI o3-2025-04-16 with 1,234 tokens... Received response from o3-2025-04-16 in 982ms

Token usage: 235,678 tokens. Selected model: gemini-2.5-pro-preview-03-25 (limit: 1,000,000 tokens) Files included: 25, Document count: 18 Sending request to Gemini with 235,678 tokens... Received response from gemini-2.5-pro-preview-03-25 in 3240ms

Usando las herramientas

Herramienta de opinión de sabios

La herramienta sage-opinion acepta los siguientes parámetros:

prompt (cadena, obligatorio): el mensaje que se enviará al modelo seleccionado
paths (matriz de cadenas, obligatoria): lista de rutas de archivos para incluir como contexto

Ejemplo de llamada a la herramienta MCP (usando JSON-RPC 2.0):

{ "jsonrpc": "2.0", "id": 1, "method": "tools/call", "params": { "name": "sage-opinion", "arguments": { "prompt": "Explain how this code works", "paths": ["path/to/file1.js", "path/to/file2.js"] } } }

Herramienta de revisión de sage

La herramienta sage-review acepta los siguientes parámetros:

instruction (cadena, obligatoria): Los cambios o mejoras específicos necesarios
paths (matriz de cadenas, obligatoria): lista de rutas de archivos para incluir como contexto

Ejemplo de llamada a la herramienta MCP (usando JSON-RPC 2.0):

{ "jsonrpc": "2.0", "id": 1, "method": "tools/call", "params": { "name": "sage-review", "arguments": { "instruction": "Add error handling to the function", "paths": ["path/to/file1.js", "path/to/file2.js"] } } }

La respuesta contendrá bloques BUSCAR/REEMPLAZAR que puedes usar para implementar los cambios sugeridos:

<<<<<<< SEARCH function getData() { return fetch('/api/data') .then(res => res.json()); } ======= function getData() { return fetch('/api/data') .then(res => { if (!res.ok) { throw new Error(`HTTP error! Status: ${res.status}`); } return res.json(); }) .catch(error => { console.error('Error fetching data:', error); throw error; }); } >>>>>>> REPLACE

Herramienta de planificación de salvia

La herramienta sage-plan acepta los siguientes parámetros:

prompt (cadena, obligatorio): Descripción de lo que necesita un plan de implementación para
paths (matriz de cadenas, obligatoria): lista de rutas de archivos para incluir como contexto

Ejemplo de llamada a la herramienta MCP (usando JSON-RPC 2.0):

{ "jsonrpc": "2.0", "id": 1, "method": "tools/call", "params": { "name": "sage-plan", "arguments": { "prompt": "Create an implementation plan for adding user authentication to this application", "paths": ["src/index.js", "src/models/", "src/routes/"] } } }

La respuesta contiene un plan de implementación detallado con:

Descripción general de la arquitectura de alto nivel
Pasos de implementación específicos
Se necesitan cambios de archivo
Estrategia de prueba
Posibles desafíos y mitigaciones

Este plan se beneficia de la inteligencia colectiva de múltiples modelos de IA (o de una autoevaluación exhaustiva por parte de un solo modelo) y generalmente contiene recomendaciones más sólidas, reflexivas y detalladas que un enfoque de una sola pasada.

Ejecución de las pruebas

Para probar las herramientas:

# Test the sage-opinion tool OPENAI_API_KEY=your_openai_key GEMINI_API_KEY=your_gemini_key node test/run-test.js # Test the sage-review tool OPENAI_API_KEY=your_openai_key GEMINI_API_KEY=your_gemini_key node test/test-expert.js # Test the sage-plan tool OPENAI_API_KEY=your_openai_key GEMINI_API_KEY=your_gemini_key node test/run-sage-plan.js # Test the model selection logic specifically OPENAI_API_KEY=your_openai_key GEMINI_API_KEY=your_gemini_key node test/test-o3.js

Nota : La prueba del plan sabio puede tardar entre 5 y 15 minutos en ejecutarse, ya que organiza un debate de múltiples modelos.

Estructura del proyecto

src/index.ts : La implementación principal del servidor MCP con definiciones de herramientas
src/pack.ts : Herramienta para empaquetar archivos en un formato XML estructurado
src/tokenCounter.ts : Utilidades para contar tokens en un mensaje
src/gemini.ts : Implementación del cliente API de Gemini
src/openai.ts : Implementación del cliente de API de OpenAI para el modelo O3
src/debateOrchestrator.ts : Orquestación de debates multimodelo para sage-plan
src/prompts/debatePrompts.ts : Plantillas para indicaciones e instrucciones de debate
test/run-test.js : Prueba para la herramienta sage-opinion
test/test-expert.js : Prueba para la herramienta sage-review
test/run-sage-plan.js : Prueba para la herramienta sage-plan
test/test-o3.js : Prueba de la lógica de selección del modelo

Licencia

ISC

Deploy Server

HTTP connection URL

security – no known vulnerabilities

license - not tested

quality - confirmed to work

How are these scores calculated?

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Tools

Un servidor MCP que proporciona herramientas para obtener segundas opiniones o revisiones de código detalladas de Gemini 2.5 Pro incorporando contenidos de archivos en las indicaciones, lo que le permite manejar grandes bases de código con un contexto extenso.

Related MCP Servers

Yellhorn MCP
msnidal
A
security
-
license
A
quality
An MCP server that connects Gemini 2.5 Pro to Claude Code, enabling users to generate detailed implementation plans based on their codebase and receive feedback on code changes.
Last updated -
2
14
Gemini Thinking MCP Server
falahgs
-
security
-
license
-
quality
A Model Context Protocol (MCP) server implementation for the Google Gemini language model. This server allows Claude Desktop users to access the powerful reasoning capabilities of Gemini-2.0-flash-thinking-exp-01-21 model.
Last updated -
1
MIT License
GemForge-Gemini-Tools-MCP
PV-Bhat
A
security
-
license
A
quality
Professional Gemini API integration for Claude and MCP-compatible hosts with intelligent model selection and advanced file handling capabilities.
Last updated -
4
3
MIT License
Claude Code Review MCP
praneybehl
A
security
-
license
A
quality
An MCP server that provides code review functionality using OpenAI, Google, and Anthropic models, serving as a "second opinion" tool that works with any MCP client.
Last updated -
1
10
17
MIT License

View all related MCP servers

MCP Sage

`mcp-sage`

Razón fundamental

Selección de modelos

Inspiración

Descripción general

`sage-opinion`

`sage-review`

`sage-plan`

sage-plan - Flujos de trabajo multimodelo y de autodebate

1. Flujo de debate multimodelo

2. Flujo de autodebate: modelo único disponible

Qué sucede realmente en el código (referencia rápida)

Consideraciones sobre rendimiento y costos

Prerrequisitos

Instalación

Variables de entorno

Uso

Incitación

Depuración y monitorización

Usando las herramientas

Herramienta de opinión de sabios

Herramienta de revisión de sage

Herramienta de planificación de salvia

Ejecución de las pruebas

Estructura del proyecto

Licencia

Tools

Related MCP Servers

Yellhorn MCP

Gemini Thinking MCP Server

GemForge-Gemini-Tools-MCP

Claude Code Review MCP

New MCP Servers

MCP directory API