hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Integrations
Provides compatibility with OpenAI API clients, serving as a drop-in replacement for standard OpenAI interfaces while implementing the Chain of Draft approach.
Servidor MCP de Cadena de Borrador (CoD)
Descripción general
Este servidor MCP implementa el enfoque de razonamiento Cadena de Borrador (CoD), como se describe en el artículo de investigación "Cadena de Borrador: Pensar más rápido escribiendo menos". CoD es un paradigma novedoso que permite a los LLM generar resultados de razonamiento intermedios minimalistas pero informativos al resolver tareas, lo que reduce significativamente el uso de tokens y mantiene la precisión.
Beneficios clave
- Eficiencia : uso de tokens significativamente reducido (tan solo el 7,6 % del CoT estándar)
- Velocidad : Respuestas más rápidas debido a un tiempo de generación más corto
- Ahorro de costes : menores costes de API para llamadas LLM
- Precisión mantenida : Precisión similar o incluso mejorada en comparación con CoT
- Flexibilidad : aplicable a diversas tareas y dominios de razonamiento.
Características
- Cadena central de implementación del borrador
- Pasos de razonamiento concisos (normalmente 5 palabras o menos)
- Cumplimiento de formato
- Extracción de respuestas
- Análisis de rendimiento
- Seguimiento del uso de tokens
- Monitoreo de la precisión de la solución
- Medición del tiempo de ejecución
- Métricas de rendimiento específicas del dominio
- Límites de palabras adaptables
- Estimación automática de la complejidad
- Ajuste dinámico de los límites de palabras
- Calibración específica del dominio
- Base de datos de ejemplos completa
- Transformación de CoT a CoD
- Ejemplos específicos de dominio (matemáticas, código, biología, física, química, rompecabezas)
- Recuperación de ejemplos basada en la similitud de problemas
- Aplicación del formato
- Posprocesamiento para garantizar el cumplimiento de los límites de palabras
- Preservación de la estructura escalonada
- Análisis de adherencia
- Enfoques de razonamiento híbrido
- Selección automática entre CoD y CoT
- Optimización específica del dominio
- Selección basada en el rendimiento histórico
- Compatibilidad de la API de OpenAI
- Reemplazo directo para los clientes estándar de OpenAI
- Soporte tanto para finalizaciones como para interfaces de chat
- Fácil integración en flujos de trabajo existentes
Configuración e instalación
Prerrequisitos
- Python 3.10+ (para la implementación de Python)
- Node.js 18+ (para implementación de JavaScript)
- Clave API antrópica
Instalación de Python
- Clonar el repositorio
- Instalar dependencias:Copy
- Configurar claves API en el archivo
.env
:Copy - Ejecutar el servidor:Copy
Instalación de JavaScript
- Clonar el repositorio
- Instalar dependencias:Copy
- Configurar claves API en el archivo
.env
:Copy - Ejecutar el servidor:Copy
Integración de escritorio de Claude
Para integrar con Claude Desktop:
- Instalar Claude Desktop desde claude.ai/download
- Cree o edite el archivo de configuración de Claude Desktop:Copy
- Agregue la configuración del servidor (versión de Python):O para la versión JavaScript:CopyCopy
- Reiniciar Claude Desktop
También puedes usar la CLI de Claude para agregar el servidor:
Herramientas disponibles
El servidor Chain of Draft proporciona las siguientes herramientas:
Herramienta | Descripción |
---|---|
chain_of_draft_solve | Resolver un problema utilizando el razonamiento de cadena de borrador |
math_solve | Resolver un problema de matemáticas con CoD |
code_solve | Resolver un problema de codificación con CoD |
logic_solve | Resolver un problema de lógica con CoD |
get_performance_stats | Obtén estadísticas de rendimiento de CoD vs. CoT |
get_token_reduction | Obtener estadísticas de reducción de tokens |
analyze_problem_complexity | Analizar la complejidad del problema |
Uso del desarrollador
Cliente Python
Si desea utilizar el cliente Chain of Draft directamente en su código Python:
Cliente JavaScript
Para aplicaciones JavaScript/Node.js:
Detalles de implementación
El servidor está disponible en implementaciones de Python y JavaScript, ambas constan de varios componentes integrados:
Implementación de Python
- AnalyticsService : realiza un seguimiento de las métricas de rendimiento en diferentes dominios de problemas y enfoques de razonamiento.
- ComplexityEstimator : analiza problemas para determinar límites de palabras apropiados
- ExampleDatabase : administra y recupera ejemplos, transformando ejemplos de CoT al formato CoD
- FormatEnforcer : garantiza que los pasos de razonamiento se ajusten a los límites de palabras
- ReasoningSelector : elige inteligentemente entre CoD y CoT según las características del problema
Implementación de JavaScript
- analyticsDb : Base de datos en memoria para el seguimiento de métricas de rendimiento
- complexityEstimator : Analiza problemas para determinar la complejidad y los límites de palabras apropiados
- formatEnforcer : garantiza que los pasos de razonamiento se ajusten a los límites de palabras
- reasoningSelector : elige automáticamente entre CoD y CoT según las características del problema y el rendimiento histórico
Ambas implementaciones siguen los mismos principios básicos y proporcionan herramientas MCP idénticas, lo que las hace intercambiables para la mayoría de los casos de uso.
Licencia
Este proyecto es de código abierto y está disponible bajo la licencia MIT.
You must be authenticated.
Tools
Implementa el enfoque de razonamiento de cadena de borrador para generar resultados de razonamiento intermedios minimalistas al resolver tareas, lo que reduce significativamente el uso de tokens y mantiene la precisión.
- Overview
- Key Benefits
- Features
- Setup and Installation
- Claude Desktop Integration
- Available Tools
- Developer Usage
- Implementation Details
- License