remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Pensamiento profundo de Claude 3.5 Soneto CLINE MCP
Un servidor de Protocolo de Contexto de Modelo (MCP) que combina las capacidades de razonamiento de DeepSeek R1 con la generación de respuestas de Claude 3.5 Sonnet mediante OpenRouter. Esta implementación utiliza un proceso de dos etapas donde DeepSeek proporciona razonamiento estructurado que posteriormente se incorpora a la generación de respuestas de Claude.
Características
- Procesamiento en dos etapas :
- Utiliza DeepSeek R1 para el razonamiento inicial (contexto de 50k caracteres)
- Utiliza el soneto Claude 3.5 para la respuesta final (contexto de 600 000 caracteres)
- Se accede a ambos modelos a través de la API unificada de OpenRouter
- Inyecta los tokens de razonamiento de DeepSeek en el contexto de Claude
- Gestión inteligente de conversaciones :
- Detecta conversaciones activas utilizando tiempos de modificación de archivos
- Maneja múltiples conversaciones simultáneas
- Filtra automáticamente las conversaciones finalizadas
- Admite la limpieza del contexto cuando es necesario
- Parámetros optimizados :
- Límites del contexto específico del modelo:
- DeepSeek: 50.000 caracteres para un razonamiento enfocado
- Claude: 600.000 caracteres para respuestas completas
- Configuraciones recomendadas:
- Temperatura: 0,7 para una creatividad equilibrada
- top_p: 1.0 para distribución de probabilidad completa
- repetition_penalty: 1.0 para evitar la repetición
- Límites del contexto específico del modelo:
Instalación
Instalación mediante herrería
Para instalar DeepSeek Thinking con Claude 3.5 Sonnet para Claude Desktop automáticamente a través de Smithery :
Instalación manual
- Clonar el repositorio:
- Instalar dependencias:
- Cree un archivo
.env
con su clave API de OpenRouter:
- Construir el servidor:
Uso con Cline
Agregue a su configuración de Cline MCP (generalmente en ~/.vscode/globalStorage/saoudrizwan.claude-dev/settings/cline_mcp_settings.json
):
Uso de herramientas
El servidor proporciona dos herramientas para generar y supervisar respuestas:
generar_respuesta
Herramienta principal para generar respuestas con los siguientes parámetros:
comprobar_estado_de_respuesta
Herramienta para comprobar el estado de una tarea de generación de respuesta:
Encuesta de respuesta
El servidor utiliza un mecanismo de sondeo para gestionar solicitudes de larga duración:
- Solicitud inicial:
generate_response
regresa inmediatamente con un ID de tarea- Formato de respuesta:
{"taskId": "uuid-here"}
- Comprobación de estado:
- Utilice
check_response_status
para sondear el estado de la tarea - Nota: Las respuestas pueden tardar hasta 60 segundos en completarse.
- El estado progresa a través de: pendiente → razonamiento → respondiendo → completo
- Utilice
Ejemplo de uso en Cline:
Desarrollo
Para desarrollo con reconstrucción automática:
Cómo funciona
- Etapa de razonamiento (DeepSeek R1) :
- Utiliza la función de tokens de razonamiento de OpenRouter
- El mensaje se modifica para mostrar "hecho" mientras se captura el razonamiento
- El razonamiento se extrae de los metadatos de respuesta.
- Etapa de respuesta (Soneto Claude 3.5) :
- Recibe el mensaje original y el razonamiento de DeepSeek
- Genera una respuesta final incorporando el razonamiento
- Mantiene el contexto y el historial de la conversación.
Licencia
Licencia MIT: consulte el archivo LICENCIA para obtener más detalles.
Créditos
Basado en el concepto RAT (Retrieval Augmented Thinking) de Skirano , que mejora las respuestas de la IA a través del razonamiento estructurado y la recuperación de conocimiento.
Esta implementación combina específicamente las capacidades de razonamiento de DeepSeek R1 con la generación de respuestas de Claude 3.5 Sonnet a través de la API unificada de OpenRouter.
You must be authenticated.
Facilita procesos de razonamiento en dos etapas utilizando DeepSeek para un análisis detallado y admite múltiples modelos de respuesta como Claude 3.5 Sonnet y OpenRouter, manteniendo el contexto de la conversación y mejorando las interacciones impulsadas por IA.