Servidor MCP Whissle
Un servidor basado en Python que proporciona acceso a los puntos finales de la API de Whissle para conversión de voz a texto, diarización, traducción y resumen de texto.
⚠️ Notas importantes
Este servidor proporciona acceso a los puntos finales de la API de Whissle, lo que puede generar costos.
Cada herramienta que realiza una llamada API está marcada con una advertencia de costo
Por favor, siga estas pautas:
Utilice las herramientas únicamente cuando el usuario lo solicite explícitamente
Para las herramientas que procesan audio, tenga en cuenta la duración del audio, ya que afecta los costos.
Algunas operaciones como la traducción o el resumen pueden tener costos más elevados.
Las herramientas sin advertencias de costo en su descripción son de uso gratuito ya que solo leen datos existentes
Prerrequisitos
Python 3.8 o superior
pip (instalador de paquetes de Python)
Un token de autenticación de la API de Whissle
Instalación
Clonar el repositorio:
git clone <repository-url> cd whissle_mcpCrear y activar un entorno virtual:
python -m venv venv source venv/bin/activate # On Windows, use: venv\Scripts\activateInstalar los paquetes necesarios:
pip install -e .Configurar variables de entorno: Cree un archivo
.enven la raíz del proyecto con el siguiente contenido:WHISSLE_AUTH_TOKEN=insert_auth_token_here # Replace with your actual Whissle API token WHISSLE_MCP_BASE_PATH=/path/to/your/base/directory⚠️ Importante : Nunca envíes tu token al repositorio. El archivo
.envestá incluido en.gitignorepara evitar envíos accidentales.Configurar la integración de Claude: copie
claude_config.example.jsonenclaude_config.jsony actualice las rutas:{ "mcpServers": { "Whissle": { "command": "/path/to/your/venv/bin/python", "args": [ "/path/to/whissle_mcp/server.py" ], "env": { "WHISSLE_AUTH_TOKEN": "insert_auth_token_here" } } } }Reemplace
/path/to/your/venv/bin/pythoncon la ruta real a su intérprete de Python en el entorno virtualReemplace
/path/to/whissle_mcp/server.pycon la ruta real a su archivo server.py
Configuración
Variables de entorno
WHISSLE_AUTH_TOKEN: Su token de autenticación de la API de Whissle (obligatorio)Esta es una credencial confidencial que nunca debe compartirse ni entregarse al control de versiones.
Comuníquese con su administrador para obtener un token válido
Guárdelo de forma segura en su archivo
.envlocal
WHISSLE_MCP_BASE_PATH: Directorio base para operaciones de archivos (opcional, el valor predeterminado es el escritorio del usuario)
Formatos de audio compatibles
El servidor admite los siguientes formatos de audio:
WAV (.wav)
MP3 (.mp3)
OGG (.ogg)
FLAC (.flac)
M4A (.m4a)
Límites de tamaño de archivo
Tamaño máximo de archivo: 25 MB
Los archivos que superen este límite serán rechazados.
Herramientas disponibles
1. Voz a texto
Convierte voz en texto usando la API Whissle.
2. Diarización del habla
Convierte voz en texto con identificación del hablante.
3. Traducción de texto
Traducir texto de un idioma a otro.
4. Resumen del texto
Resumir texto utilizando un modelo LLM.
5. Enumere los modelos ASR
Enumere todos los modelos ASR disponibles y sus capacidades.
Formato de respuesta
Conversión de voz a texto y diarización
Traducción
Resumen
Respuesta de error
Manejo de errores
El servidor incluye un manejo robusto de errores con:
Reintentos automáticos para errores HTTP 500
Mensajes de error detallados para diferentes escenarios de falla
Validación de archivos (existencia, tamaño, formato)
Comprobaciones de autenticación
Tipos de errores comunes:
HTTP 500: Error del servidor (con mecanismo de reintento)
HTTP 413: Archivo demasiado grande
HTTP 415: Formato de archivo no compatible
HTTP 401/403: Error de autenticación
Ejecución del servidor
Iniciar el servidor:
mcp serveEl servidor estará disponible en el puerto MCP predeterminado (normalmente 8000)
Pruebas
Se proporciona un script de prueba para verificar la funcionalidad de todas las herramientas:
El script de prueba hará lo siguiente:
Comprobar el token de autenticación
Pruebe todas las herramientas disponibles
Proporcionar resultados detallados de cada operación
Manejar los errores con elegancia
Apoyo
Para problemas o preguntas, por favor:
Consulte los mensajes de error para obtener detalles específicos
Verifique su token de autenticación
Asegúrese de que sus archivos de audio cumplan con los requisitos
Comuníquese con el soporte de Whissle para problemas relacionados con la API
Licencia
[Agregue la información de su licencia aquí]
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Un servidor basado en Python que proporciona acceso a los puntos finales de la API de Whissle para conversión de voz a texto, diarización, traducción y resumen de texto.
Related MCP Servers
- -security-license-qualityA server providing text-to-speech and speech-to-text functionalities using Windows' native speech services without external dependencies.Last updated -5
- -security-license-qualityEnables recording audio from a microphone and transcribing it using OpenAI's Whisper model. Works as both a standalone MCP server and a Goose AI agent extension.Last updated -6MIT License
- -security-license-qualityA server that enables AI assistants like Claude to safely run Python code and access websites, processing data for better AI understanding while providing helpful error messages.Last updated -3GPL 3.0
- -security-license-qualityA portable, Dockerized Python tool that implements Model Context Protocol for audio transcription using Whisper models, featuring both CLI and web UI interfaces for converting audio files to JSON transcriptions.Last updated -MIT License
Appeared in Searches
- Automating File Processing and Communication Tasks
- A workflow for processing and sharing meeting-related materials
- A workflow for processing and summarizing voice recordings into meeting notes and sending emails
- A search for translation services or information
- A platform providing TTS (Text-to-Speech) capabilities