Servidor MCP de grabadora de voz

Name: Voice Recorder MCP Server
Author: DefiBax

Un servidor MCP para grabar audio y transcribirlo usando el modelo Whisper de OpenAI. Diseñado para funcionar como una extensión personalizada de Goose o como un servidor MCP independiente.

Características

Grabar audio desde el micrófono predeterminado
Transcribir grabaciones usando Whisper
Se integra con el agente Goose AI como una extensión personalizada
Incluye indicaciones para escenarios de grabación comunes.

Related MCP server: Audio Transcriber MCP Server

Instalación

# Install from source git clone https://github.com/DefiBax/voice-recorder-mcp.git cd voice-recorder-mcp pip install -e .

Uso

Como servidor MCP independiente

# Run with default settings (base.en model) voice-recorder-mcp # Use a specific Whisper model voice-recorder-mcp --model medium.en # Adjust sample rate voice-recorder-mcp --sample-rate 44100

Pruebas con MCP Inspector

El Inspector MCP proporciona una interfaz interactiva para probar su servidor:

# Install the MCP Inspector npm install -g @modelcontextprotocol/inspector # Run your server with the inspector npx @modelcontextprotocol/inspector voice-recorder-mcp

Con Goose AI Agent

Abra Goose y vaya a Configuración > Extensiones > Agregar > Extensión de línea de comandos
Establezca el nombre en voice-recorder
En el campo Comando, ingrese la ruta completa al ejecutable voice-recorder-mcp:
/full/path/to/voice-recorder-mcp
O para un modelo específico:
/full/path/to/voice-recorder-mcp --model medium.en
Para encontrar la ruta, ejecute:
which voice-recorder-mcp
No se necesitan variables de entorno para la funcionalidad básica
Inicia una conversación con Goose y presenta la grabadora con: "Quiero que tomes medidas a partir de las transcripciones devueltas por la grabadora de voz. Por ejemplo, si dicto un cálculo como 1+1, por favor, devuelve el resultado".

Herramientas disponibles

start_recording : Iniciar grabación de audio desde el micrófono predeterminado
stop_and_transcribe : Detener la grabación y transcribir el audio a texto
record_and_transcribe : graba audio durante una duración específica y lo transcribe

Modelos susurrantes

Esta extensión admite varios tamaños de modelos Whisper:

Modelo	Velocidad	Exactitud	Uso de la memoria	Caso de uso
`tiny.en`	Lo más rápido	Más bajo	Mínimo	Pruebas, transcripciones rápidas
`base.en`	Rápido	Bien	Bajo	Uso diario (predeterminado)
`small.en`	Medio	Mejor	Moderado	Buen equilibrio
`medium.en`	Lento	Alto	Alto	Grabaciones importantes
`large`	El más lento	Más alto	Muy alto	Transcripciones críticas

El sufijo .en indica modelos especializados para inglés, que son más rápidos y precisos para el contenido en inglés.

Requisitos

Python 3.12+
Un dispositivo de entrada de audio (micrófono)

Configuración

Puede configurar el servidor utilizando variables de entorno:

# Set Whisper model export WHISPER_MODEL=small.en # Set audio sample rate export SAMPLE_RATE=44100 # Set maximum recording duration (seconds) export MAX_DURATION=120 # Then run the server voice-recorder-mcp

Solución de problemas

Problemas comunes

No se graba audio : Verifique los permisos y la configuración de su micrófono
Errores de descarga del modelo : asegúrese de tener una conexión a Internet estable para la descarga inicial del modelo
Integración con Goose : asegúrese de que la ruta del comando sea correcta
Problemas de calidad de audio : intente ajustar la frecuencia de muestreo (predeterminada: 16000)