MCP Mistral OCR

Name: mcp-mistral-ocr
Author: everaldo

insignia de herrería

Un servidor MCP que ofrece funciones de OCR mediante la API de OCR de Mistral AI. Este servidor puede procesar archivos locales y URL, además de imágenes y archivos PDF.

Características

Procese archivos locales (imágenes y PDF) utilizando el OCR de Mistral
Procesar archivos desde URL con especificación explícita del tipo de archivo
Soporte para múltiples formatos de archivos (JPG, PNG, PDF, etc.)
Resultados guardados como archivos JSON con marcas de tiempo
Contenedorización de Docker
Gestión de paquetes UV

Related MCP server: Handwriting OCR MCP Server

Variables de entorno

MISTRAL_API_KEY : Su clave API de Mistral AI
OCR_DIR : Ruta del directorio para el procesamiento local de archivos. Dentro del contenedor, siempre se asigna a /data/ocr

Instalación

Instalación mediante herrería

Para instalar Mistral OCR para Claude Desktop automáticamente a través de Smithery :

npx -y @smithery/cli install @everaldo/mcp/mistral-crosswalk --client claude

Usando Docker

Construya la imagen de Docker:

docker build -t mcp-mistral-ocr .

Ejecute el contenedor:

docker run -e MISTRAL_API_KEY=your_api_key -e OCR_DIR=/data/ocr -v /path/to/local/files:/data/ocr mcp-mistral-ocr

Desarrollo local

Instalar el administrador de paquetes UV:

pip install uv

Crear y activar entorno virtual:

uv venv source .venv/bin/activate # On Unix # or .venv\Scripts\activate # On Windows

Instalar dependencias:

uv pip install .

Configuración del escritorio de Claude

Agregue esta configuración a su claude_desktop_config.json:

{ "mcpServers": { "mistral-ocr": { "command": "docker", "args": [ "run", "-i", "--rm", "-e", "MISTRAL_API_KEY", "-e", "OCR_DIR", "-v", "C:/path/to/your/files:/data/ocr", "mcp-mistral-ocr:latest" ], "env": { "MISTRAL_API_KEY": "<YOUR_MISTRAL_API_KEY>", "OCR_DIR": "C:/path/to/your/files" } } } }

Herramientas disponibles

1. proceso_archivo_local

Procesar un archivo desde el directorio OCR_DIR configurado.

{ "name": "process_local_file", "arguments": { "filename": "document.pdf" } }

2. archivo_url_del_proceso

Procesar un archivo desde una URL. Requiere especificar explícitamente el tipo de archivo.

{ "name": "process_url_file", "arguments": { "url": "https://example.com/document", "file_type": "image" // or "pdf" } }

Producción

Los resultados del OCR se guardan en formato JSON en el directorio output , dentro de OCR_DIR . Cada archivo de resultados se nombra con el siguiente formato:

Para archivos locales: {original_filename}_{timestamp}.json
Para URL: {url_filename}_{timestamp}.json o url_document_{timestamp}.json si no se encuentra ningún nombre de archivo en la URL

El formato de la marca de tiempo es YYYYMMDD_HHMMSS .