mcp-mistral-ocr

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Integrations

  • Supports containerized deployment using Docker, with configuration options for environment variables and volume mounting to access local files.

MCP Mistral OCR

Un servidor MCP que ofrece funciones de OCR mediante la API de OCR de Mistral AI. Este servidor puede procesar archivos locales y URL, además de imágenes y archivos PDF.

Características

  • Procese archivos locales (imágenes y PDF) utilizando el OCR de Mistral
  • Procesar archivos desde URL con especificación explícita del tipo de archivo
  • Soporte para múltiples formatos de archivos (JPG, PNG, PDF, etc.)
  • Resultados guardados como archivos JSON con marcas de tiempo
  • Contenedorización de Docker
  • Gestión de paquetes UV

Variables de entorno

  • MISTRAL_API_KEY : Su clave API de Mistral AI
  • OCR_DIR : Ruta del directorio para el procesamiento local de archivos. Dentro del contenedor, siempre se asigna a /data/ocr

Instalación

Instalación mediante herrería

Para instalar Mistral OCR para Claude Desktop automáticamente a través de Smithery :

npx -y @smithery/cli install @everaldo/mcp/mistral-crosswalk --client claude

Usando Docker

  1. Construya la imagen de Docker:
docker build -t mcp-mistral-ocr .
  1. Ejecute el contenedor:
docker run -e MISTRAL_API_KEY=your_api_key -e OCR_DIR=/data/ocr -v /path/to/local/files:/data/ocr mcp-mistral-ocr

Desarrollo local

  1. Instalar el administrador de paquetes UV:
pip install uv
  1. Crear y activar entorno virtual:
uv venv source .venv/bin/activate # On Unix # or .venv\Scripts\activate # On Windows
  1. Instalar dependencias:
uv pip install .

Configuración del escritorio de Claude

Agregue esta configuración a su claude_desktop_config.json:

{ "mcpServers": { "mistral-ocr": { "command": "docker", "args": [ "run", "-i", "--rm", "-e", "MISTRAL_API_KEY", "-e", "OCR_DIR", "-v", "C:/path/to/your/files:/data/ocr", "mcp-mistral-ocr:latest" ], "env": { "MISTRAL_API_KEY": "<YOUR_MISTRAL_API_KEY>", "OCR_DIR": "C:/path/to/your/files" } } } }

Herramientas disponibles

1. proceso_archivo_local

Procesar un archivo desde el directorio OCR_DIR configurado.

{ "name": "process_local_file", "arguments": { "filename": "document.pdf" } }

2. archivo_url_del_proceso

Procesar un archivo desde una URL. Requiere especificar explícitamente el tipo de archivo.

{ "name": "process_url_file", "arguments": { "url": "https://example.com/document", "file_type": "image" // or "pdf" } }

Producción

Los resultados del OCR se guardan en formato JSON en el directorio output , dentro de OCR_DIR . Cada archivo de resultados se nombra con el siguiente formato:

  • Para archivos locales: {original_filename}_{timestamp}.json
  • Para URL: {url_filename}_{timestamp}.json o url_document_{timestamp}.json si no se encuentra ningún nombre de archivo en la URL

El formato de la marca de tiempo es YYYYMMDD_HHMMSS .

Tipos de archivos admitidos

  • Imágenes: JPG, JPEG, PNG, GIF, WebP
  • Documentos: PDF y otros formatos de documentos compatibles con Mistral OCR

Limitaciones

  • Tamaño máximo de archivo: 50 MB (impuesto por la API de Mistral)
  • Número máximo de páginas del documento: 1000 (impuesto por la API de Mistral)
-
security - not tested
F
license - not found
-
quality - not tested

OCR de imágenes o archivos PDF, localmente o por URL mediante la API de OCR de Mistral (pago)

  1. Features
    1. Environment Variables
      1. Installation
        1. Installing via Smithery
        2. Using Docker
        3. Local Development
      2. Claude Desktop Configuration
        1. Available Tools
          1. 1. process_local_file
          2. 2. process_url_file
        2. Output
          1. Supported File Types
            1. Limitations
              ID: 798rkh8r8l