Skip to main content
Glama

mcp-mistral-ocr

by everaldo

MCP Mistral OCR

Un servidor MCP que ofrece funciones de OCR mediante la API de OCR de Mistral AI. Este servidor puede procesar archivos locales y URL, además de imágenes y archivos PDF.

Características

  • Procese archivos locales (imágenes y PDF) utilizando el OCR de Mistral
  • Procesar archivos desde URL con especificación explícita del tipo de archivo
  • Soporte para múltiples formatos de archivos (JPG, PNG, PDF, etc.)
  • Resultados guardados como archivos JSON con marcas de tiempo
  • Contenedorización de Docker
  • Gestión de paquetes UV

Variables de entorno

  • MISTRAL_API_KEY : Su clave API de Mistral AI
  • OCR_DIR : Ruta del directorio para el procesamiento local de archivos. Dentro del contenedor, siempre se asigna a /data/ocr

Instalación

Instalación mediante herrería

Para instalar Mistral OCR para Claude Desktop automáticamente a través de Smithery :

npx -y @smithery/cli install @everaldo/mcp/mistral-crosswalk --client claude

Usando Docker

  1. Construya la imagen de Docker:
docker build -t mcp-mistral-ocr .
  1. Ejecute el contenedor:
docker run -e MISTRAL_API_KEY=your_api_key -e OCR_DIR=/data/ocr -v /path/to/local/files:/data/ocr mcp-mistral-ocr

Desarrollo local

  1. Instalar el administrador de paquetes UV:
pip install uv
  1. Crear y activar entorno virtual:
uv venv source .venv/bin/activate # On Unix # or .venv\Scripts\activate # On Windows
  1. Instalar dependencias:
uv pip install .

Configuración del escritorio de Claude

Agregue esta configuración a su claude_desktop_config.json:

{ "mcpServers": { "mistral-ocr": { "command": "docker", "args": [ "run", "-i", "--rm", "-e", "MISTRAL_API_KEY", "-e", "OCR_DIR", "-v", "C:/path/to/your/files:/data/ocr", "mcp-mistral-ocr:latest" ], "env": { "MISTRAL_API_KEY": "<YOUR_MISTRAL_API_KEY>", "OCR_DIR": "C:/path/to/your/files" } } } }

Herramientas disponibles

1. proceso_archivo_local

Procesar un archivo desde el directorio OCR_DIR configurado.

{ "name": "process_local_file", "arguments": { "filename": "document.pdf" } }

2. archivo_url_del_proceso

Procesar un archivo desde una URL. Requiere especificar explícitamente el tipo de archivo.

{ "name": "process_url_file", "arguments": { "url": "https://example.com/document", "file_type": "image" // or "pdf" } }

Producción

Los resultados del OCR se guardan en formato JSON en el directorio output , dentro de OCR_DIR . Cada archivo de resultados se nombra con el siguiente formato:

  • Para archivos locales: {original_filename}_{timestamp}.json
  • Para URL: {url_filename}_{timestamp}.json o url_document_{timestamp}.json si no se encuentra ningún nombre de archivo en la URL

El formato de la marca de tiempo es YYYYMMDD_HHMMSS .

Tipos de archivos admitidos

  • Imágenes: JPG, JPEG, PNG, GIF, WebP
  • Documentos: PDF y otros formatos de documentos compatibles con Mistral OCR

Limitaciones

  • Tamaño máximo de archivo: 50 MB (impuesto por la API de Mistral)
  • Número máximo de páginas del documento: 1000 (impuesto por la API de Mistral)
-
security - not tested
F
license - not found
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

OCR de imágenes o archivos PDF, localmente o por URL mediante la API de OCR de Mistral (pago)

  1. Características
    1. Variables de entorno
      1. Instalación
        1. Instalación mediante herrería
        2. Usando Docker
        3. Desarrollo local
      2. Configuración del escritorio de Claude
        1. Herramientas disponibles
          1. proceso\_archivo\_local
          2. archivo\_url\_del\_proceso
        2. Producción
          1. Tipos de archivos admitidos
            1. Limitaciones

              Related MCP Servers

              • -
                security
                F
                license
                -
                quality
                Provides tools for reading and extracting text from PDF files, supporting both local files and URLs.
                Last updated -
                3
                Python
              • A
                security
                A
                license
                A
                quality
                Provides image recognition capabilities using Anthropic Claude Vision and OpenAI GPT-4 Vision APIs, supporting multiple image formats and offering optional text extraction via Tesseract OCR.
                Last updated -
                3
                9
                Python
                MIT License
                • Linux
                • Apple
              • A
                security
                F
                license
                A
                quality
                An MCP server that provides a tool to extract text content from local PDF files, supporting both standard PDF reading and OCR capabilities with optional page selection.
                Last updated -
                1
                6
                Python
                • Apple
              • -
                security
                -
                license
                -
                quality
                A Retrieval-Augmented Generation server that enables semantic PDF search with OCR capabilities, allowing users to query document content through any MCP client and receive intelligent answers.
                Last updated -
                1
                Python
                Apache 2.0

              View all related MCP servers

              MCP directory API

              We provide all the information about MCP servers via our MCP API.

              curl -X GET 'https://glama.ai/api/mcp/v1/servers/everaldo/mcp-mistral-ocr'

              If you have feedback or need assistance with the MCP directory API, please join our Discord server