Skip to main content
Glama
everaldo
by everaldo

MCP 미스트랄 OCR

대장간 배지

Mistral AI의 OCR API를 사용하여 OCR 기능을 제공하는 MCP 서버입니다. 이 서버는 로컬 파일과 URL을 모두 처리할 수 있으며, 이미지와 PDF도 지원합니다.

특징

  • Mistral의 OCR을 사용하여 로컬 파일(이미지 및 PDF)을 처리합니다.

  • 명시적인 파일 유형 지정을 사용하여 URL에서 파일 처리

  • 다양한 파일 형식 지원(JPG, PNG, PDF 등)

  • 결과는 타임스탬프가 포함된 JSON 파일로 저장됩니다.

  • Docker 컨테이너화

  • UV 패키지 관리

Related MCP server: Handwriting OCR MCP Server

환경 변수

  • MISTRAL_API_KEY : Mistral AI API 키

  • OCR_DIR : 로컬 파일 처리를 위한 디렉토리 경로입니다. 컨테이너 내부에서는 항상 /data/ocr 에 매핑됩니다.

설치

Smithery를 통해 설치

Smithery 를 통해 Claude Desktop에 Mistral OCR을 자동으로 설치하려면:

지엑스피1

Docker 사용

  1. Docker 이미지를 빌드합니다.

docker build -t mcp-mistral-ocr .
  1. 컨테이너를 실행합니다.

docker run -e MISTRAL_API_KEY=your_api_key -e OCR_DIR=/data/ocr -v /path/to/local/files:/data/ocr mcp-mistral-ocr

지역 개발

  1. UV 패키지 관리자를 설치하세요:

pip install uv
  1. 가상 환경을 만들고 활성화하세요.

uv venv
source .venv/bin/activate  # On Unix
# or
.venv\Scripts\activate  # On Windows
  1. 종속성 설치:

uv pip install .

클로드 데스크톱 구성

claude_desktop_config.json에 다음 구성을 추가하세요.

{
  "mcpServers": {
    "mistral-ocr": {
      "command": "docker",
      "args": [
        "run",
        "-i",
        "--rm",
        "-e",
        "MISTRAL_API_KEY",
        "-e",
        "OCR_DIR",
        "-v",
        "C:/path/to/your/files:/data/ocr",
        "mcp-mistral-ocr:latest"
      ],
      "env": {
        "MISTRAL_API_KEY": "<YOUR_MISTRAL_API_KEY>",
        "OCR_DIR": "C:/path/to/your/files"
      }
    }
  }
}

사용 가능한 도구

1. 프로세스_로컬_파일

구성된 OCR_DIR 디렉토리에서 파일을 처리합니다.

{
    "name": "process_local_file",
    "arguments": {
        "filename": "document.pdf"
    }
}

2. 프로세스_URL_파일

URL에서 파일을 처리합니다. 명시적인 파일 유형 지정이 필요합니다.

{
    "name": "process_url_file",
    "arguments": {
        "url": "https://example.com/document",
        "file_type": "image"  // or "pdf"
    }
}

산출

OCR 결과는 OCR_DIR 내의 output 디렉터리에 JSON 형식으로 저장됩니다. 각 결과 파일의 이름은 다음 형식을 따릅니다.

  • 로컬 파일의 경우: {original_filename}_{timestamp}.json

  • URL의 경우: URL에 파일 이름이 없는 경우 {url_filename}_{timestamp}.json 또는 url_document_{timestamp}.json

타임스탬프 형식은 YYYYMMDD_HHMMSS 입니다.

지원되는 파일 유형

  • 이미지: JPG, JPEG, PNG, GIF, WebP

  • 문서: Mistral OCR에서 지원하는 PDF 및 기타 문서 형식

제한 사항

  • 최대 파일 크기: 50MB(Mistral API에 의해 적용됨)

  • 최대 문서 페이지: 1000(Mistral API에 의해 적용됨)

-
security - not tested
A
license - permissive license
-
quality - not tested

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/everaldo/mcp-mistral-ocr'

If you have feedback or need assistance with the MCP directory API, please join our Discord server