Skip to main content
Glama

mcp-mistral-ocr

by everaldo

MCP ミストラル OCR

Mistral AIのOCR APIを使用してOCR機能を提供するMCPサーバー。このサーバーは、ローカルファイルとURLの両方を処理でき、画像とPDFをサポートしています。

特徴

  • MistralのOCRを使用してローカルファイル(画像とPDF)を処理する
  • 明示的にファイルタイプを指定した URL からのファイルを処理する
  • 複数のファイル形式(JPG、PNG、PDF など)をサポート
  • 結果はタイムスタンプ付きのJSONファイルとして保存されます
  • Dockerコンテナ化
  • UVパッケージ管理

環境変数

  • MISTRAL_API_KEY : Mistral AI APIキー
  • OCR_DIR : ローカルファイル処理用のディレクトリパス。コンテナ内では常に/data/ocrにマッピングされます。

インストール

Smithery経由でインストール

Smithery経由で Claude Desktop 用の Mistral OCR を自動的にインストールするには:

npx -y @smithery/cli install @everaldo/mcp/mistral-crosswalk --client claude

Dockerの使用

  1. Docker イメージをビルドします。
docker build -t mcp-mistral-ocr .
  1. コンテナを実行します。
docker run -e MISTRAL_API_KEY=your_api_key -e OCR_DIR=/data/ocr -v /path/to/local/files:/data/ocr mcp-mistral-ocr

地域開発

  1. UV パッケージ マネージャーをインストールします。
pip install uv
  1. 仮想環境を作成してアクティブ化します。
uv venv source .venv/bin/activate # On Unix # or .venv\Scripts\activate # On Windows
  1. 依存関係をインストールします:
uv pip install .

クロードデスクトップ構成

この設定を claude_desktop_config.json に追加します。

{ "mcpServers": { "mistral-ocr": { "command": "docker", "args": [ "run", "-i", "--rm", "-e", "MISTRAL_API_KEY", "-e", "OCR_DIR", "-v", "C:/path/to/your/files:/data/ocr", "mcp-mistral-ocr:latest" ], "env": { "MISTRAL_API_KEY": "<YOUR_MISTRAL_API_KEY>", "OCR_DIR": "C:/path/to/your/files" } } } }

利用可能なツール

1. プロセスローカルファイル

設定された OCR_DIR ディレクトリからファイルを処理します。

{ "name": "process_local_file", "arguments": { "filename": "document.pdf" } }

2. プロセスURLファイル

URL からファイルを処理します。ファイルタイプの明示的な指定が必要です。

{ "name": "process_url_file", "arguments": { "url": "https://example.com/document", "file_type": "image" // or "pdf" } }

出力

OCR結果は、 OCR_DIR内のoutputディレクトリにJSON形式で保存されます。各結果ファイルには、以下の形式で名前が付けられます。

  • ローカルファイルの場合: {original_filename}_{timestamp}.json
  • URL の場合: {url_filename}_{timestamp}.jsonまたは URL にファイル名が見つからない場合はurl_document_{timestamp}.json

タイムスタンプの形式はYYYYMMDD_HHMMSSです。

サポートされているファイル形式

  • 画像: JPG、JPEG、PNG、GIF、WebP
  • ドキュメント: Mistral OCR でサポートされている PDF およびその他のドキュメント形式

制限事項

  • 最大ファイルサイズ: 50 MB (Mistral API によって強制)
  • 最大ドキュメントページ数: 1000 (Mistral API によって強制)
-
security - not tested
F
license - not found
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Mistral OCR API(有料)を使用して、ローカルまたは URL 経由で画像または PDF を OCR します。

  1. 特徴
    1. 環境変数
      1. インストール
        1. Smithery経由でインストール
        2. Dockerの使用
        3. 地域開発
      2. クロードデスクトップ構成
        1. 利用可能なツール
          1. プロセスローカルファイル
          2. プロセスURLファイル
        2. 出力
          1. サポートされているファイル形式
            1. 制限事項

              Related MCP Servers

              • -
                security
                F
                license
                -
                quality
                Provides tools for reading and extracting text from PDF files, supporting both local files and URLs.
                Last updated -
                3
                Python
              • A
                security
                A
                license
                A
                quality
                Provides image recognition capabilities using Anthropic Claude Vision and OpenAI GPT-4 Vision APIs, supporting multiple image formats and offering optional text extraction via Tesseract OCR.
                Last updated -
                3
                9
                Python
                MIT License
                • Linux
                • Apple
              • A
                security
                F
                license
                A
                quality
                An MCP server that provides a tool to extract text content from local PDF files, supporting both standard PDF reading and OCR capabilities with optional page selection.
                Last updated -
                1
                6
                Python
                • Apple
              • -
                security
                -
                license
                -
                quality
                A Retrieval-Augmented Generation server that enables semantic PDF search with OCR capabilities, allowing users to query document content through any MCP client and receive intelligent answers.
                Last updated -
                1
                Python
                Apache 2.0

              View all related MCP servers

              MCP directory API

              We provide all the information about MCP servers via our MCP API.

              curl -X GET 'https://glama.ai/api/mcp/v1/servers/everaldo/mcp-mistral-ocr'

              If you have feedback or need assistance with the MCP directory API, please join our Discord server