MCP ミストラル OCR
Mistral AIのOCR APIを使用してOCR機能を提供するMCPサーバー。このサーバーは、ローカルファイルとURLの両方を処理でき、画像とPDFをサポートしています。
特徴
- MistralのOCRを使用してローカルファイル(画像とPDF)を処理する
- 明示的にファイルタイプを指定した URL からのファイルを処理する
- 複数のファイル形式(JPG、PNG、PDF など)をサポート
- 結果はタイムスタンプ付きのJSONファイルとして保存されます
- Dockerコンテナ化
- UVパッケージ管理
環境変数
MISTRAL_API_KEY
: Mistral AI APIキーOCR_DIR
: ローカルファイル処理用のディレクトリパス。コンテナ内では常に/data/ocr
にマッピングされます。
インストール
Smithery経由でインストール
Smithery経由で Claude Desktop 用の Mistral OCR を自動的にインストールするには:
Dockerの使用
- Docker イメージをビルドします。
- コンテナを実行します。
地域開発
- UV パッケージ マネージャーをインストールします。
- 仮想環境を作成してアクティブ化します。
- 依存関係をインストールします:
クロードデスクトップ構成
この設定を claude_desktop_config.json に追加します。
利用可能なツール
1. プロセスローカルファイル
設定された OCR_DIR ディレクトリからファイルを処理します。
2. プロセスURLファイル
URL からファイルを処理します。ファイルタイプの明示的な指定が必要です。
出力
OCR結果は、 OCR_DIR
内のoutput
ディレクトリにJSON形式で保存されます。各結果ファイルには、以下の形式で名前が付けられます。
- ローカルファイルの場合:
{original_filename}_{timestamp}.json
- URL の場合:
{url_filename}_{timestamp}.json
または URL にファイル名が見つからない場合はurl_document_{timestamp}.json
タイムスタンプの形式はYYYYMMDD_HHMMSS
です。
サポートされているファイル形式
- 画像: JPG、JPEG、PNG、GIF、WebP
- ドキュメント: Mistral OCR でサポートされている PDF およびその他のドキュメント形式
制限事項
- 最大ファイルサイズ: 50 MB (Mistral API によって強制)
- 最大ドキュメントページ数: 1000 (Mistral API によって強制)
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Mistral OCR API(有料)を使用して、ローカルまたは URL 経由で画像または PDF を OCR します。
Related Resources
Related MCP Servers
- -securityFlicense-qualityProvides tools for reading and extracting text from PDF files, supporting both local files and URLs.Last updated -28
- -securityFlicense-qualityEnables integration between MCP clients and the Handwriting OCR service, allowing users to upload images and PDF documents, check processing status, and retrieve OCR results as Markdown.Last updated -8
Textin MCP Serverofficial
AsecurityAlicenseAqualityA server that enables OCR capabilities to recognize text from images, PDFs, and Word documents, convert them to Markdown, and extract key information.Last updated -311023MIT License- -securityFlicense-qualityEnables reading and processing various document formats including Word, PDF, RTF, and text files. Supports extracting media elements like images and links, with features for PDF page range selection and automatic text encoding detection.Last updated -2