MCP ミストラル OCR
Mistral AIのOCR APIを使用してOCR機能を提供するMCPサーバー。このサーバーは、ローカルファイルとURLの両方を処理でき、画像とPDFをサポートしています。
特徴
- MistralのOCRを使用してローカルファイル(画像とPDF)を処理する
- 明示的にファイルタイプを指定した URL からのファイルを処理する
- 複数のファイル形式(JPG、PNG、PDF など)をサポート
- 結果はタイムスタンプ付きのJSONファイルとして保存されます
- Dockerコンテナ化
- UVパッケージ管理
環境変数
MISTRAL_API_KEY
: Mistral AI APIキーOCR_DIR
: ローカルファイル処理用のディレクトリパス。コンテナ内では常に/data/ocr
にマッピングされます。
インストール
Smithery経由でインストール
Smithery経由で Claude Desktop 用の Mistral OCR を自動的にインストールするには:
Dockerの使用
- Docker イメージをビルドします。
- コンテナを実行します。
地域開発
- UV パッケージ マネージャーをインストールします。
- 仮想環境を作成してアクティブ化します。
- 依存関係をインストールします:
クロードデスクトップ構成
この設定を claude_desktop_config.json に追加します。
利用可能なツール
1. プロセスローカルファイル
設定された OCR_DIR ディレクトリからファイルを処理します。
2. プロセスURLファイル
URL からファイルを処理します。ファイルタイプの明示的な指定が必要です。
出力
OCR結果は、 OCR_DIR
内のoutput
ディレクトリにJSON形式で保存されます。各結果ファイルには、以下の形式で名前が付けられます。
- ローカルファイルの場合:
{original_filename}_{timestamp}.json
- URL の場合:
{url_filename}_{timestamp}.json
または URL にファイル名が見つからない場合はurl_document_{timestamp}.json
タイムスタンプの形式はYYYYMMDD_HHMMSS
です。
サポートされているファイル形式
- 画像: JPG、JPEG、PNG、GIF、WebP
- ドキュメント: Mistral OCR でサポートされている PDF およびその他のドキュメント形式
制限事項
- 最大ファイルサイズ: 50 MB (Mistral API によって強制)
- 最大ドキュメントページ数: 1000 (Mistral API によって強制)
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Mistral OCR API(有料)を使用して、ローカルまたは URL 経由で画像または PDF を OCR します。
Related Resources
Related MCP Servers
- -securityFlicense-qualityProvides tools for reading and extracting text from PDF files, supporting both local files and URLs.Last updated -3Python
- AsecurityAlicenseAqualityProvides image recognition capabilities using Anthropic Claude Vision and OpenAI GPT-4 Vision APIs, supporting multiple image formats and offering optional text extraction via Tesseract OCR.Last updated -39PythonMIT License
- AsecurityFlicenseAqualityAn MCP server that provides a tool to extract text content from local PDF files, supporting both standard PDF reading and OCR capabilities with optional page selection.Last updated -16Python
- -security-license-qualityA Retrieval-Augmented Generation server that enables semantic PDF search with OCR capabilities, allowing users to query document content through any MCP client and receive intelligent answers.Last updated -1PythonApache 2.0