MCP 画像抽出ツール
LLM 分析用に画像を抽出し、base64 に変換する MCP サーバー。
この MCP サーバーは、AI アシスタントに次のツールを提供します。
- ローカルファイルから画像を抽出する
- URLから画像を抽出する
- Base64エンコードされた画像を処理する
カーソル内での表示:
適切なケース:
- 劇作家テストの結果を分析する: スクリーンショット
カーソルまたはその他のクライアントの場合
手動インストール
これによりmcp-image-extractor
コマンドがグローバルに使用できるようになります。
.cursor/mcp.json ファイルの使用
ローカル開発または特定のプロジェクトで作業する場合は、プロジェクト ルートに.cursor/mcp.json
ファイルを追加できます。
または、npm リンク経由でインストールした場合:
カーソル ユーザー向けの重要な注意: 「クライアントの作成に失敗しました」というエラーが表示された場合は、次の代替策を試してください。
オプション1: GitHubの直接インストールを使用する
次に
.cursor/mcp.json
で設定します。オプション2: クローンを作成してローカルで実行する
次に
.cursor/mcp.json
で設定します。
利用可能なツール
ファイルから画像を抽出する
ローカル ファイルから画像を抽出し、base64 に変換します。
パラメータ:
file_path
(必須): ローカル画像ファイルへのパス
**注:**すべての画像は、LLM 分析に最適なサイズ (最大 512x512) に自動的にサイズ変更され、base64 出力のサイズを制限し、コンテキスト ウィンドウの使用を最適化します。
URLから画像を抽出する
URL から画像を抽出し、base64 に変換します。
パラメータ:
url
(必須): 抽出する画像のURL
**注:**すべての画像は、LLM 分析に最適なサイズ (最大 512x512) に自動的にサイズ変更され、base64 出力のサイズを制限し、コンテキスト ウィンドウの使用を最適化します。
base64から画像を抽出する
LLM 分析用に base64 でエンコードされた画像を処理します。
パラメータ:
base64
(必須): Base64でエンコードされた画像データmime_type
(オプション、デフォルト:"image/png"):画像のMIMEタイプ
**注:**すべての画像は、LLM 分析に最適なサイズ (最大 512x512) に自動的にサイズ変更され、base64 出力のサイズを制限し、コンテキスト ウィンドウの使用を最適化します。
使用例
Claude のツールの使用方法の例を次に示します。
Claude は、 extract_image_from_file
ツールを自動的に使用して、画像コンテンツを読み込んで分析します。
Claude は、 extract_image_from_url
ツールを自動的に使用して、画像コンテンツを取得および分析します。
ドッカー
Docker でビルドして実行します。
ライセンス
マサチューセッツ工科大学
Related MCP Servers
- -securityFlicense-qualityA Model Context Protocol server that enables LLMs to extract and use content from unstructured documents across a wide variety of file formats.Last updated -2Python
- -securityAlicense-qualityA Model Context Protocol (MCP) server that enables Claude or other LLMs to fetch content from URLs, supporting HTML, JSON, text, and images with configurable request parameters.Last updated -PythonMIT License
- -securityAlicense-qualityA Model Context Protocol server that enables fetching and processing images from URLs, local file paths, and numpy arrays, returning them as base64-encoded strings with proper MIME types.Last updated -1PythonMIT License
- -securityFlicense-qualityA Model Context Protocol server that enables LLMs to fetch and process web content in multiple formats (HTML, JSON, Markdown, text) with automatic format detection.Last updated -TypeScript