Skip to main content
Glama

🪄 ImageSorcery MCP

🪄 ImageSorcery MCP

ComputerVision ベースの🪄 AI アシスタント用画像認識および編集ツールの魔法

❌ ImageSorcery MCPなし

AI アシスタントは画像を扱う際には制限があります。

  • ❌ 画像を直接変更または分析することはできません
  • ❌ 画像の切り取り、サイズ変更、加工ができない
  • ❌ 一部のLLMは画像から物体を検出したりテキストを抽出したりできない
  • ❌ 視覚的な操作を行わず、言葉による説明のみに限定

✅ ImageSorcery MCPを使用

🪄 ImageSorcery 、強力な画像処理機能で AI アシスタントを強化します。

  • ✅ 画像を正確に切り抜き、サイズ変更、回転します
  • ✅ 画像にテキストや図形を描く
  • ✅ 最先端のモデルを使用してオブジェクトを検出する
  • ✅ OCRを使って画像からテキストを抽出する
  • ✅ 詳細な画像メタデータを取得する
  • ✅ オブジェクト検出、OCR などに、幅広い事前トレーニング済みモデルを使用できます

AI に画像タスクの支援を依頼するだけです:

「ペットの写真をフォルダーのphotosからpetsフォルダーにコピーする」 ペットをコピーする

「photo.jpg で猫を見つけ、高さと幅を半分に切り取って、猫が中央にくるようにします」中心猫 😉***ヒント:*ファイルへのフルパスを使用してください。

foduucom/web-form-ui-field-detectionモデルを使用して、このform.jpgのフォーム フィールドを数値化し、記述されたフィールドのリストをform.mdに入力します。」フォームフィールドを数値化する 😉***ヒント:*モデルと信頼度を指定します。

😉***ヒント:*適切なツールが使用されるように、「use imagesorcery」を追加します。

あなたのツールは、あなたの目標を達成するために、以下にリストされている複数のツールを組み合わせます。

🛠️ 利用可能なツール

道具説明例のプロンプト
cropOpenCVのNumPyスライスアプローチを使用して画像を切り抜きます「画像 'input.png' を座標 (10,10) から (200,200) まで切り取り、 'cropped.png' として保存します。」
resizeOpenCVを使用して画像のサイズを変更します「画像 'photo.jpg' を 800x600 ピクセルにサイズ変更し、 'resized_photo.jpg' として保存します。」
rotateimutils.rotate_bound関数を使用して画像を回転します「画像 'photo.jpg' を 45 度回転して 'rotated_photo.jpg' として保存します」
draw_textsOpenCVを使用して画像にテキストを描画する「画像「photo.jpg」の(50,50)の位置に「Hello World」というテキストを追加し、右下隅に「Copyright 2023」というテキストを追加します。」
draw_rectanglesOpenCVを使用して画像に長方形を描画します「画像 'photo.jpg' に (50,50) から (150,100) までの赤い四角形と、(200,150) から (300,250) までの塗りつぶされた青い四角形を描画してください。」
get_metainfo画像ファイルに関するメタデータ情報を取得します「画像 'photo.jpg' のメタデータ情報を取得する」
detectUltralyticsのモデルを使用して画像内のオブジェクトを検出します「信頼度しきい値0.4で画像「photo.jpg」内のオブジェクトを検出します」
findテキストの説明に基づいて画像内のオブジェクトを検索します「信頼度閾値 0.4 で、画像 'photo.jpg' 内のすべての犬を見つけてください」
get_modelsモデルディレクトリ内の利用可能なすべてのモデルを一覧表示します「モデルディレクトリ内の利用可能なすべてのモデルを一覧表示する」
ocrEasyOCRを使用して画像に対して光学文字認識(OCR)を実行します「OCRを使用して画像「document.jpg」から英語のテキストを抽出します」

😉***ヒント:*各ツールの詳細情報と使用方法については、ツールの/src/imagesorcery_mcp/tools/README.mdを参照してください。

🚀 はじめに

要件

  • Python 3.10以上
  • Claude.appCline 、または他のMCPクライアント

インストール

ImageSorcery デモ

1. Load MCP documentation if you have the tool for it. It will give you path to *MCP-configuration file* and other needed instructions. 2. Run command `python -m venv imagesorcery-mcp` 3. Run command `source imagesorcery-mcp/bin/activate` For windows bash run command `source imagesorcery-mcp/Scripts/activate` For windows cmd run command `imagesorcery-mcp\Scripts\activate` 4. Run command `pip install imagesorcery-mcp` 5. Run command `imagesorcery-mcp --post-install` 6. Create or modify *MCP-configuration file*. 7. Add the `imagesorcery-mcp` server configuration to the `mcpServers` object in the *MCP-configuration file* `"imagesorcery-mcp": {"command": "/full/path/to/venv/bin/imagesorcery-mcp","timeout": 100}` 8. Get available models using `get_models` tool from `imagesorcery-mcp` 9. Attempt completion, indicating that the installation and configuration are complete.
  1. **仮想環境を作成してアクティブ化する (強く推奨):**すべてのコンポーネント、特にclipパッケージ (インストール後のスクリプトによってインストールされる) を確実にインストールするには、 uv venvではなく、Python の組み込みvenvモジュールを使用することを強くお勧めします
    python -m venv imagesorcery-mcp source imagesorcery-mcp/bin/activate # For Linux/macOS # source imagesorcery-mcp\Scripts\activate # For Windows
  2. アクティブ化された仮想環境にパッケージをインストールします。pip pip``uv pipを使用できます。
    pip install imagesorcery-mcp # OR, if you prefer using uv for installation into the venv: # uv pip install imagesorcery-mcp
  3. **インストール後のスクリプトを実行する:**このステップは非常に重要です。必要なモデルをダウンロードし、GitHubからclip Pythonパッケージをアクティブな仮想環境にインストールしようとします。
    imagesorcery-mcp --post-install
  • 事前トレーニング済みのモデルを保存するためのmodelsディレクトリ (通常は仮想環境の site-packages ディレクトリ内、またはグローバルにインストールされている場合はユ���ザー固有の場所) を作成します。
  • そこに初期models/model_descriptions.jsonファイルを生成します。
  • detectツールに必要なデフォルトの YOLO モデル ( yoloe-11l-seg-pf.ptyoloe-11s-seg-pf.ptyoloe-11l-seg.ptyoloe-11s-seg.pt ) をこのmodelsディレクトリにダウンロードします。
  • UltralyticsのGitHubリポジトリから**clip PythonパッケージをアクティブなPython環境に直接インストールしようとします**。これは、 findツールのテキストプロンプト機能に必要です。
  • findツールに必要な CLIP モデル ファイルをmodelsディレクトリにダウンロードします。

このプロセスをいつでも実行して、デフォルトのモデルを復元し、 clipインストールを試行できます。

  • **uv venvを使用した仮想環境の作成:**テストの結果、 uv venvで作成された仮想環境にはpipが含まれていない可能性があり、 imagesorcery-mcp --post-installスクリプトがGitHubからclipパッケージを自動的にインストールできない可能性があります( clipインストール手順で「No module named pip」エラーが発生する可能性があります)。 uv venvを使用する場合は、次の点に注意してください。
    1. uv venvを作成してアクティブ化します。
    2. imagesorcery-mcpをインストールします: uv pip install imagesorcery-mcp
    3. アクティブなuv venvclipパッケージを手動でインストールします。
      uv pip install git+https://github.com/ultralytics/CLIP.git
    4. imagesorcery-mcp --post-installを実行してください。モデルはダウンロードされますが、 clip Pythonパッケージのインストールに失敗する可能性があります。post-installスクリプトによるclip自動インストールをよりスムーズに行うには、仮想環境を作成する際にpython -m venv (上記の手順1を参照)を使用することをお勧めします。
  • uvx imagesorcery-mcp --post-installの使用: uvxで直接インストール後のスクリプトを実行すると(例: uvx imagesorcery-mcp --post-install )、 clip Python パッケージのインストールに失敗する可能性があります。これは、 uvx``uvx作成された一時環境では通常、スクリプトが使用できるようなpipが用意されていないためです。モデルはダウンロードされますが、このコマンドではclipパッケージはインストールされません。uvx を使用してメインのimagesorcery-mcpサーバーを実行し、 clip機能が必要な場合は、 uvxが検出できるアクセス可能な Python 環境にclipパッケージがインストールされていることを確認するか、 python -m venvで作成された永続的な環境にimagesorcery-mcpをインストールすることを検討する必要があります。

⚙️ MCP クライアントの構成

MCPクライアントに以下の設定を追加してください。インストール後、 imagesorcery-mcpシステムのPATHに含まれている場合は、 imagesorcery-mcpコマンドとして直接使用できます。そうでない場合は、実行ファイルへのフルパスを指定する必要があります。

"mcpServers": { "imagesorcery-mcp": { "command": "imagesorcery-mcp", // Or /full/path/to/venv/bin/imagesorcery-mcp if installed in a venv "transportType": "stdio", "autoApprove": ["detect", "crop", "get_models", "draw_texts", "get_metainfo", "rotate", "resize", "classify", "draw_rectangles", "find", "ocr"], "timeout": 100 } }
"mcpServers": { "imagesorcery-mcp": { "command": "imagesorcery-mcp.exe", // Or C:\\full\\path\\to\\venv\\Scripts\\imagesorcery-mcp.exe if installed in a venv "transportType": "stdio", "autoApprove": ["detect", "crop", "get_models", "draw_texts", "get_metainfo", "rotate", "resize", "classify", "draw_rectangles", "find", "ocr"], "timeout": 100 } }

📦 追加モデル

一部のツールでは、 modelsディレクトリに特定のモデルが用意されている必要があります。

# Download models for the detect tool download-yolo-models --ultralytics yoloe-11l-seg download-yolo-models --huggingface ultralytics/yolov8:yolov8m.pt

モデルをダウンロードすると、スクリプトはmodels/model_descriptions.jsonファイルを自動的に更新します。

  • Ultralytics モデルの場合: 説明はsrc/imagesorcery_mcp/scripts/create_model_descriptions.pyで事前定義されており、各モデルの目的、サイズ、特性に関する詳細情報が含まれています。
  • Hugging Faceモデルの場合:説明文はHugging Face Hubのモデルカードから自動的に抽出されます。スクリプトは、モデルインデックスまたは説明文の最初の行からモデル名を取得しようとします。

モデルをダウンロードした後、 models/model_descriptions.jsonの説明を確認し、必要に応じて調整して、モデルの機能やユースケースに関するより正確で詳細な情報を提供することをお勧めします。

🤝 貢献する

ディレクトリ構造

このリポジトリは次のように構成されています。

. ├── .gitignore # Specifies intentionally untracked files that Git should ignore. ├── pyproject.toml # Configuration file for Python projects, including build system, dependencies, and tool settings. ├── pytest.ini # Configuration file for the pytest testing framework. ├── README.md # The main documentation file for the project. ├── setup.sh # A shell script for quick setup (legacy, for reference or local use). ├── models/ # This directory stores pre-trained models used by tools like `detect` and `find`. It is typically ignored by Git due to the large file sizes. │ ├── model_descriptions.json # Contains descriptions of the available models. │ ├── settings.json # Contains settings related to model management and training runs. │ └── *.pt # Pre-trained model. ├── src/ # Contains the source code for the 🪄 ImageSorcery MCP server. │ └── imagesorcery_mcp/ # The main package directory for the server. │ ├── __init__.py # Makes `imagesorcery_mcp` a Python package. │ ├── __main__.py # Entry point for running the package as a script. │ ├── logging_config.py # Configures the logging for the server. │ ├── server.py # The main server file, responsible for initializing FastMCP and registering tools. │ ├── logs/ # Directory for storing server logs. │ ├── scripts/ # Contains utility scripts for model management. │ │ ├── README.md # Documentation for the scripts. │ │ ├── __init__.py # Makes `scripts` a Python package. │ │ ├── create_model_descriptions.py # Script to generate model descriptions. │ │ ├── download_clip.py # Script to download CLIP models. │ │ ├── post_install.py # Script to run post-installation tasks. │ │ └── download_models.py # Script to download other models (e.g., YOLO). │ └── tools/ # Contains the implementation of individual MCP tools. │ ├── README.md # Documentation for the tools. │ ├── __init__.py # Import the central logger │ └── *.py # Implements the tool. └── tests/ # Contains test files for the project. ├── test_server.py # Tests for the main server functionality. ├── data/ # Contains test data, likely image files used in tests. └── tools/ # Contains tests for individual tools.

開発セットアップ

  1. リポジトリをクローンします。
git clone https://github.com/sunriseapps/imagesorcery-mcp.git # Or your fork cd imagesorcery-mcp
  1. (推奨) 仮想環境を作成してアクティブ化します。
python -m venv venv source venv/bin/activate # For Linux/macOS # venv\Scripts\activate # For Windows
  1. 開発依存関係とともに編集可能モードでパッケージをインストールします。
pip install -e ".[dev]"

これにより、 imagesorcery-mcp[project.dependencies]および[project.optional-dependencies].devからのすべての依存関係 ( buildおよびtwineを含む) がインストールされます。

ルール

これらのルールは、人間と AI を含むすべての貢献者に適用されます。

  1. プロジェクト内のすべてのREADME.mdファイルを読んでください。プロジェクトの構造と目的を理解し、貢献のためのガイドラインを理解してください。それが自分のタスクとどのように関連しているか、そしてそれに応じてどのように変更を加えるべきかをよく考えてください。
  2. pyproject.toml読んでください。 [tool.ruff][tool.ruff.lint][project.optional-dependencies][project]dependenciesの各セクションに注意してください。pyproject.toml で定義されているコードスタイルに厳密に従ってくださいpyproject.toml``pyproject.toml依存関係で定義されているスタックを厳守し、正当な理由がない限り新しい依存関係を追加しないでください。
  3. 新規ファイルと既存ファイルにコードを記述してください。新しい依存関係が必要な場合は、 pyproject.tomlを更新し、 pip install -e .またはpip install -e ".[dev]"でインストールしてください。 pip installで直接インストールしないでください。例として、既存のソースコードを確認してください(例: src/imagesorcery_mcp/server.pysrc/imagesorcery_mcp/tools/crop.py )。既存コードのコードスタイル、命名規則、入出力データ形式、コード構造、アーキテクチャなどに従ってください。
  4. 関連するREADME.mdファイルに変更を加えて更新してください。既存のREADME.mdファイルの形式と構造に従ってください。
  5. コードのテストを記述してください。既存のテスト例(例: tests/test_server.pytests/tools/test_crop.py )を参考にしてください。既存のテストのコードスタイル、命名規則、入出力データ形式、コード構造、アーキテクチャなどに従ってください。
  6. テストとリンターを実行して、すべてが機能することを確認します。
pytest ruff check .

失敗した場合は、コードとテストを修正してください。すべての新しいコードはリンタールールに準拠し、すべてのテストに合格することが必須です。

コーディングのヒント

  • 適切な場合は型ヒントを使用する
  • データの検証とシリアル化にはpydanticを使用する

📝 質問がありますか?

このプロジェクトに関してご質問、問題、ご提案がございましたら、お気軽に下記までお問い合わせください。

  • プロジェクト作成者: titulus (LinkedIn 経由)
  • Sunrise Apps CEO: Vlad Karm (LinkedInより)

バグレポートや機能リクエストについては、リポジトリで問題を開くこともできます。

📜 ライセンス

このプロジェクトはMITライセンスに基づいてライセンスされています。つまり、MITライセンスの条件に従って、ソフトウェアを自由に使用、改変、配布することができます。

Related MCP Servers

  • A
    security
    A
    license
    A
    quality
    Enables AI assistants to download images from URLs and perform basic image optimization tasks.
    Last updated -
    2
    4
    JavaScript
    Apache 2.0
  • -
    security
    A
    license
    -
    quality
    A Cursor-compatible toolkit that provides intelligent coding assistance through custom AI tools for code architecture planning, screenshot analysis, code review, and file reading capabilities.
    Last updated -
    602
    2
    TypeScript
    MIT License
  • A
    security
    F
    license
    A
    quality
    Drawing Tool for AI Assistants
    Last updated -
    4
    1
    JavaScript
  • -
    security
    F
    license
    -
    quality
    Enables searching for AI agents by keywords or categories, allowing users to discover tools like coding agents, GUI agents, or industry-specific assistants across marketplaces.
    Last updated -
    23
    Python
    • Apple

View all related MCP servers

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/sunriseapps/imagesorcery-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server