Skip to main content
Glama

mcp-screenshot

by kazuph

MCPスクリーンショット

スクリーンショットをキャプチャし、OCR テキスト認識を実行する MCP サーバー。

特徴

  • スクリーンショットキャプチャ(左半分、右半分、全画面)
  • OCRテキスト認識(日本語と英語に対応)
  • 複数の出力形式(JSON、Markdown、垂直、水平)

OCRエンジン

このサーバーは 2 つの OCR エンジンを使用します。

  1. 読みとく
    • プライマリOCRエンジン
    • 高精度な日本語テキスト認識
    • APIサーバーとして実行
  2. テッセラクト
    • フォールバックOCRエンジン
    • 読み方が分からないときに使う
    • 日本語と英語の両方の認識をサポート

インストール

npx -y @kazuph/mcp-screenshot

クロードデスクトップ構成

claude_desktop_config.jsonに次の構成を追加します。

{ "mcpServers": { "screenshot": { "command": "npx", "args": ["-y", "@kazuph/mcp-screenshot"], "env": { "OCR_API_URL": "http://localhost:8000" // yomitoku API base URL } } } }

環境変数

変数名説明デフォルト値
OCR_API_URL読徳APIベースURLhttp://localhost:8000

使用例

次のようにClaudeに指示することで使用できます。

Please take a screenshot of the left half of the screen and recognize the text in it.

ツール仕様

捕獲

スクリーンショットを撮り、OCR を実行します。

オプション:

  • region : スクリーンショット領域 ('left'/'right'/'full'、デフォルト: 'left')
  • format : 出力形式 ('json'/'markdown'/'vertical'/'horizontal'、デフォルト: 'markdown')

ライセンス

マサチューセッツ工科大学

著者

カズフ

Install Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

local-only server

The server can only run on the client's local machine because it depends on local resources.

Tools

macOS 用のスクリーンショットおよび OCR 機能を提供します。

  1. 特徴
    1. OCRエンジン
      1. インストール
        1. クロードデスクトップ構成
          1. 環境変数
            1. 使用例
              1. ツール仕様
                1. 捕獲
              2. ライセンス
                1. 著者

                  Related MCP Servers

                  • A
                    security
                    A
                    license
                    A
                    quality
                    Enables capturing high-quality native macOS screenshots using Safari through a Node.js server, supporting various sizes, zoom levels, and load wait times.
                    Last updated -
                    1
                    0
                    TypeScript
                    MIT License
                  • A
                    security
                    F
                    license
                    A
                    quality
                    Enables AI tools to capture and process screenshots of a user's screen, allowing AI assistants to see and analyze what the user is looking at through a simple MCP interface.
                    Last updated -
                    1
                    13
                    Python
                    • Linux
                    • Apple
                  • A
                    security
                    A
                    license
                    A
                    quality
                    A server that enables OCR capabilities to recognize text from images, PDFs, and Word documents, convert them to Markdown, and extract key information.
                    Last updated -
                    3
                    19
                    18
                    JavaScript
                    MIT License
                  • A
                    security
                    A
                    license
                    A
                    quality
                    A macOS utility that captures screenshots and analyzes them with AI vision, enabling AI assistants to see and interpret what's on your screen.
                    Last updated -
                    3
                    10,407
                    505
                    MIT License
                    • Apple

                  View all related MCP servers

                  MCP directory API

                  We provide all the information about MCP servers via our MCP API.

                  curl -X GET 'https://glama.ai/api/mcp/v1/servers/kazuph/mcp-screenshot'

                  If you have feedback or need assistance with the MCP directory API, please join our Discord server