Skip to main content
Glama

mcp-screenshot

by kazuph

MCP 截图

捕获屏幕截图并执行 OCR 文本识别的 MCP 服务器。

特征

  • 屏幕截图(左半、右半、全屏)
  • OCR文字识别(支持日语、英语)
  • 多种输出格式(JSON、Markdown、垂直、水平)

OCR引擎

该服务器使用两个OCR引擎:

  1. 读音
    • 主要 OCR 引擎
    • 高精度日语文本识别
    • 作为 API 服务器运行
  2. Tesseract.js
    • 后备 OCR 引擎
    • 当读音不可用时使用
    • 支持日语和英语识别

安装

npx -y @kazuph/mcp-screenshot

Claude桌面配置

将以下配置添加到您的claude_desktop_config.json

{ "mcpServers": { "screenshot": { "command": "npx", "args": ["-y", "@kazuph/mcp-screenshot"], "env": { "OCR_API_URL": "http://localhost:8000" // yomitoku API base URL } } } }

环境变量

变量名称描述默认值
OCR_API_URLyomitoku API 基本 URLhttp://localhost:8000

使用示例

您可以通过如下方式指导 Claude 来使用它:

Please take a screenshot of the left half of the screen and recognize the text in it.

工具规格

捕获

截取屏幕截图并执行 OCR。

选项:

  • region :截图区域('左'/'右'/'全部',默认值:'左')
  • format :输出格式('json'/'markdown'/'vertical'/'horizontal',默认值:'markdown')

执照

麻省理工学院

作者

卡祖夫

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

local-only server

The server can only run on the client's local machine because it depends on local resources.

Tools

为 macOS 提供屏幕截图和 OCR 功能。

  1. 特征
    1. OCR引擎
      1. 安装
        1. Claude桌面配置
          1. 环境变量
            1. 使用示例
              1. 工具规格
                1. 捕获
              2. 执照
                1. 作者

                  Related MCP Servers

                  • A
                    security
                    A
                    license
                    A
                    quality
                    Enables capturing high-quality native macOS screenshots using Safari through a Node.js server, supporting various sizes, zoom levels, and load wait times.
                    Last updated -
                    1
                    7
                    TypeScript
                    MIT License
                  • A
                    security
                    A
                    license
                    A
                    quality
                    Provides AI assistants access to the macOS clipboard content, supporting text, images, and binary data via OSAScript.
                    Last updated -
                    1
                    2
                    TypeScript
                    MIT License
                    • Apple
                  • -
                    security
                    F
                    license
                    -
                    quality
                    OCR images or pdfs, locally or by URLs by using Mistral OCR API (paid)
                    Last updated -
                    10
                    Python
                    • Linux
                  • -
                    security
                    F
                    license
                    -
                    quality
                    Enables integration between MCP clients and the Handwriting OCR service, allowing users to upload images and PDF documents, check processing status, and retrieve OCR results as Markdown.
                    Last updated -
                    1
                    JavaScript
                    • Apple
                    • Linux

                  View all related MCP servers

                  MCP directory API

                  We provide all the information about MCP servers via our MCP API.

                  curl -X GET 'https://glama.ai/api/mcp/v1/servers/kazuph/mcp-screenshot'

                  If you have feedback or need assistance with the MCP directory API, please join our Discord server