Skip to main content
Glama

mcp-screenshot

by kazuph

MCP 스크린샷

스크린샷을 캡처하고 OCR 텍스트 인식을 수행하는 MCP 서버입니다.

특징

  • 스크린샷 캡처(왼쪽 절반, 오른쪽 절반, 전체 화면)
  • OCR 텍스트 인식(일본어 및 영어 지원)
  • 다양한 출력 형식(JSON, 마크다운, 세로, 가로)

OCR 엔진

이 서버는 두 개의 OCR 엔진을 사용합니다.

  1. 요미토쿠
    • 기본 OCR 엔진
    • 고정확도 일본어 텍스트 인식
    • API 서버로 실행됩니다
  2. 테서랙트.js
    • 폴백 OCR 엔진
    • 요미토쿠를 사용할 수 없을 때 사용
    • 일본어와 영어 인식을 모두 지원합니다

설치

지엑스피1

클로드 데스크톱 구성

claude_desktop_config.json 에 다음 구성을 추가하세요.

{ "mcpServers": { "screenshot": { "command": "npx", "args": ["-y", "@kazuph/mcp-screenshot"], "env": { "OCR_API_URL": "http://localhost:8000" // yomitoku API base URL } } } }

환경 변수

변수 이름설명기본값
OCR_API_URL요미토쿠 API 기본 URLhttp://localhost:8000

사용 예

클로드에게 다음과 같이 지시하면 사용할 수 있습니다.

Please take a screenshot of the left half of the screen and recognize the text in it.

도구 사양

포착

스크린샷을 찍고 OCR을 수행합니다.

옵션:

  • region : 스크린샷 영역('왼쪽'/'오른쪽'/'전체', 기본값: '왼쪽')
  • format : 출력 형식('json'/'markdown'/'vertical'/'horizontal', 기본값: 'markdown')

특허

MIT

작가

카주프

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

local-only server

The server can only run on the client's local machine because it depends on local resources.

Tools

macOS에 대한 스크린샷과 OCR 기능을 제공합니다.

  1. 특징
    1. OCR 엔진
      1. 설치
        1. 클로드 데스크톱 구성
          1. 환경 변수
            1. 사용 예
              1. 도구 사양
                1. 포착
              2. 특허
                1. 작가

                  Related MCP Servers

                  • A
                    security
                    A
                    license
                    A
                    quality
                    Enables capturing high-quality native macOS screenshots using Safari through a Node.js server, supporting various sizes, zoom levels, and load wait times.
                    Last updated -
                    1
                    7
                    TypeScript
                    MIT License
                  • A
                    security
                    A
                    license
                    A
                    quality
                    Provides AI assistants access to the macOS clipboard content, supporting text, images, and binary data via OSAScript.
                    Last updated -
                    1
                    2
                    TypeScript
                    MIT License
                    • Apple
                  • -
                    security
                    F
                    license
                    -
                    quality
                    OCR images or pdfs, locally or by URLs by using Mistral OCR API (paid)
                    Last updated -
                    10
                    Python
                    • Linux
                  • -
                    security
                    F
                    license
                    -
                    quality
                    Enables integration between MCP clients and the Handwriting OCR service, allowing users to upload images and PDF documents, check processing status, and retrieve OCR results as Markdown.
                    Last updated -
                    1
                    JavaScript
                    • Apple
                    • Linux

                  View all related MCP servers

                  MCP directory API

                  We provide all the information about MCP servers via our MCP API.

                  curl -X GET 'https://glama.ai/api/mcp/v1/servers/kazuph/mcp-screenshot'

                  If you have feedback or need assistance with the MCP directory API, please join our Discord server