Skip to main content
Glama

mcp-screenshot

by kazuph

MCP 스크린샷

스크린샷을 캡처하고 OCR 텍스트 인식을 수행하는 MCP 서버입니다.

특징

  • 스크린샷 캡처(왼쪽 절반, 오른쪽 절반, 전체 화면)
  • OCR 텍스트 인식(일본어 및 영어 지원)
  • 다양한 출력 형식(JSON, 마크다운, 세로, 가로)

OCR 엔진

이 서버는 두 개의 OCR 엔진을 사용합니다.

  1. 요미토쿠
    • 기본 OCR 엔진
    • 고정확도 일본어 텍스트 인식
    • API 서버로 실행됩니다
  2. 테서랙트.js
    • 폴백 OCR 엔진
    • 요미토쿠를 사용할 수 없을 때 사용
    • 일본어와 영어 인식을 모두 지원합니다

설치

지엑스피1

클로드 데스크톱 구성

claude_desktop_config.json 에 다음 구성을 추가하세요.

{ "mcpServers": { "screenshot": { "command": "npx", "args": ["-y", "@kazuph/mcp-screenshot"], "env": { "OCR_API_URL": "http://localhost:8000" // yomitoku API base URL } } } }

환경 변수

변수 이름설명기본값
OCR_API_URL요미토쿠 API 기본 URLhttp://localhost:8000

사용 예

클로드에게 다음과 같이 지시하면 사용할 수 있습니다.

Please take a screenshot of the left half of the screen and recognize the text in it.

도구 사양

포착

스크린샷을 찍고 OCR을 수행합니다.

옵션:

  • region : 스크린샷 영역('왼쪽'/'오른쪽'/'전체', 기본값: '왼쪽')
  • format : 출력 형식('json'/'markdown'/'vertical'/'horizontal', 기본값: 'markdown')

특허

MIT

작가

카주프

Install Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

local-only server

The server can only run on the client's local machine because it depends on local resources.

Tools

macOS에 대한 스크린샷과 OCR 기능을 제공합니다.

  1. 특징
    1. OCR 엔진
      1. 설치
        1. 클로드 데스크톱 구성
          1. 환경 변수
            1. 사용 예
              1. 도구 사양
                1. 포착
              2. 특허
                1. 작가

                  Related MCP Servers

                  • A
                    security
                    A
                    license
                    A
                    quality
                    Enables capturing high-quality native macOS screenshots using Safari through a Node.js server, supporting various sizes, zoom levels, and load wait times.
                    Last updated -
                    1
                    0
                    TypeScript
                    MIT License
                  • A
                    security
                    F
                    license
                    A
                    quality
                    Enables AI tools to capture and process screenshots of a user's screen, allowing AI assistants to see and analyze what the user is looking at through a simple MCP interface.
                    Last updated -
                    1
                    13
                    Python
                    • Linux
                    • Apple
                  • A
                    security
                    A
                    license
                    A
                    quality
                    A server that enables OCR capabilities to recognize text from images, PDFs, and Word documents, convert them to Markdown, and extract key information.
                    Last updated -
                    3
                    19
                    18
                    JavaScript
                    MIT License
                  • A
                    security
                    A
                    license
                    A
                    quality
                    A macOS utility that captures screenshots and analyzes them with AI vision, enabling AI assistants to see and interpret what's on your screen.
                    Last updated -
                    3
                    10,407
                    505
                    MIT License
                    • Apple

                  View all related MCP servers

                  MCP directory API

                  We provide all the information about MCP servers via our MCP API.

                  curl -X GET 'https://glama.ai/api/mcp/v1/servers/kazuph/mcp-screenshot'

                  If you have feedback or need assistance with the MCP directory API, please join our Discord server