Skip to main content
Glama

mcp-screenshot

by kazuph

Captura de pantalla de MCP

Un servidor MCP que captura capturas de pantalla y realiza reconocimiento de texto OCR.

Características

  • Captura de pantalla (mitad izquierda, mitad derecha, pantalla completa)
  • Reconocimiento de texto OCR (compatible con japonés e inglés)
  • Múltiples formatos de salida (JSON, Markdown, vertical, horizontal)

Motores de OCR

Este servidor utiliza dos motores de OCR:

  1. yomitoku
    • Motor de OCR principal
    • Reconocimiento de texto japonés de alta precisión
    • Se ejecuta como un servidor API
  2. Tesseract.js
    • Motor de OCR de respaldo
    • Se utiliza cuando Yomitoku no está disponible
    • Admite reconocimiento tanto en japonés como en inglés.

Instalación

npx -y @kazuph/mcp-screenshot

Configuración del escritorio de Claude

Agregue la siguiente configuración a su claude_desktop_config.json :

{ "mcpServers": { "screenshot": { "command": "npx", "args": ["-y", "@kazuph/mcp-screenshot"], "env": { "OCR_API_URL": "http://localhost:8000" // yomitoku API base URL } } } }

Variables de entorno

Nombre de la variableDescripciónValor predeterminado
URL de API de OCRURL base de la API de Yomitokuhttp://localhost:8000

Ejemplo de uso

Puedes usarlo instruyéndole a Claude de esta manera:

Please take a screenshot of the left half of the screen and recognize the text in it.

Especificación de la herramienta

captura

Toma una captura de pantalla y realiza OCR.

Opciones:

  • region : Área de captura de pantalla ('izquierda'/'derecha'/'completa', predeterminado: 'izquierda')
  • format : Formato de salida ('json'/'markdown'/'vertical'/'horizontal', predeterminado: 'markdown')

Licencia

Instituto Tecnológico de Massachusetts (MIT)

Autor

Kazuf

Install Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

local-only server

The server can only run on the client's local machine because it depends on local resources.

Tools

Proporciona capacidades de captura de pantalla y OCR para macOS.

  1. Características
    1. Motores de OCR
      1. Instalación
        1. Configuración del escritorio de Claude
          1. Variables de entorno
            1. Ejemplo de uso
              1. Especificación de la herramienta
                1. captura
              2. Licencia
                1. Autor

                  Related MCP Servers

                  • A
                    security
                    A
                    license
                    A
                    quality
                    Enables capturing high-quality native macOS screenshots using Safari through a Node.js server, supporting various sizes, zoom levels, and load wait times.
                    Last updated -
                    1
                    0
                    TypeScript
                    MIT License
                  • A
                    security
                    F
                    license
                    A
                    quality
                    Enables AI tools to capture and process screenshots of a user's screen, allowing AI assistants to see and analyze what the user is looking at through a simple MCP interface.
                    Last updated -
                    1
                    13
                    Python
                    • Linux
                    • Apple
                  • A
                    security
                    A
                    license
                    A
                    quality
                    A server that enables OCR capabilities to recognize text from images, PDFs, and Word documents, convert them to Markdown, and extract key information.
                    Last updated -
                    3
                    19
                    18
                    JavaScript
                    MIT License
                  • A
                    security
                    A
                    license
                    A
                    quality
                    A macOS utility that captures screenshots and analyzes them with AI vision, enabling AI assistants to see and interpret what's on your screen.
                    Last updated -
                    3
                    10,407
                    505
                    MIT License
                    • Apple

                  View all related MCP servers

                  MCP directory API

                  We provide all the information about MCP servers via our MCP API.

                  curl -X GET 'https://glama.ai/api/mcp/v1/servers/kazuph/mcp-screenshot'

                  If you have feedback or need assistance with the MCP directory API, please join our Discord server