Servidor MCP de OCR de Google
Componentes
Recursos
El servidor implementa un sistema de almacenamiento de notas simple con:
- Nota personalizada: esquema URI para acceder a notas individuales
- Cada recurso de nota tiene un nombre, una descripción y un tipo MIME de texto simple.
Indicaciones
El servidor proporciona un único mensaje:
- resumir-notas: Crea resúmenes de todas las notas almacenadas
- Argumento opcional "estilo" para controlar el nivel de detalle (breve/detallado)
- Genera un mensaje que combina todas las notas actuales con la preferencia de estilo.
Herramientas
El servidor implementa una herramienta:
- add-note: Agrega una nueva nota al servidor
- Toma "nombre" y "contenido" como argumentos de cadena requeridos
- Actualiza el estado del servidor y notifica a los clientes sobre los cambios de recursos.
Configuración
[TODO: Agregar detalles de configuración específicos para su implementación]
Inicio rápido
Instalar
Escritorio de Claude
- En MacOS:
~/Library/Application\ Support/Claude/claude_desktop_config.json
- En Windows:
%APPDATA%/Claude/claude_desktop_config.json
Instalación mediante herrería
Para instalar google-ocr-mcp-server para Claude Desktop automáticamente a través de Smithery :
Desarrollo
Construcción y publicación
Para preparar el paquete para su distribución:
- Sincronizar dependencias y actualizar el archivo de bloqueo:
- Distribuciones de paquetes de compilación:
Esto creará distribuciones de origen y de rueda en el directorio dist/
.
- Publicar en PyPI:
Nota: Deberás configurar las credenciales de PyPI a través de variables de entorno o indicadores de comando:
- Token:
--token
oUV_PUBLISH_TOKEN
- O nombre de usuario/contraseña:
--username
/UV_PUBLISH_USERNAME
y--password
/UV_PUBLISH_PASSWORD
Depuración
Dado que los servidores MCP se ejecutan en stdio, la depuración puede ser complicada. Para una experiencia óptima, recomendamos usar el Inspector MCP .
Puede iniciar el Inspector MCP a través de npm
con este comando:
Al iniciarse, el Inspector mostrará una URL a la que podrá acceder en su navegador para comenzar a depurar.
Tools
Esta es una implementación de servidor para realizar reconocimiento óptico de caracteres (OCR) mediante la API de Google Cloud Vision. Está basada en el framework FastMCP , que permite la creación de herramientas de procesamiento de comandos modulares y extensibles.
Related Resources
Related MCP Servers
- -securityAlicense-qualityA powerful server that integrates the Moondream vision model to enable advanced image analysis, including captioning, object detection, and visual question answering, through the Model Context Protocol, compatible with AI assistants like Claude and Cline.Last updated -16JavaScriptApache 2.0
- -securityAlicense-qualityA TypeScript-based MCP server that enables AI assistants to interact with Gyazo images using the Model Context Protocol, providing access to image URIs, metadata, and OCR data via the Gyazo API.Last updated -723TypeScriptMIT License
- AsecurityAlicenseAqualityProvides image recognition capabilities using Anthropic Claude Vision and OpenAI GPT-4 Vision APIs, supporting multiple image formats and offering optional text extraction via Tesseract OCR.Last updated -322PythonMIT License
- -securityFlicense-qualityEnables integration between MCP clients and the Handwriting OCR service, allowing users to upload images and PDF documents, check processing status, and retrieve OCR results as Markdown.Last updated -5JavaScript
Appeared in Searches
- Official tool for reading and analyzing PDF files from MCP
- Using Google to Generate Reports
- A tool to extract or read text and images from PDFs
- A tool for uploading and analyzing documents, extracting text from PDFs, and conducting research
- Research on Patient-Disease-Gene-Drug Relationships and Pharmacogenomics Using Digital Imaging Data