Skip to main content
Glama

Google OCR

Google OCR MCP 服务器

成分

资源

服务器实现了一个简单的笔记存储系统,其中包括:

  • 用于访问单个笔记的自定义 note:// URI 方案
  • 每个笔记资源都有一个名称、描述和文本/纯文本 mimetype

提示

服务器提供一个提示:

  • 总结笔记:创建所有存储笔记的摘要
    • 可选的“样式”参数用于控制详细程度(简要/详细)
    • 生成提示,结合所有当前注释和样式偏好

工具

服务器实现了一个工具:

  • add-note:向服务器添加新注释
    • 将“名称”和“内容”作为必需的字符串参数
    • 更新服务器状态并通知客户端资源变化

配置

[TODO:添加特定于您的实现的配置详细信息]

快速入门

安装

克劳德桌面
  • 在 MacOS 上: ~/Library/Application\ Support/Claude/claude_desktop_config.json
  • 在 Windows 上: %APPDATA%/Claude/claude_desktop_config.json
{ "mcpServers": { "google-ocr-mcp-server": { "command": "uv", "args": ["run", "google-ocr-mcp-server"], "env": { "GOOGLE_APPLICATION_CREDENTIALS": "/path/to/google-application-credentials.json", "SAVE_RESULTS": false } } } }
{ "mcpServers": { "google-ocr-mcp-server": { "command": "uvx", "args": ["google-ocr-mcp-server"], "env": { "GOOGLE_APPLICATION_CREDENTIALS": "/path/to/google-application-credentials.json", "SAVE_RESULTS": false } } } }

通过 Smithery 安装

要通过Smithery自动为 Claude Desktop 安装 google-ocr-mcp-server:

npx -y @smithery/cli install @Zerohertz/google-ocr-mcp-server --client claude

发展

构建和发布

准备分发包:

  1. 同步依赖项并更新锁文件:
uv sync
  1. 构建软件包分发版:
uv build

这将在dist/目录中创建源和轮子分布。

  1. 发布到 PyPI:
uv publish

注意:您需要通过环境变量或命令标志设置 PyPI 凭据:

  • 令牌: --tokenUV_PUBLISH_TOKEN
  • 或用户名/密码: --username / UV_PUBLISH_USERNAME--password / UV_PUBLISH_PASSWORD

调试

由于 MCP 服务器通过 stdio 运行,调试起来可能比较困难。为了获得最佳调试体验,我们强烈建议使用MCP Inspector

您可以使用以下命令通过npm启动 MCP Inspector:

npx @modelcontextprotocol/inspector uv --directory /Users/zerohertz/Downloads/google-ocr-mcp-server run google-ocr-mcp-server

启动后,检查器将显示一个 URL,您可以在浏览器中访问该 URL 以开始调试。

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Tools

这是一个使用 Google Cloud Vision API 执行光学字符识别 (OCR) 的服务器实现。它建立在FastMCP框架之上,该框架允许创建模块化且可扩展的命令处理工具。

  1. 成分
    1. 资源
    2. 提示
    3. 工具
  2. 配置
    1. 快速入门
      1. 安装
      2. 通过 Smithery 安装
    2. 发展
      1. 构建和发布
      2. 调试

    Related MCP Servers

    • -
      security
      A
      license
      -
      quality
      A powerful server that integrates the Moondream vision model to enable advanced image analysis, including captioning, object detection, and visual question answering, through the Model Context Protocol, compatible with AI assistants like Claude and Cline.
      Last updated -
      11
      JavaScript
      Apache 2.0
    • -
      security
      A
      license
      -
      quality
      A TypeScript-based MCP server that enables AI assistants to interact with Gyazo images using the Model Context Protocol, providing access to image URIs, metadata, and OCR data via the Gyazo API.
      Last updated -
      5
      19
      TypeScript
      MIT License
      • Apple
    • A
      security
      A
      license
      A
      quality
      Provides image recognition capabilities using Anthropic Claude Vision and OpenAI GPT-4 Vision APIs, supporting multiple image formats and offering optional text extraction via Tesseract OCR.
      Last updated -
      3
      9
      Python
      MIT License
      • Linux
      • Apple
    • -
      security
      F
      license
      -
      quality
      Enables integration between MCP clients and the Handwriting OCR service, allowing users to upload images and PDF documents, check processing status, and retrieve OCR results as Markdown.
      Last updated -
      1
      JavaScript
      • Apple
      • Linux

    View all related MCP servers

    MCP directory API

    We provide all the information about MCP servers via our MCP API.

    curl -X GET 'https://glama.ai/api/mcp/v1/servers/Zerohertz/google-ocr-mcp-server'

    If you have feedback or need assistance with the MCP directory API, please join our Discord server