Google OCR

by Zerohertz
Verified

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Provides OCR (Optical Character Recognition) capabilities through Google's Cloud Vision API, allowing extraction of text from images and conversion into editable and searchable notes.

Google OCR MCP 服务器

成分

资源

服务器实现了一个简单的笔记存储系统,其中包括:

  • 用于访问单个笔记的自定义 note:// URI 方案
  • 每个笔记资源都有一个名称、描述和文本/纯文本 mimetype

提示

服务器提供一个提示:

  • 总结笔记:创建所有存储笔记的摘要
    • 可选的“样式”参数用于控制详细程度(简要/详细)
    • 生成提示,结合所有当前注释和样式偏好

工具

服务器实现了一个工具:

  • add-note:向服务器添加新注释
    • 将“名称”和“内容”作为必需的字符串参数
    • 更新服务器状态并通知客户端资源变化

配置

[TODO:添加特定于您的实现的配置详细信息]

快速入门

安装

克劳德桌面

  • 在 MacOS 上: ~/Library/Application\ Support/Claude/claude_desktop_config.json
  • 在 Windows 上: %APPDATA%/Claude/claude_desktop_config.json
{ "mcpServers": { "google-ocr-mcp-server": { "command": "uv", "args": ["run", "google-ocr-mcp-server"], "env": { "GOOGLE_APPLICATION_CREDENTIALS": "/path/to/google-application-credentials.json", "SAVE_RESULTS": false } } } }
{ "mcpServers": { "google-ocr-mcp-server": { "command": "uvx", "args": ["google-ocr-mcp-server"], "env": { "GOOGLE_APPLICATION_CREDENTIALS": "/path/to/google-application-credentials.json", "SAVE_RESULTS": false } } } }

通过 Smithery 安装

要通过Smithery自动为 Claude Desktop 安装 google-ocr-mcp-server:

npx -y @smithery/cli install @Zerohertz/google-ocr-mcp-server --client claude

发展

构建和发布

准备分发包:

  1. 同步依赖项并更新锁文件:
uv sync
  1. 构建软件包分发版:
uv build

这将在dist/目录中创建源和轮子分布。

  1. 发布到 PyPI:
uv publish

注意:您需要通过环境变量或命令标志设置 PyPI 凭据:

  • 令牌: --tokenUV_PUBLISH_TOKEN
  • 或用户名/密码: --username / UV_PUBLISH_USERNAME--password / UV_PUBLISH_PASSWORD

调试

由于 MCP 服务器通过 stdio 运行,调试起来可能比较困难。为了获得最佳调试体验,我们强烈建议使用MCP Inspector

您可以使用以下命令通过npm启动 MCP Inspector:

npx @modelcontextprotocol/inspector uv --directory /Users/zerohertz/Downloads/google-ocr-mcp-server run google-ocr-mcp-server

启动后,检查器将显示一个 URL,您可以在浏览器中访问该 URL 以开始调试。

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Tools

这是一个使用 Google Cloud Vision API 执行光学字符识别 (OCR) 的服务器实现。它建立在FastMCP框架之上,该框架允许创建模块化且可扩展的命令处理工具。

  1. Components
    1. Resources
    2. Prompts
    3. Tools
  2. Configuration
    1. Quickstart
      1. Install
      2. Installing via Smithery
    2. Development
      1. Building and Publishing
      2. Debugging
    ID: 7xv6wlib4l