Google OCR

by Zerohertz
Verified

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Provides OCR (Optical Character Recognition) capabilities through Google's Cloud Vision API, allowing extraction of text from images and conversion into editable and searchable notes.

Google OCR MCP サーバー

コンポーネント

リソース

サーバーは、次の機能を備えたシンプルなメモ保存システムを実装します。

  • 個々のノートにアクセスするためのカスタム note:// URI スキーム
  • 各ノートリソースには、名前、説明、text/plain mimetype があります。

プロンプト

サーバーは単一のプロンプトを提供します:

  • 要約ノート: 保存されているすべてのノートの要約を作成します
    • 詳細レベル(簡潔/詳細)を制御するためのオプションの「スタイル」引数
    • 現在のすべてのメモをスタイルの好みに合わせて組み合わせたプロンプトを生成します

ツール

サーバーは 1 つのツールを実装します。

  • add-note: サーバーに新しいメモを追加します
    • 必須の文字列引数として「name」と「content」を取ります
    • サーバーの状態を更新し、リソースの変更をクライアントに通知します

構成

[TODO: 実装に固有の構成の詳細を追加する]

クイックスタート

インストール

クロードデスクトップ

  • MacOSの場合: ~/Library/Application\ Support/Claude/claude_desktop_config.json
  • Windows の場合: %APPDATA%/Claude/claude_desktop_config.json
{ "mcpServers": { "google-ocr-mcp-server": { "command": "uv", "args": ["run", "google-ocr-mcp-server"], "env": { "GOOGLE_APPLICATION_CREDENTIALS": "/path/to/google-application-credentials.json", "SAVE_RESULTS": false } } } }
{ "mcpServers": { "google-ocr-mcp-server": { "command": "uvx", "args": ["google-ocr-mcp-server"], "env": { "GOOGLE_APPLICATION_CREDENTIALS": "/path/to/google-application-credentials.json", "SAVE_RESULTS": false } } } }

Smithery経由でインストール

Smithery経由で Claude Desktop 用の google-ocr-mcp-server を自動的にインストールするには:

npx -y @smithery/cli install @Zerohertz/google-ocr-mcp-server --client claude

発達

建築と出版

配布用のパッケージを準備するには:

  1. 依存関係を同期し、ロックファイルを更新します。
uv sync
  1. パッケージディストリビューションをビルドします。
uv build

これにより、 dist/ディレクトリにソースとホイールのディストリビューションが作成されます。

  1. PyPI に公開:
uv publish

注: 環境変数またはコマンド フラグを使用して PyPI 資格情報を設定する必要があります。

  • トークン: --tokenまたはUV_PUBLISH_TOKEN
  • またはユーザー名/パスワード: --username / UV_PUBLISH_USERNAMEおよび--password / UV_PUBLISH_PASSWORD

デバッグ

MCPサーバーはstdio経由で実行されるため、デバッグが困難になる場合があります。最適なデバッグ環境を実現するには、 MCP Inspectorの使用を強くお勧めします。

次のコマンドを使用して、 npm経由で MCP Inspector を起動できます。

npx @modelcontextprotocol/inspector uv --directory /Users/zerohertz/Downloads/google-ocr-mcp-server run google-ocr-mcp-server

起動すると、ブラウザでアクセスしてデバッグを開始できる URL がインスペクタに表示されます。

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Tools

これは、Google Cloud Vision API を使用して光学式文字認識(OCR)を実行するためのサーバー実装です。モジュール式で拡張可能なコマンド処理ツールの作成を可能にするFastMCPフレームワーク上に構築されています。

  1. Components
    1. Resources
    2. Prompts
    3. Tools
  2. Configuration
    1. Quickstart
      1. Install
      2. Installing via Smithery
    2. Development
      1. Building and Publishing
      2. Debugging
    ID: 7xv6wlib4l