MCPスクリーンショット
スクリーンショットをキャプチャし、OCR テキスト認識を実行する MCP サーバー。
特徴
スクリーンショットキャプチャ(左半分、右半分、全画面)
OCRテキスト認識(日本語と英語に対応)
複数の出力形式(JSON、Markdown、垂直、水平)
Related MCP server: Screenshot MCP Server
OCRエンジン
このサーバーは 2 つの OCR エンジンを使用します。
インストール
npx -y @kazuph/mcp-screenshot
クロードデスクトップ構成
claude_desktop_config.jsonに次の構成を追加します。
{
"mcpServers": {
"screenshot": {
"command": "npx",
"args": ["-y", "@kazuph/mcp-screenshot"],
"env": {
"OCR_API_URL": "http://localhost:8000" // yomitoku API base URL
}
}
}
}
環境変数
変数名 | 説明 | デフォルト値 |
OCR_API_URL | 読徳APIベースURL |
使用例
次のようにClaudeに指示することで使用できます。
Please take a screenshot of the left half of the screen and recognize the text in it.
ツール仕様
捕獲
スクリーンショットを撮り、OCR を実行します。
オプション:
region: スクリーンショット領域 ('left'/'right'/'full'、デフォルト: 'left')format: 出力形式 ('json'/'markdown'/'vertical'/'horizontal'、デフォルト: 'markdown')
ライセンス
マサチューセッツ工科大学
著者
カズフ
Appeared in Searches
- MCP server for screenshot viewing and automatic cropping
- How to connect to the internet, browse a webpage, and take screenshots
- A microcontroller with image processing capabilities
- A system or tool for enabling computer vision capabilities in an MCP (Microcontroller Platform)
- Tools and Methods for Image Generation