Skip to main content
Glama

MCP Desktop Automation

MCPデスクトップオートメーション

RobotJSを使用したデスクトップ自動化機能とスクリーンショット機能を提供するモデルコンテキストプロトコルサーバー。このサーバーにより、LLMはマウスの動きやキーボード入力を制御し、デスクトップ環境のスクリーンショットをキャプチャできます。

デスクトップオートメーションサーバーを使用するための構成

MCP Desktop Automation サーバーを使用するように Claude Desktop を構成する方法は次のとおりです。

NPX

{ "mcpServers": { "desktop-automation": { "command": "npx", "args": ["-y", "mcp-desktop-automation"] } } }

権限

このサーバーには、次のシステムレベルの権限が必要です。

  • 画面のスクリーンショットをキャプチャする
  • マウスの動きとクリックを制御する
  • キーボード入力をシミュレートする

このサーバーで Claude Desktop を初めて実行する場合、オペレーティング システムのセキュリティ設定でこれらの権限を付与する必要がある場合があります。

制限事項

このサーバーはさまざまな MCP クライアントで動作しますが、主に Claude Desktop でテストされています。

重要:現在の実装では、レスポンスサイズは1MBに制限されています。スクリーンキャプチャの場合、これは以下のことを意味します。

  • 高解像度のスクリーンショットはこの制限を超えて失敗する可能性があります
  • テストでは800x600の解像度が確実に機能することが確認されています
  • 問題が発生した場合は、画面解像度を下げるか、特定の画面領域をキャプチャすることを検討してください。

要件

  • Node.js (>=14.x)

コンポーネント

ツール

  • 画面サイズを取得する
    • 画面の寸法を取得します
    • 入力パラメータは不要
  • スクリーンキャプチャ
    • 現在の画面の内容をキャプチャします
    • 入力パラメータは不要
  • キーボードを押す
    • キーボードのキーまたはキーの組み合わせを押す
    • 入力:
      • key (文字列、必須): 押すキー (例: 'enter'、'a'、'control')
      • modifiers (文字列の配列、オプション): キーを押しながら押す修飾キー。可能な値: "control", "shift", "alt", "command"
  • キーボードタイプ
    • 現在のカーソル位置にテキストを入力します
    • 入力: text (文字列、必須): 入力するテキスト
  • マウスクリック
    • マウスクリックを実行します
    • 入力:
      • button (文字列、オプション、デフォルト: "left"): クリックするマウスボタン。可能な値: "left", "right", "middle"
      • double (ブール値、オプション、デフォルト:false):ダブルクリックを実行するかどうか
  • マウス移動
    • マウスを指定された座標に移動する
    • 入力:
      • x (数値、必須): X座標
      • y (数値、必須): Y座標

リソース

サーバーはスクリーンショットへのアクセスを提供します:

  1. スクリーンショットリスト( screenshot://list )
    • 利用可能なすべてのスクリーンショットを名前別に一覧表示します
  2. スクリーンショットコンテンツ( screenshot://{id} )
    • キャプチャしたスクリーンショットのPNG画像
    • スクリーンショットID(タイムスタンプベースの命名)でアクセス可能

主な特徴

  • デスクトップマウスコントロール
  • キーボード入力シミュレーション
  • 画面サイズの検出
  • スクリーンショット機能
  • シンプルなJSONレスポンス形式

ライセンス

このMCPサーバーはMITライセンスに基づいてライセンスされています。つまり、MITライセンスの条件に従って、ソフトウェアを自由に使用、改変、配布することができます。詳細については、プロジェクトリポジトリのLICENSEファイルをご覧ください。

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

RobotJS を使用したデスクトップ自動化機能とスクリーンショット機能を提供するモデル コンテキスト プロトコル サーバー。LLM がマウスの動きやキーボード入力を制御し、デスクトップ環境のスクリーンショットをキャプチャできるようにします。

  1. デスクトップオートメーションサーバーを使用するための構成
    1. NPX
    2. 権限
  2. 制限事項
    1. 要件
      1. コンポーネント
        1. ツール
        2. リソース
      2. 主な特徴
        1. ライセンス

          Related MCP Servers

          • -
            security
            A
            license
            -
            quality
            A Model Context Protocol server that provides browser automation capabilities using Playwright, enabling LLMs to interact with web pages, take screenshots, and execute JavaScript in a real browser environment.
            Last updated -
            3
            Python
            Apache 2.0
          • -
            security
            A
            license
            -
            quality
            A Model Context Protocol server that enables LLMs to automate web browsers using Puppeteer, allowing navigation, screenshots, form filling, and JavaScript execution in a real browser environment.
            Last updated -
            JavaScript
            MIT License
          • -
            security
            F
            license
            -
            quality
            A Model Context Protocol server that provides browser automation capabilities using BrowserCat's cloud browser service. This server enables LLMs to interact with web pages, take screenshots, and execute JavaScript in a real browser environment without needing to install browsers locally.
            Last updated -
            39
          • -
            security
            F
            license
            -
            quality
            A Model Context Protocol server that provides browser automation capabilities using Puppeteer, enabling LLMs to interact with web pages, take screenshots, and execute JavaScript in a real browser environment.
            Last updated -
            15,502
            JavaScript

          View all related MCP servers

          MCP directory API

          We provide all the information about MCP servers via our MCP API.

          curl -X GET 'https://glama.ai/api/mcp/v1/servers/tanob/mcp-desktop-automation'

          If you have feedback or need assistance with the MCP directory API, please join our Discord server