Graspはオープンソースでセルフホスト型のエージェントブラウザです。MCPとA2Aのサポートが組み込まれているため、他のAIアプリやエージェントとシームレスに統合できます。
Grasp が Claude Desktop とシームレスに連携して、次回の Airbnb 旅行の計画を簡単にする例を以下に示します。
https://github.com/user-attachments/assets/b55b5f76-4faa-45b9-a5ab-4c4295dfdf19
主な機能は次のとおりです:
- 分離されたブラウザ環境。GraspはDocker化されているため、ローカルワークスペースに影響を与えることはありません。自分のマシンまたはクラウドで簡単にホストできます。
- 人間のような自動化。Graspはまるで人間のようにブラウザを操作します。エージェントがログインしてパーソナライズされたコンテンツを取得するための認証情報も提供できます。
- 自然言語制御。コードは必要ありません。必要なことを平易な言葉で説明するだけで、あとはエージェントが処理します。
クイックスタート
🐳始める前に:
マシンにDockerがインストールされ、実行されていることを確認してください。
次のコマンドを実行して、Grasp をプルして起動します。
- 画像を引っ張る
- コンテナを実行する
YOUR_ANTHROPIC_KEY を実際のAnthropic API キーに置き換えます。
コンテナが実行されたら、ブラウザでhttp://localhost:3000 を開いて Grasp コンソールにアクセスします。
他のプロバイダーを使用する
Anthropic以外のプロバイダーも使用できます。
別のプロバイダーを使用するには、 .env.example
ファイルを.env
にコピーし、対応する環境変数を設定します。その後、 .env
ファイルを使用して Grasp を実行します。
サポートされているプロバイダーは次のとおりです。
- 人類学的
- オープンAI
- アマゾンの岩盤
- Azure OpenAI
より多くのプロバイダーのサポートに取り組んでいます。新しいプロバイダーをリクエストするには、無料で問題を報告してください。
最新情報を入手
Grasp は急速に進化しており、毎週、新機能のリリース、統合の拡張、エージェント エクスペリエンスの改良を行っています。⭐ リポジトリにスターを付けて最新情報を入手し、プロジェクトをサポートしてください。
チュートリアル
- Claude Desktop を Grasp に接続します。Grasp をローカル MCP ツール サーバーとして使用し、Claude がブラウザーを操作できるようにします。
- エージェントを Grasp に接続: エージェント間のブラウザ自動化のために A2A 経由で Grasp を統合します。
コミュニティ
ご意見をお待ちしております。
Discord に参加してアイデアを共有したり、質問したり、ただ交流したりしましょう。
ライセンス
BSL-1.1 ライセンスに基づいてライセンスされます。
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
AI 自動化のための Docker 化されたブラウザ環境を提供するオープンソースのセルフホスト型ブラウザ エージェント。これにより、他の AI アプリやエージェントが自然言語の指示を通じて人間のような Web ブラウジング タスクを実行できるようになります。
Related MCP Servers
- AsecurityFlicenseAqualityEnables AI agents to interact with web browsers using natural language, featuring automated browsing, form filling, vision-based element detection, and structured JSON responses for systematic browser control.Last updated -146Python
- -securityFlicense-qualityEnables AI agents to control web browsers via a standardized interface for operations like launching, interacting with, and closing browsers.Last updated -0JavaScript
- -securityFlicense-qualityA web browser automation server that allows AI assistants to control Chrome with persistent state management, enabling complex browsing tasks through asynchronous browser operations.Last updated -1Python
- -securityAlicense-qualityAI-driven browser automation server that implements the Model Context Protocol to enable natural language control of web browsers for tasks like navigation, form filling, and visual interaction.Last updated -1PythonMIT License