Steel MCP Server

https://github.com/user-attachments/assets/25848033-40ea-4fa4-96f9-83b6153a0212

Ein Model Context Protocol (MCP)-Server, der es LLMs wie Claude ermöglicht, mithilfe von Puppeteer-basierten Tools und Steel im Web zu navigieren. Basierend auf dem Web Voyager Framework bietet es Tools für alle gängigen Webaktionen wie Klicken, Scrollen, Tippen usw. und das Erstellen von Screenshots.

Bitten Sie Claude, Ihnen bei Aufgaben wie diesen zu helfen:

"Rezept suchen und Zutatenliste speichern"
„Verfolgen Sie den Status einer Paketzustellung“
"Preise für ein bestimmtes Produkt finden und vergleichen"
"Füllen Sie eine Online-Bewerbung aus"

🚀 Schnellstart

Nachfolgend finden Sie eine vereinfachte Anleitung zur Ausführung von Steel Voyager in Claude Desktop. Sie müssen lediglich die Umgebungsoptionen anpassen, um zwischen Steel Cloud und einer lokalen/selbstgehosteten Instanz zu wechseln.

Voraussetzungen

Neueste Versionen von Git und Node.js installiert
Claude Desktop installiert
(Optional) Lokal ausgeführtes Steel Docker-Image , wenn Sie planen, es selbst zu hosten
(Optional) Wenn Sie Steel Cloud verwenden, bringen Sie Ihren API-Schlüssel mit. Einen erhalten Sie hier .

A) Schnellstart (Steel Cloud)

Klonen und erstellen Sie das Projekt:
git clone https://github.com/steel-dev/steel-mcp-server.git cd steel-mcp-server npm install npm run build
Konfigurieren Sie Claude Desktop ( ~/Library/Application Support/Claude/claude_desktop_config.json ), indem Sie einen Servereintrag hinzufügen:
{ "mcpServers": { "steel-puppeteer": { "command": "node", "args": ["path/to/steel-voyager/dist/index.js"], "env": { "STEEL_LOCAL": "false", "STEEL_API_KEY": "YOUR_STEEL_API_KEY_HERE", "GLOBAL_WAIT_SECONDS": "1" } } } }
- Ersetzen Sie „YOUR_STEEL_API_KEY_HERE“ durch Ihren gültigen Steel-API-Schlüssel.
- Stellen Sie sicher, dass „STEEL_LOCAL“ für den Cloud-Modus auf „false“ eingestellt ist.
Starten Sie Claude Desktop. Der MCP-Server wird automatisch im Cloud-Modus gestartet.
(Optional) Sie können aktive Steel Browser-Sitzungen in Ihrem Dashboard anzeigen oder verwalten.

B) Schnellstart (Lokaler/selbstgehosteter Stahl)

Stellen Sie sicher, dass Ihr lokaler oder selbst gehosteter Steel-Dienst ausgeführt wird (z. B. mithilfe des Open-Source-Steel-Docker-Image).
Klonen und erstellen Sie das Projekt (wie oben, falls noch nicht geschehen):
git clone https://github.com/steel-dev/steel-mcp-server.git cd steel-mcp-server npm install npm run build
Konfigurieren Sie Claude Desktop ( ~/Library/Application Support/Claude/claude_desktop_config.json ) für den lokalen Modus:
{ "mcpServers": { "steel-puppeteer": { "command": "node", "args": ["path/to/steel-voyager/dist/index.js"], "env": { "STEEL_LOCAL": "true", "STEEL_BASE_URL": "http://localhost:3000", "GLOBAL_WAIT_SECONDS": "1" } } } }
- „STEEL_LOCAL“ muss „true“ sein.
- Wenn Sie das Hosting selbst auf einem Cloud-Server durchführen, konfigurieren Sie „STEEL_BASE_URL“ so, dass es auf Ihre lokale/selbst gehostete Steel-URL verweist.
Starten Sie Claude Desktop, wodurch eine Verbindung zu Ihrem lokal laufenden Steel hergestellt wird und Steel Voyager im lokalen Modus gestartet wird.
(Optional) Um Sitzungen lokal anzuzeigen, können Sie Ihr selbst gehostetes Dashboard ( localhost:5173 ) oder die Protokolle besuchen, die für Ihre Steel-Laufzeitumgebung spezifisch sind.

Das war's! Sobald Claude Desktop startet, orchestriert es den MCP-Server im Hintergrund und ermöglicht Ihnen die Interaktion mit den Web-Automatisierungsfunktionen über Steel Voyager.

Weitere Informationen zur Einrichtung oder bei Problemen finden Sie in den MCP-Einrichtungsdokumenten: https://modelcontextprotocol.io/quickstart/user

Komponenten

Werkzeuge

navigieren
- Navigieren Sie im Browser zu einer beliebigen URL
- Eingänge:
  - url (Zeichenfolge, erforderlich): URL, zu der navigiert werden soll (z. B. „ https://example.com “).
suchen
- Führen Sie eine Google-Suche durch, indem Sie zu „ https://www.google.com/search?q=encodedQuery “ navigieren.
- Eingänge:
  - query (Zeichenfolge, erforderlich): Text, nach dem bei Google gesucht werden soll.
klicken
- Klicken Sie auf Elemente auf der Seite mit nummerierten Beschriftungen
- Eingänge:
  - label (Zahl, erforderlich): Die Bezeichnungsnummer des anzuklickenden Elements.
Typ
- Geben Sie Text mithilfe nummerierter Beschriftungen in Eingabefelder ein
- Eingänge:
  - label (Zahl, erforderlich): Die Bezeichnungsnummer des Eingabefelds.
  - text (Zeichenfolge, erforderlich): Text, der in das Feld eingegeben werden soll.
  - replaceText (Boolesch, optional): Wenn „true“, wird jeglicher vorhandener Text im Feld ersetzt.
nach unten scrollen
- Scrollen Sie auf der Seite nach unten
- Eingänge:
  - pixels (Ganzzahl, optional): Anzahl der Pixel, um die nach unten gescrollt werden soll. Wenn nicht angegeben, wird um eine ganze Seite gescrollt.
nach oben scrollen
- Scrollen Sie die Seite nach oben
- Eingänge:
  - pixels (Ganzzahl, optional): Anzahl der Pixel, um die nach oben gescrollt werden soll. Wenn nicht angegeben, wird um eine ganze Seite gescrollt.
geh zurück
- Navigieren Sie zur vorherigen Seite im Browserverlauf
- Keine Eingaben erforderlich
Warten
- Warten Sie bis zu 10 Sekunden. Dies ist nützlich für Seiten, die langsam geladen werden oder mehr Zeit benötigen, bis dynamische Inhalte angezeigt werden.
- Eingänge:
  - seconds (Zahl, erforderlich): Anzahl der zu wartenden Sekunden (0 bis 10).
save_unmarked_screenshot
- Erfassen Sie die aktuelle Seite ohne Begrenzungsrahmen oder Hervorhebungen und speichern Sie sie als Ressource.
- Eingänge:
  - resourceName (String, optional): Name, unter dem der Screenshot gespeichert werden soll (z. B. „before_login“). Falls dieser Name weggelassen wird, wird automatisch ein generischer Name generiert.

Ressourcen

Screenshots : Auf jeden gespeicherten Screenshot kann über eine MCP-Ressourcen-URI in folgender Form zugegriffen werden: • screenshot://RESOURCE_NAMEDer Server speichert diese Screenshots, wenn Sie das Tool „save_unmarked_screenshot“ verwenden oder wenn eine Aktion (bei den meisten Tools) mit einem kommentierten Screenshot endet. Diese Bilder können über eine Standard-MCP-Ressourcenabrufanforderung abgerufen werden.

(Hinweis: Obwohl Konsolenprotokolle weiterhin zur Analyse und Fehlerbehebung gesammelt werden, werden sie in dieser Implementierung nicht als abrufbare Ressourcen angezeigt. Sie erscheinen in den Protokollen des Servers, werden jedoch nicht über MCP-Ressourcen-URIs bereitgestellt.)

Hauptmerkmale

Browserautomatisierung mit Puppeteer
Steel-Integration für die Verwaltung von Browsersitzungen
Visuelle Elementidentifizierung durch nummerierte Etiketten
Screenshot-Funktionen
Grundlegende Webinteraktion (Navigation, Klicken, Ausfüllen von Formularen)
Lazy-Loading-Unterstützung durch Scrollen
Lokale und Remote-Unterstützung von Steel-Instanzen

Grundlegendes zu Begrenzungsrahmen

Bei der Interaktion mit Seiten fügt Steel Puppeteer visuelle Overlays hinzu, um interaktive Elemente leichter zu identifizieren:

Jedes interaktive Element (Schaltflächen, Links, Eingaben) erhält eine eindeutige nummerierte Bezeichnung
Farbige Kästchen markieren die Grenzen der Elemente
Beschriftungen werden zur einfachen Bezugnahme über oder in Elementen angezeigt
Verwenden Sie diese Zahlen, wenn Sie Elemente für Klick- oder Eingabevorgänge angeben

Konfiguration

Steel Voyager kann in zwei Modi ausgeführt werden: „Lokal“ oder „Cloud“. Dieses Verhalten wird durch Umgebungsvariablen gesteuert. Nachfolgend finden Sie eine kurze Übersicht:

Umgebungsvariable	Standard	Beschreibung
STAHL_LOKAL	"FALSCH"	Bestimmt, ob Steel Voyager im lokalen (true) oder Cloud-Modus (false) ausgeführt wird.
STEEL_API_KEY	(keiner)	Nur erforderlich, wenn STEEL_LOCAL = „false“. Wird verwendet, um Anfragen mit dem Steel-Endpunkt zu authentifizieren.
STEEL_BASE_URL	" https://api.steel.dev "	Die Basis-URL für die Steel-API. Überschreiben Sie diese Option, wenn Sie den Steel-Server selbst hosten (lokal oder in Ihrer eigenen Cloud-Umgebung). Wenn STEEL_LOCAL = "true" und STEEL_BASE_URL nicht gesetzt ist, wird standardmäßig " http://localhost:3000 " verwendet.
GLOBAL_WAIT_SECONDS	(keiner)	Optional. Anzahl der Sekunden, die nach jeder Tool-Aktion gewartet werden soll (z. B. um langsam ladende Seiten zu ermöglichen).

Lokaler Modus

Setzen Sie STEEL_LOCAL="true".
(Optional) Legen Sie STEEL_BASE_URL so fest, dass es auf den Steel-Server verweist, wenn Sie ihn in einer benutzerdefinierten Domäne hosten. Andernfalls verwendet Steel Voyager standardmäßig http://localhost:3000 .
In diesem Modus ist kein API-Schlüssel erforderlich.
Puppeteer stellt eine Verbindung über ws://0.0.0.0:3000 her

Beispiel:

export STEEL_LOCAL="true"

export STEEL_BASE_URL=" http://localhost:3000 " # nur beim Überschreiben

Cloud-Modus

Setzen Sie STEEL_LOCAL="false".
Legen Sie STEEL_API_KEY fest, damit sich Steel Voyager beim Steel-Cloud-Dienst authentifizieren kann (oder bei Ihrem selbst gehosteten Steel, wenn Sie STEEL_BASE_URL geändert haben).
STEEL_BASE_URL ist standardmäßig auf https://api.steel.dev eingestellt. Überschreiben Sie dies, wenn Sie eine selbst gehostete Steel-Instanz auf einem anderen Endpunkt ausführen.
Puppeteer stellt eine Verbindung über wss://connect.steel.dev?sessionId=…&apiKey=… her.

Beispiel:

export STEEL_LOCAL="false"

export STEEL_API_KEY="IHR_STEEL_API_KEY_HIER"

Claude Desktop-Konfiguration

Um Steel Voyager mit Claude Desktop zu verwenden, fügen Sie Ihrer Konfigurationsdatei (häufig unter ~/Library/Application Support/Claude/claude_desktop_config.json) etwas wie Folgendes hinzu:

{
  "mcpServers": {
    "steel-puppeteer": {
      "command": "node",
      "args": ["path/to/steel-puppeteer/dist/index.js"],
      "env": {
        "STEEL_LOCAL": "false",
        "STEEL_API_KEY": "your_api_key_here"
      }
    }
  }
}

Passen Sie die Umgebungsvariablen an den gewünschten Modus an:

• Wenn Sie lokal/selbst gehostet ausführen, behalten Sie "STEEL_LOCAL": "true" und optional "STEEL_BASE_URL": "http://localhost:3000" .
• Wenn Sie im Cloud-Modus arbeiten, entfernen Sie "STEEL_LOCAL": "true" , fügen Sie "STEEL_LOCAL": "false" hinzu und geben Sie "STEEL_API_KEY": "<YourKey>" an. Dadurch kann Claude Desktop Steel Voyager im richtigen Modus starten.

Installation und Ausführung

Installation über Smithery

So installieren Sie Steel MCP Server für Claude Desktop automatisch über Smithery :

npx -y @smithery/cli install @steel-dev/steel-mcp-server --client claude

Lokale Entwicklung

Klonen Sie das Repository
Installieren Sie Abhängigkeiten:
npm install
Erstellen Sie das Projekt:
npm run build
Starten Sie den Server:
npm start

Anwendungsbeispiel 📹

Wir haben Claude gebeten, uns mit seinen neuen Fähigkeiten zu beeindrucken, und er hat beschlossen, die neuesten Entwicklungen mit Sora zu erforschen und dann eine interaktive Visualisierung zu erstellen, um die Daten hinter dem Modell und seine Funktionsweise zu demonstrieren 🤯

https://github.com/user-attachments/assets/8d4293ea-03fc-459f-ba6b-291f5b017ad7

*Entschuldigen Sie die Qualität, GitHub zwingt uns, die Videos unter 10 MB zu halten :/

Fehlerbehebung

Häufige Probleme und Lösungen:

Überprüfen Sie Ihren Steel-API-Schlüssel, wenn Sie den Cloud-Dienst nutzen, und stellen Sie sicher, dass Ihre lokale Steel-Instanz ausgeführt wird. Stellen Sie sicher, dass Sie über eine ordnungsgemäße Netzwerkverbindung zum Dienst verfügen.
Wenn Sie Probleme mit der Darstellung oder Markierung von Seiten und deren Übermittlung an Claude haben, versuchen Sie, Ihrer Konfiguration über die Umgebungsvariable GLOBAL_WAIT_SECONDS eine Verzögerung hinzuzufügen.
Stellen Sie sicher, dass die Seite vollständig geladen ist, und überprüfen Sie die Einstellungen für die Ansichtsfenstergröße. Stellen Sie sicher, dass Ihr System über genügend freien Speicher für die Aufnahme von Screenshots verfügt.
Die Sitzungsbereinigung ist derzeit nicht optimal, daher müssen Sie Sitzungen möglicherweise manuell freigeben, wenn sie zur Ausführung von Aufgaben hochgefahren werden.
Durch die richtige Anleitung von Claude können Sie die Leistung erheblich verbessern und dumme Fehler vermeiden, die dadurch entstehen können.
Nutzen Sie den Sitzungsbetrachter, um zu analysieren, wo Ihr Modell möglicherweise gestoppt wird.
Nach etwa 15–20 Browseraktionen wird Claude langsamer, da das Kontextfenster mit Bildern gefüllt wird. Es sollte nicht schlimm sein, aber wir haben hier eine gewisse Latenz festgestellt, insbesondere da der Claude Desktop-Client langsamer läuft.

Beitragen

Dieses Projekt ist experimentell und befindet sich in aktiver Entwicklung. Beiträge sind willkommen!

Forken Sie das Repository
Erstellen eines Feature-Zweigs
Senden einer Pull-Anfrage

Bitte geben Sie an:

Klare Beschreibung der Änderungen
Motivation
Aktualisierungen der Dokumentation

Haftungsausschluss

⚠️ Dieses Projekt ist experimentell und basiert auf der Web Voyager-Codebasis. Die Verwendung in Produktionsumgebungen erfolgt auf eigene Gefahr.

Install Server

HTTP connection URL

security – no known vulnerabilities

license - permissive license

quality - confirmed to work

How are these scores calculated?

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Tools

View all tools

Ermöglicht LLMs wie Claude die Navigation im Web mithilfe von Puppeteer-basierten Tools und Steel. Basierend auf dem Web Voyager Framework bietet es Tools für alle gängigen Webaktionen wie Klicken, Scrollen, Tippen usw. und das Erstellen von Screenshots.

Related Resources

Reddit Discussion about this server

Related MCP Servers

MCP-Server-Playwright
Automata-Labs-team
A
security
A
license
A
quality
Enables LLMs to interact with web pages, take screenshots, and execute JavaScript in a real browser environment
Last updated -
10
327
199
JavaScript
MIT License
mcp-server-browserbaseofficial
browserbase
A
security
A
license
A
quality
This server provides cloud browser automation capabilities using Browserbase, Puppeteer, and Stagehand. This server enables LLMs to interact with web pages, take screenshots, and execute JavaScript in a cloud browser environment.
Last updated -
8
1,483
2,216
TypeScript
Apache 2.0
Puppeteer MCP Server
jwaldor
A
security
F
license
A
quality
Enables LLMs to perform web browsing tasks, take screenshots, and execute JavaScript using Puppeteer for browser automation.
Last updated -
4
15,502
1
JavaScript
MCP Puppeteer Linux Server
PhialsBasement
A
security
F
license
A
quality
Enables browser automation for LLMs on Linux display servers, supporting web interaction, screenshots, and JavaScript execution in a real browser.
Last updated -
7
5
4
JavaScript

View all related MCP servers

Steel MCP Server

Steel MCP Server

🚀 Schnellstart

Voraussetzungen

A) Schnellstart (Steel Cloud)

B) Schnellstart (Lokaler/selbstgehosteter Stahl)

Komponenten

Werkzeuge

Ressourcen

Hauptmerkmale

Grundlegendes zu Begrenzungsrahmen

Konfiguration

Lokaler Modus

Cloud-Modus

Claude Desktop-Konfiguration

Installation und Ausführung

Installation über Smithery

Lokale Entwicklung

Anwendungsbeispiel 📹

Fehlerbehebung

Beitragen

Haftungsausschluss

Tools

Related Resources

Related MCP Servers

MCP-Server-Playwright

mcp-server-browserbaseofficial

Puppeteer MCP Server

MCP Puppeteer Linux Server

Appeared in Searches

New MCP Servers

MCP directory API