Dokumentation für Ihren Agenten Website Lizenz npm version

Ref MCP

Ein ModelContextProtocol-Server, der Ihrem KI-Coding-Tool oder Agenten Zugriff auf Dokumentationen für APIs, Dienste, Bibliotheken usw. gewährt. Es ist Ihre zentrale Anlaufstelle, um Ihren Agenten schnell und token-effizient mit aktueller Dokumentation zu versorgen.

Weitere Informationen finden Sie unter ref.tools

Agentische Suche für genau den richtigen Kontext

Die Tools von Ref sind darauf ausgelegt, die Suchweise von Modellen nachzuahmen und dabei so wenig Kontext wie möglich zu verbrauchen, um Context Rot zu reduzieren. Das Ziel ist es, genau den Kontext zu finden, den Ihr Coding-Agent benötigt, um erfolgreich zu sein, während die Anzahl der verwendeten Token minimiert wird.

Je nach Komplexität des Prompts führen LLM-Coding-Agenten wie Claude Code normalerweise eine oder mehrere Suchen durch und wählen dann einige Ressourcen aus, um sie genauer zu lesen.

Für eine einfache Anfrage zur Figma Comment REST API werden ein paar Aufrufe getätigt, um genau das zu erhalten, was benötigt wird:

SEARCH 'Figma API post comment endpoint documentation' (54 tokens)
READ https://www.figma.com/developers/api#post-comments-endpoint (385 tokens)

Für komplexere Situationen versucht das LLM, seinen Prompt während des Lesens der Ergebnisse zu verfeinern. Zum Beispiel:

SEARCH 'n8n merge node vs Code node multiple inputs best practices' (126)
READ https://docs.n8n.io/integrations/builtin/core-nodes/n8n-nodes-base.merge/#merge (4961)
READ https://docs.n8n.io/flow-logic/merging/#merge-data-from-multiple-node-executions (138)
SEARCH 'n8n Code node multiple inputs best practices when to use' (107)
READ https://docs.n8n.io/code/code-node/#usage (80)
SEARCH 'n8n Code node access multiple inputs from different nodes' (370)
SEARCH 'n8n Code node $input access multiple node inputs' (372)
READ https://docs.n8n.io/code/builtin/output-other-nodes/#output-of-other-nodes (2310)

Ref nutzt MCP-Sitzungen, um den Suchverlauf zu verfolgen und den Kontextverbrauch zu minimieren. Es sind noch viele weitere Ideen in Arbeit, aber hier ist das, was wir bisher implementiert haben.

1. Filtern von Suchergebnissen

Bei wiederholten ähnlichen Suchen innerhalb einer Sitzung liefert Ref niemals wiederholte Ergebnisse zurück. Traditionell gräbt man sich tiefer in die Suchergebnisse, indem man zur nächsten Seite blättert, aber dieser Ansatz ermöglicht es dem Agenten, zu blättern UND gleichzeitig den Prompt anzupassen.

2. Abrufen des relevanten Teils der Seite

Beim Lesen einer Dokumentationsseite verwendet Ref den Suchverlauf der Agentensitzung, um weniger relevante Abschnitte auszublenden und die relevantesten 5k Token zurückzugeben. Dies hilft Ref, ein großes Problem beim Standard-fetch()-Web-Scraping zu vermeiden: Wenn eine große Dokumentationsseite aufgerufen wird, können leicht 20k+ Token in den Kontext geladen werden, von denen die meisten irrelevant sind.

Related MCP server: Firebase Realtime Database

Warum ist die Minimierung von Token aus dem Dokumentationskontext wichtig?

1. Mehr Kontext macht Modelle dümmer

Es ist seit Juli 2025 gut dokumentiert, dass Modelle dümmer werden, je mehr Token man eingibt. Sie haben vielleicht gehört, dass Modelle jetzt großartig mit langem Kontext umgehen können, und das stimmt teilweise, ist aber nicht das ganze Bild. Für eine kurze Einführung in einige Forschungsergebnisse sehen Sie sich dieses Video vom Team bei Chroma an.

2. Token kosten $$$

Stellen Sie sich vor, Sie verwenden Claude Opus als Hintergrund-Agenten und lassen den Agenten Dokumentationskontext abrufen. Angenommen, er zieht 10.000 Token Kontext, wobei 4.000 relevant sind und 6.000 zusätzliches Rauschen darstellen. Bei den API-Preisen kosten diese 6k Token etwa 0,09 $ PRO SCHRITT. Wenn ein Prompt am Ende 11 Schritte mit Opus erfordert, haben Sie 1 $ ohne Grund ausgegeben.

Einrichtung

Es gibt zwei Optionen für die Einrichtung von Ref als MCP-Server: entweder über den streamable-http-Server (empfohlen) oder den lokalen stdio-Server (veraltet).

Dieses Repo enthält den veralteten stdio-Server.

Streamable HTTP (empfohlen)

Install Ref MCP in Cursor

"Ref": {
  "type": "http",
  "url": "https://api.ref.tools/mcp?apiKey=YOUR_API_KEY"
}

stdio

Install Ref MCP in Cursor (stdio)

"Ref": {
  "command": "npx",
  "args": ["ref-tools-mcp@latest"],
  "env": {
    "REF_API_KEY": <sign up to get an api key>
  }
}

Tools

Der Ref MCP-Server bietet alle dokumentationsbezogenen Tools, die Ihr Agent benötigt.

ref_search_documentation

Ein leistungsstarkes Suchwerkzeug zur Überprüfung technischer Dokumentationen. Großartig zum Finden von Fakten oder Code-Snippets. Kann verwendet werden, um öffentliche Dokumentationen im Web oder auf GitHub sowie private Ressourcen wie Repos und PDFs zu durchsuchen.

Parameter:

query (erforderlich): Suchanfrage für relevante Dokumentation. Dies sollte ein vollständiger Satz oder eine Frage sein.

ref_read_url

Ein Tool, das Inhalte von einer URL abruft und für das einfache Lesen mit Ref in Markdown konvertiert. Dies ist besonders leistungsstark in Verbindung mit dem Tool ref_search_documentation, das URLs relevanter Inhalte zurückgibt.

Parameter:

url (erforderlich): Die URL der zu lesenden Webseite.

Unterstützung für OpenAI Deep Research

Ref kann als Quelle für Deep Research verwendet werden. OpenAI erfordert spezifische Tool-Definitionen. Wenn Ref also mit einem OpenAI-Client verwendet wird, stellt es dieselben Tools mit leicht abweichenden Namen bereit.

ref_search_documentation(query) -> search(query)
ref_read_url(url) -> fetch(id)

Entwicklung

npm install
npm run dev

Ausführung mit Inspector

Für Entwicklungs- und Debugging-Zwecke können Sie das MCP Inspector-Tool verwenden. Der Inspector bietet eine visuelle Schnittstelle zum Testen und Überwachen von MCP-Server-Interaktionen.

Besuchen Sie die Inspector-Dokumentation für detaillierte Einrichtungsanweisungen.

Zum lokalen Testen mit Inspector:

npm run inspect

Oder führen Sie sowohl den Watcher als auch den Inspector aus:

npm run dev

Lokale Entwicklung

Klonen Sie das Repository
Installieren Sie die Abhängigkeiten:

npm install

Bauen Sie das Projekt:

npm run build

Für die Entwicklung mit automatischem Neuaufbau:

npm run watch

Lizenz

MIT

Ref

Ref MCP

Agentische Suche für genau den richtigen Kontext

1. Filtern von Suchergebnissen

2. Abrufen des relevanten Teils der Seite

Warum ist die Minimierung von Token aus dem Dokumentationskontext wichtig?

1. Mehr Kontext macht Modelle dümmer

2. Token kosten $$$

Einrichtung

Streamable HTTP (empfohlen)

stdio

Tools

ref_search_documentation

ref_read_url

Unterstützung für OpenAI Deep Research

Entwicklung

Ausführung mit Inspector

Lokale Entwicklung

Lizenz

Resources

Looking for Admin?

Tools

Latest Blog Posts

MCP directory API