Doris MCP Server

Der Doris MCP (Model Control Panel) Server ist ein Backend-Dienst, der mit Python und FastAPI erstellt wurde. Er implementiert das MCP (Model Control Panel)-Protokoll und ermöglicht Clients die Interaktion mit ihm über definierte „Tools“. Er ist primär für die Verbindung mit Apache Doris-Datenbanken konzipiert und nutzt Large Language Models (LLMs) für Aufgaben wie die Konvertierung von Abfragen in natürlicher Sprache in SQL (NL2SQL), die Ausführung von Abfragen sowie die Verwaltung und Analyse von Metadaten.

Kernfunktionen

MCP-Protokollimplementierung : Bietet standardmäßige MCP-Schnittstellen, unterstützt Tool-Aufrufe, Ressourcenverwaltung und schnelle Interaktionen.
Mehrere Kommunikationsmodi :
- SSE (Server-Sent Events) : Wird über die Endpunkte /sse (Initialisierung) und /mcp/messages (Kommunikation) bereitgestellt ( src/sse_server.py ).
- Streamable HTTP : Wird über den einheitlichen /mcp -Endpunkt bereitgestellt und unterstützt Anforderung/Antwort und Streaming ( src/streamable_server.py ).
- (Optional) Stdio : Interaktion über Standard-Eingabe/Ausgabe ( src/stdio_server.py ) möglich, erfordert spezielle Startkonfiguration.
Toolbasierte Schnittstelle : Kernfunktionen sind als MCP-Tools gekapselt, die Clients bei Bedarf aufrufen können. Die aktuell verfügbaren Schlüsseltools konzentrieren sich auf die direkte Datenbankinteraktion:
- SQL-Ausführung ( mcp_doris_exec_query )
- Datenbank- und Tabellenliste ( mcp_doris_get_db_list , mcp_doris_get_db_table_list )
- Metadatenabruf ( mcp_doris_get_table_schema , mcp_doris_get_table_comment , mcp_doris_get_table_column_comments , mcp_doris_get_table_indexes )
- Abrufen von Prüfprotokollen ( mcp_doris_get_recent_audit_logs ) Hinweis: Aktuelle Tools konzentrieren sich hauptsächlich auf direkte DB-Operationen.
Datenbankinteraktion : Bietet Funktionen zum Herstellen einer Verbindung mit Apache Doris (oder anderen kompatiblen Datenbanken) und Ausführen von Abfragen ( src/utils/db.py ).
Flexible Konfiguration : Konfiguriert über eine .env Datei, unterstützt Einstellungen für Datenbankverbindungen, LLM-Anbieter/-Modelle, API-Schlüssel, Protokollierungsebenen usw.
Metadatenextraktion : Kann Metadateninformationen aus Datenbanken extrahieren ( src/utils/schema_extractor.py ).

Systemanforderungen

Python 3.12+
Datenbankverbindungsdetails (z. B. Doris-Host, Port, Benutzer, Passwort, Datenbank)

Schnellstart

1. Klonen Sie das Repository

# Replace with the actual repository URL if different
git clone https://github.com/apache/doris-mcp-server.git
cd doris-mcp-server

2. Abhängigkeiten installieren

pip install -r requirements.txt

3. Umgebungsvariablen konfigurieren

Kopieren Sie die Datei .env.example nach .env und ändern Sie die Einstellungen entsprechend Ihrer Umgebung:

cp env.example .env

Wichtige Umgebungsvariablen:

Datenbankverbindung :
- DB_HOST : Datenbank-Hostname
- DB_PORT : Datenbankport (Standard 9030)
- DB_USER : Datenbankbenutzername
- DB_PASSWORD : Datenbankkennwort
- DB_DATABASE : Standarddatenbankname
Serverkonfiguration :
- SERVER_HOST : Hostadresse, auf der der Server lauscht (Standard 0.0.0.0 )
- SERVER_PORT : Port, auf dem der Server lauscht (Standard 3000 )
- ALLOWED_ORIGINS : Von CORS zugelassene Ursprünge (durch Komma getrennt, * erlaubt alle)
- MCP_ALLOW_CREDENTIALS : Ob CORS-Anmeldeinformationen zugelassen werden sollen (Standard: false )
Protokollierungskonfiguration :
- LOG_DIR : Verzeichnis für Protokolldateien (Standard ./logs )
- LOG_LEVEL : Protokollebene (z. B. INFO , DEBUG , WARNING , ERROR , Standard INFO )
- CONSOLE_LOGGING : Ob Protokolle an die Konsole ausgegeben werden sollen (Standard: false )

Verfügbare MCP-Tools

In der folgenden Tabelle sind die wichtigsten Tools aufgeführt, die derzeit über einen MCP-Client aufgerufen werden können:

Werkzeugname	Beschreibung	Parameter	Status
`mcp_doris_get_db_list`	Rufen Sie eine Liste aller Datenbanknamen auf dem Server ab.	`random_string` (Zeichenfolge, erforderlich)	✅ Aktiv
`mcp_doris_get_db_table_list`	Rufen Sie eine Liste aller Tabellennamen in der angegebenen Datenbank ab.	`random_string` (Zeichenfolge, erforderlich), `db_name` (Zeichenfolge, optional, standardmäßig aktuelle Datenbank)	✅ Aktiv
`mcp_doris_get_table_schema`	Erhalten Sie die detaillierte Struktur der angegebenen Tabelle.	`random_string` (Zeichenfolge, Erforderlich), `table_name` (Zeichenfolge, Erforderlich), `db_name` (Zeichenfolge, Optional)	✅ Aktiv
`mcp_doris_get_table_comment`	Holen Sie sich den Kommentar für die angegebene Tabelle.	`random_string` (Zeichenfolge, Erforderlich), `table_name` (Zeichenfolge, Erforderlich), `db_name` (Zeichenfolge, Optional)	✅ Aktiv
`mcp_doris_get_table_column_comments`	Ruft Kommentare für alle Spalten in der angegebenen Tabelle ab.	`random_string` (Zeichenfolge, Erforderlich), `table_name` (Zeichenfolge, Erforderlich), `db_name` (Zeichenfolge, Optional)	✅ Aktiv
`mcp_doris_get_table_indexes`	Ruft Indexinformationen für die angegebene Tabelle ab.	`random_string` (Zeichenfolge, Erforderlich), `table_name` (Zeichenfolge, Erforderlich), `db_name` (Zeichenfolge, Optional)	✅ Aktiv
`mcp_doris_exec_query`	Führen Sie die SQL-Abfrage aus und geben Sie den Ergebnisbefehl zurück.	`random_string` (Zeichenfolge, erforderlich), `sql` (Zeichenfolge, erforderlich), `db_name` (Zeichenfolge, optional), `max_rows` (Ganzzahl, optional, Standard 100), `timeout` (Ganzzahl, optional, Standard 30)	✅ Aktiv
`mcp_doris_get_recent_audit_logs`	Rufen Sie Audit-Protokolldatensätze für einen aktuellen Zeitraum ab.	`random_string` (Zeichenfolge, erforderlich), `days` (Ganzzahl, optional, Standard 7), `limit` (Ganzzahl, optional, Standard 100)	✅ Aktiv

Hinweis: Alle Tools benötigen einen random_string Parameter als Aufrufkennung, der normalerweise automatisch vom MCP-Client verarbeitet wird. „Optional“ und „Erforderlich“ beziehen sich auf die interne Logik des Tools; der Client muss je nach Implementierung möglicherweise Werte für alle Parameter angeben. Die hier aufgeführten Toolnamen sind die Basisnamen; Clients können sie je nach Verbindungsmodus mit einem Präfix versehen sehen (z. B. mcp_doris_stdio3_get_db_list ).

4. Führen Sie den Dienst aus

Wenn Sie den SSE-Modus verwenden, führen Sie den folgenden Befehl aus:

./start_server.sh

Dieser Befehl startet die FastAPI-Anwendung und stellt standardmäßig sowohl SSE- als auch Streamable HTTP MCP-Dienste bereit.

Service-Endpunkte:

SSE-Initialisierung : http://<host>:<port>/sse
SSE-Kommunikation : http://<host>:<port>/mcp/messages (POST)
Streambares HTTP : http://<host>:<port>/mcp (Unterstützt GET, POST, DELETE, OPTIONS)
Integritätsprüfung : http://<host>:<port>/health
(Potenzielle) Statusprüfung : http://<host>:<port>/status (Bestätigen, ob in main.py implementiert)

Verwendung

Für die Interaktion mit dem Doris MCP-Server ist ein MCP-Client erforderlich. Der Client verbindet sich mit den SSE- oder Streamable-HTTP-Endpunkten des Servers und sendet Anfragen (wie tool_call ) gemäß der MCP-Spezifikation, um die Tools des Servers aufzurufen.

Hauptinteraktionsfluss:

Client-Initialisierung : Stellen Sie eine Verbindung zu /sse (SSE) her oder senden Sie einen initialize an /mcp (Streamable).
(Optional) Tools entdecken : Der Client kann mcp/listTools oder mcp/listOfferings aufrufen, um die Liste der unterstützten Tools, deren Beschreibungen und Parameterschemata abzurufen.
Tool aufrufen : Der Client sendet eine tool_call -Nachricht/Anforderung und gibt dabei den tool_name und arguments an.
- Beispiel: Tabellenschema abrufen
  - tool_name : mcp_doris_get_table_schema (oder der modusspezifische Name)
  - arguments : Schließen Sie random_string , table_name und db_name ein.
Handle-Antwort :
- Nicht-Streaming : Der Client erhält eine Antwort mit result oder error .
- Streaming : Der Client erhält eine Reihe von tools/progress , gefolgt von einer abschließenden Antwort mit dem result oder error .

Auf bestimmte Toolnamen und Parameter sollte im src/tools/ -Code verwiesen oder sie sollten über MCP-Erkennungsmechanismen abgerufen werden.

Verbinden mit Cursor

Sie können Cursor entweder im Stdio- oder im SSE-Modus mit diesem MCP-Server verbinden.

Stdio-Modus

Im Stdio-Modus kann Cursor den Serverprozess direkt verwalten. Die Konfiguration erfolgt in der MCP-Server-Einstellungsdatei von Cursor (normalerweise ~/.cursor/mcp.json oder ähnlich).

Wenn Sie den Stdio-Modus verwenden, führen Sie bitte den folgenden Befehl aus, um das Umgebungsabhängigkeitspaket herunterzuladen und zu erstellen. Beachten Sie jedoch, dass Sie den Projektpfad in die richtige Pfadadresse ändern müssen :

uv --project /your/path/doris-mcp-server run doris-mcp

Cursor konfigurieren: Fügen Sie Ihrer Cursor-MCP-Konfiguration einen Eintrag wie den folgenden hinzu:
{ "mcpServers": { "doris-stdio": { "command": "uv", "args": ["--project", "/path/to/your/doris-mcp-server", "run", "doris-mcp"], "env": { "DB_HOST": "127.0.0.1", "DB_PORT": "9030", "DB_USER": "root", "DB_PASSWORD": "your_db_password", "DB_DATABASE": "your_default_db" } }, // ... other server configurations ... } }
Wichtige Punkte:
- Ersetzen Sie /path/to/your/doris-mcp durch den tatsächlichen absoluten Pfad zum Stammverzeichnis des Projekts auf Ihrem System. Das Argument --project ist entscheidend, damit uv die pyproject.toml findet und den richtigen Befehl ausführt.
- Der command ist auf uv eingestellt (vorausgesetzt, Sie verwenden uv für die Paketverwaltung, wie in uv.lock angegeben). Die args umfassen --project , den Pfad, run und mcp-doris (was einem in Ihrer pyproject.toml definierten Skript entsprechen sollte).
- Die Datenbankverbindungsdaten ( DB_HOST , DB_PORT , DB_USER , DB_PASSWORD , DB_DATABASE ) werden direkt im env Block der Konfigurationsdatei festgelegt. Cursor leitet diese an den Serverprozess weiter. Bei der Konfiguration über Cursor ist für diesen Modus keine .env Datei erforderlich.

SSE-Modus

Im SSE-Modus müssen Sie den MCP-Server zunächst unabhängig ausführen und Cursor dann mitteilen, wie eine Verbindung zu ihm hergestellt werden soll.

Konfigurieren Sie .env : Stellen Sie sicher, dass Ihre Datenbankanmeldeinformationen und alle anderen erforderlichen Einstellungen (wie SERVER_PORT , wenn Sie nicht den Standardwert 3000 verwenden) in der .env Datei im Projektverzeichnis richtig konfiguriert sind.
Starten Sie den Server: Führen Sie den Server von Ihrem Terminal im Stammverzeichnis des Projekts aus:
./start_server.sh
Dieses Skript liest typischerweise die .env Datei und startet den FastAPI-Server im SSE-Modus (siehe das Skript und sse_server.py / main.py für weitere Einzelheiten). Beachten Sie den Host und den Port, auf dem der Server lauscht (Standard ist 0.0.0.0:3000 ).
Cursor konfigurieren: Fügen Sie Ihrer Cursor-MCP-Konfiguration einen Eintrag wie den folgenden hinzu, der auf den SSE-Endpunkt des laufenden Servers verweist:
{ "mcpServers": { "doris-sse": { "url": "http://127.0.0.1:3000/sse" // Adjust host/port if your server runs elsewhere }, // ... other server configurations ... } }
Hinweis: Im Beispiel wird der Standardport 3000 verwendet. Wenn Ihr Server auf einem anderen Port (z. B. 3010 im Beispiel) läuft, passen Sie die URL entsprechend an.

Nachdem Sie einen der Modi in Cursor konfiguriert haben, sollten Sie in der Lage sein, den Server (z. B. doris-stdio oder doris-sse ) auszuwählen und seine Tools zu verwenden.

Verzeichnisstruktur

doris-mcp-server/
├── doris_mcp_server/    # Source code for the MCP server
│   ├── main.py          # Main entry point, FastAPI app definition
│   ├── mcp_core.py      # Core MCP tool registration and Stdio handling
│   ├── sse_server.py    # SSE server implementation
│   ├── streamable_server.py # Streamable HTTP server implementation
│   ├── config.py        # Configuration loading
│   ├── tools/           # MCP tool definitions
│   │   ├── mcp_doris_tools.py # Main Doris-related MCP tools
│   │   ├── tool_initializer.py # Tool registration helper (used by mcp_core.py)
│   │   └── __init__.py
│   ├── utils/           # Utility classes and helper functions
│   │   ├── db.py              # Database connection and operations
│   │   ├── logger.py          # Logging configuration
│   │   ├── schema_extractor.py # Doris metadata/schema extraction logic
│   │   ├── sql_executor_tools.py # SQL execution helper (might be legacy)
│   │   └── __init__.py
│   └── __init__.py
├── logs/                # Log file directory (if file logging enabled)
├── README.md            # This file
├── .env.example         # Example environment variable file
├── requirements.txt     # Python dependencies for pip
├── pyproject.toml       # Project metadata and build system configuration (PEP 518)
├── uv.lock              # Lock file for 'uv' package manager (alternative to pip)
├── start_server.sh      # Script to start the server
└── restart_server.sh    # Script to restart the server

Entwicklung neuer Tools

In diesem Abschnitt wird der Prozess zum Hinzufügen neuer MCP-Tools zum Doris MCP-Server unter Berücksichtigung der aktuellen Projektstruktur beschrieben.

1. Nutzen Sie Dienstprogrammmodule

Bevor Sie eine neue Datenbankinteraktionslogik von Grund auf neu schreiben, überprüfen Sie die vorhandenen Dienstprogrammmodule:

doris_mcp_server/utils/db.py : Bietet grundlegende Funktionen zum Abrufen von Datenbankverbindungen ( get_db_connection ) und Ausführen von Rohabfragen ( execute_query , execute_query_df ).
doris_mcp_server/utils/schema_extractor.py ( MetadataExtractor -Klasse) : Bietet hochrangige Methoden zum Abrufen von Datenbankmetadaten, z. B. zum Auflisten von Datenbanken/Tabellen ( get_all_databases , get_database_tables ), zum Abrufen von Tabellenschemata/Kommentaren/Indizes ( get_table_schema , get_table_comment , get_column_comments , get_table_indexes ) und zum Zugriff auf Audit-Protokolle ( get_recent_audit_logs ). Enthält Caching-Mechanismen.
doris_mcp_server/utils/sql_executor_tools.py (Funktion execute_sql_query ) : Bietet einen Wrapper für db.execute_query , der Sicherheitsprüfungen enthält (optional, gesteuert durch die Umgebungsvariable ENABLE_SQL_SECURITY_CHECK ), SELECT-Abfragen automatisch LIMIT hinzufügt, die Ergebnisserialisierung (Datum, Dezimalzahlen) übernimmt und die Ausgabe in die standardmäßige MCP-Erfolgs-/Fehlerstruktur formatiert. Es wird empfohlen, dies für die Ausführung von benutzerdefiniertem oder generiertem SQL zu verwenden.

Sie können Funktionen aus diesen Modulen importieren und kombinieren, um Ihr neues Tool zu erstellen.

2. Tool-Logik implementieren

Implementieren Sie die Kernlogik Ihres neuen Tools als async Funktion in doris_mcp_server/tools/mcp_doris_tools.py . Dadurch bleiben die primären Toolimplementierungen zentralisiert. Stellen Sie sicher, dass Ihre Funktion Daten in einem Format zurückgibt, das sich problemlos in die Standard-MCP-Antwortstruktur integrieren lässt (siehe _format_response in derselben Datei als Referenz).

Beispiel: Erstellen wir ein einfaches Tool get_server_time .

# In doris_mcp_server/tools/mcp_doris_tools.py
import datetime
# ... other imports ...
from doris_mcp_server.tools.mcp_doris_tools import _format_response # Reuse formatter

# ... existing tools ...

async def mcp_doris_get_server_time() -> Dict[str, Any]:
    """Gets the current server time."""
    logger.info(f"MCP Tool Call: mcp_doris_get_server_time")
    try:
        current_time = datetime.datetime.now().isoformat()
        # Use the existing formatter for consistency
        return _format_response(success=True, result={"server_time": current_time})
    except Exception as e:
        logger.error(f"MCP tool execution failed mcp_doris_get_server_time: {str(e)}", exc_info=True)
        return _format_response(success=False, error=str(e), message="Error getting server time")

3. Registrieren Sie das Tool (Doppelregistrierung)

Aufgrund der separaten Handhabung der Modi SSE/Streamable und Stdio müssen Sie das Tool an zwei Stellen registrieren:

A. SSE/Streamable-Registrierung ( tool_initializer.py )

Importieren Sie Ihre neue Tool-Funktion aus mcp_doris_tools.py .
Fügen Sie innerhalb der Funktion register_mcp_tools eine neue Wrapper-Funktion hinzu, die mit @mcp.tool() dekoriert ist.
Die Wrapper-Funktion sollte Ihre Kerntoolfunktion aufrufen.
Definieren Sie den Werkzeugnamen und geben Sie im Dekorator eine ausführliche Beschreibung (einschließlich Parameter, falls vorhanden) an. Denken Sie daran, die obligatorische Parameterbeschreibung random_string aus Gründen der Clientkompatibilität einzuschließen, auch wenn Ihr Wrapper diese nicht explizit verwendet.

Beispiel ( tool_initializer.py ):

# In doris_mcp_server/tools/tool_initializer.py
# ... other imports ...
from doris_mcp_server.tools.mcp_doris_tools import (
    # ... existing tool imports ...
    mcp_doris_get_server_time # <-- Import the new tool
)

async def register_mcp_tools(mcp):
    # ... existing tool registrations ...

    # Register Tool: Get Server Time
    @mcp.tool("get_server_time", description="""[Function Description]: Get the current time of the MCP server.\n
[Parameter Content]:\n
- random_string (string) [Required] - Unique identifier for the tool call\n""")
    async def get_server_time_tool() -> Dict[str, Any]:
        """Wrapper: Get server time"""
        # Note: No parameters needed for the core function call here
        return await mcp_doris_get_server_time()

    # ... logging registration count ...

B. Stdio-Registrierung ( mcp_core.py )

Fügen Sie ähnlich wie bei SSE eine neue Wrapper-Funktion hinzu, die mit @stdio_mcp.tool() dekoriert ist.
Wichtig: Importieren Sie Ihre Kerntoolfunktion ( mcp_doris_get_server_time ) in die Wrapper-Funktion (in dieser Datei wird ein verzögertes Importmuster verwendet).
Der Wrapper ruft die Kernfunktion des Tools auf. Der Wrapper selbst muss möglicherweise async def sein, abhängig davon, wie FastMCP Tools im Stdio-Modus verarbeitet, selbst wenn die zugrunde liegende Funktion einfach ist (siehe aktuelle Dateistruktur). Stellen Sie sicher, dass der Aufruf übereinstimmt (z. B. verwenden Sie await wenn eine asynchrone Funktion aufgerufen wird).

Beispiel ( mcp_core.py ):

# In doris_mcp_server/mcp_core.py
# ... other imports and setup ...

# ... existing Stdio tool registrations ...

# Register Tool: Get Server Time (for Stdio)
@stdio_mcp.tool("get_server_time", description="""[Function Description]: Get the current time of the MCP server.\n
[Parameter Content]:\n
- random_string (string) [Required] - Unique identifier for the tool call\n""")
async def get_server_time_tool_stdio() -> Dict[str, Any]: # Using a slightly different wrapper name for clarity if needed
    """Wrapper: Get server time (Stdio)"""
    from doris_mcp_server.tools.mcp_doris_tools import mcp_doris_get_server_time # <-- Delayed import
    # Assuming the Stdio runner handles async wrappers correctly
    return await mcp_doris_get_server_time()

# --- Register Tools --- (Or wherever the registrations are finalized)

4. Neustart und Test

Nachdem Sie das Tool in beiden Dateien implementiert und registriert haben, starten Sie den MCP-Server neu (sowohl im SSE-Modus über ./start_server.sh als auch stellen Sie sicher, dass der von Cursor verwendete Stdio-Befehl bei Bedarf aktualisiert wird) und testen Sie das neue Tool mit Ihrem MCP-Client (wie Cursor) in beiden Verbindungsmodi.

Beitragen

Beiträge sind über Issues oder Pull Requests willkommen.

Lizenz

Dieses Projekt ist unter der Apache 2.0-Lizenz lizenziert. Weitere Informationen finden Sie in der Datei LICENSE (sofern vorhanden).

Install Server

HTTP connection URL

security – no known vulnerabilities

license - permissive license

quality - confirmed to work

How are these scores calculated?

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Tools

Backend-Dienst, der das Model Control Panel-Protokoll implementiert, das eine Verbindung zu Apache Doris-Datenbanken herstellt und es Benutzern ermöglicht, SQL-Abfragen auszuführen, Metadaten zu verwalten und möglicherweise LLMs für Aufgaben wie die Konvertierung natürlicher Sprache in SQL zu nutzen.

Related Resources

Reddit Discussion about this server

Related MCP Servers

MySQL MCP Server
Mineru98
-
security
A
license
-
quality
A server that enables AI models to interact with MySQL databases through a Model Control Protocol, providing tools for table creation, schema inspection, query execution, and data retrieval.
Last updated -
26
Python
MIT License
Superset MCP Server
LiusCraft
A
security
F
license
A
quality
A Model Context Protocol server that enables large language models to interact with Apache Superset databases through REST API, supporting database queries, table lookups, field information retrieval, and SQL execution.
Last updated -
4
4
TypeScript
MCP TapData Serverofficial
tapdata
-
security
F
license
-
quality
A Model Context Protocol server that enables Large Language Models to access and interact with database connections, including viewing schemas and performing CRUD operations on connected databases.
Last updated -
Metabase MCP Server
sazboxai
-
security
F
license
-
quality
A Model Control Protocol server that enables AI assistants to interact with Metabase databases, allowing models to explore database schemas, retrieve metadata, visualize relationships, and execute actions.
Last updated -
4
Python

View all related MCP servers

Doris MCP Server

Doris MCP Server

Kernfunktionen

Systemanforderungen

Schnellstart

1. Klonen Sie das Repository

2. Abhängigkeiten installieren

3. Umgebungsvariablen konfigurieren

Verfügbare MCP-Tools

4. Führen Sie den Dienst aus

Verwendung

Verbinden mit Cursor

Stdio-Modus

SSE-Modus

Verzeichnisstruktur

Entwicklung neuer Tools

1. Nutzen Sie Dienstprogrammmodule

2. Tool-Logik implementieren

3. Registrieren Sie das Tool (Doppelregistrierung)

4. Neustart und Test

Beitragen

Lizenz

Tools

Related Resources

Related MCP Servers

MySQL MCP Server

Superset MCP Server

MCP TapData Serverofficial

Metabase MCP Server

New MCP Servers

MCP directory API