Databricks MCP Server

by JordiNeil
Verified

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Integrations

  • Connects to Databricks API, allowing SQL query execution on Databricks warehouses, listing of jobs, retrieving job status, and accessing detailed job information.

Servidor MCP de Databricks

Un servidor de Protocolo de contexto de modelo (MCP) que se conecta a la API de Databricks, lo que permite a los LLM ejecutar consultas SQL, enumerar trabajos y obtener el estado de los trabajos.

Características

  • Ejecutar consultas SQL en almacenes SQL de Databricks
  • Lista de todos los trabajos de Databricks
  • Obtener el estado de trabajos específicos de Databricks
  • Obtenga información detallada sobre las ofertas de trabajo de Databricks

Prerrequisitos

  • Python 3.7+
  • Espacio de trabajo de Databricks con:
    • Token de acceso personal
    • Punto final del almacén de SQL
    • Permisos para ejecutar consultas y acceder a trabajos

Configuración

  1. Clonar este repositorio
  2. Crear y activar un entorno virtual (recomendado):
    python -m venv .venv source .venv/bin/activate # On Windows: .venv\Scripts\activate
  3. Instalar dependencias:
    pip install -r requirements.txt
  4. Cree un archivo .env en el directorio raíz con las siguientes variables:
    DATABRICKS_HOST=your-databricks-instance.cloud.databricks.com DATABRICKS_TOKEN=your-personal-access-token DATABRICKS_HTTP_PATH=/sql/1.0/warehouses/your-warehouse-id
  5. Prueba tu conexión (opcional pero recomendado):
    python test_connection.py

Obtención de credenciales de Databricks

  1. Host : la URL de su instancia de Databricks (por ejemplo, your-instance.cloud.databricks.com )
  2. Token : Crea un token de acceso personal en Databricks:
    • Vaya a Configuración de usuario (haga clic en su nombre de usuario en la parte superior derecha)
    • Seleccione la pestaña "Desarrollador"
    • Haga clic en "Administrar" en "Tokens de acceso".
    • Generar un nuevo token y guardarlo inmediatamente
  3. Ruta HTTP : para su almacén SQL:
    • Vaya a los almacenes SQL en Databricks
    • Seleccione su almacén
    • Busque los detalles de la conexión y copie la ruta HTTP

Ejecución del servidor

Inicie el servidor MCP:

python main.py

Puede probar el servidor MCP usando el inspector ejecutando

npx @modelcontextprotocol/inspector python3 main.py

Herramientas MCP disponibles

Las siguientes herramientas MCP están disponibles:

  1. run_sql_query(sql: str) : ejecuta consultas SQL en su almacén SQL de Databricks
  2. list_jobs() - Enumera todos los trabajos de Databricks en tu espacio de trabajo
  3. get_job_status(job_id: int) : obtiene el estado de un trabajo específico de Databricks por ID
  4. get_job_details(job_id: int) : obtiene información detallada sobre un trabajo específico de Databricks

Ejemplo de uso con LLM

Cuando se utiliza con LLM que admiten el protocolo MCP, este servidor permite la interacción en lenguaje natural con su entorno Databricks:

  • "Muéstrame todas las tablas de la base de datos"
  • "Ejecutar una consulta para contar registros en la tabla de clientes"
  • "Enumerar todos mis trabajos de Databricks"
  • "Verificar el estado del trabajo n.° 123"
  • "Muéstrame detalles sobre el trabajo n.° 456"

Solución de problemas

Problemas de conexión

  • Asegúrese de que su host Databricks sea correcto y no incluya el prefijo https://
  • Compruebe que su almacén SQL esté en funcionamiento y sea accesible
  • Verifique que su token de acceso personal tenga los permisos necesarios
  • Ejecute el script de prueba incluido: python test_connection.py

Consideraciones de seguridad

  • Su token de acceso personal de Databricks le proporciona acceso directo a su espacio de trabajo
  • Proteja su archivo .env y nunca lo envíe al control de versiones
  • Considere usar el token Databricks solo con los alcances de permisos adecuados
  • Ejecute este servidor en un entorno seguro
-
security - not tested
F
license - not found
-
quality - not tested

Un servidor de protocolo de contexto de modelo que permite a los LLM interactuar con los espacios de trabajo de Databricks a través del lenguaje natural, lo que permite la ejecución de consultas SQL y operaciones de gestión de trabajos.

  1. Features
    1. Prerequisites
      1. Setup
        1. Obtaining Databricks Credentials
      2. Running the Server
        1. Available MCP Tools
          1. Example Usage with LLMs
            1. Troubleshooting
              1. Connection Issues
            2. Security Considerations
              ID: gslv6zuxt9