Databricks MCP Server

by JordiNeil
Verified

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Integrations

  • Connects to Databricks API, allowing SQL query execution on Databricks warehouses, listing of jobs, retrieving job status, and accessing detailed job information.

데이터브릭스 MCP 서버

Databricks API에 연결하는 MCP(Model Context Protocol) 서버로, LLM이 SQL 쿼리를 실행하고, 작업을 나열하고, 작업 상태를 가져올 수 있습니다.

특징

  • Databricks SQL 웨어하우스에서 SQL 쿼리 실행
  • 모든 Databricks 채용 공고를 나열하세요
  • 특정 Databricks 작업의 상태 가져오기
  • Databricks 채용에 대한 자세한 정보를 얻으세요

필수 조건

  • 파이썬 3.7 이상
  • Databricks 작업 공간:
    • 개인 액세스 토큰
    • SQL 웨어하우스 엔드포인트
    • 쿼리 실행 및 작업 액세스 권한

설정

  1. 이 저장소를 복제하세요
  2. 가상 환경을 만들고 활성화합니다(권장):지엑스피1
  3. 종속성 설치:
    pip install -r requirements.txt
  4. 다음 변수를 사용하여 루트 디렉토리에 .env 파일을 만듭니다.
    DATABRICKS_HOST=your-databricks-instance.cloud.databricks.com DATABRICKS_TOKEN=your-personal-access-token DATABRICKS_HTTP_PATH=/sql/1.0/warehouses/your-warehouse-id
  5. 연결을 테스트하세요(선택 사항이지만 권장):
    python test_connection.py

Databricks 자격 증명 얻기

  1. 호스트 : Databricks 인스턴스 URL(예: your-instance.cloud.databricks.com )
  2. 토큰 : Databricks에서 개인 액세스 토큰을 생성합니다.
    • 사용자 설정으로 이동하세요(오른쪽 상단의 사용자 이름을 클릭하세요)
    • "개발자" 탭을 선택하세요
    • "액세스 토큰"에서 "관리"를 클릭합니다.
    • 새로운 토큰을 생성하고 즉시 저장하세요
  3. HTTP 경로 : SQL 웨어하우스의 경우:
    • Databricks에서 SQL Warehouse로 이동
    • 창고를 선택하세요
    • 연결 세부 정보를 찾아 HTTP 경로를 복사합니다.

서버 실행

MCP 서버를 시작합니다.

python main.py

검사기를 실행하여 MCP 서버를 테스트할 수 있습니다.

npx @modelcontextprotocol/inspector python3 main.py

사용 가능한 MCP 도구

사용 가능한 MCP 도구는 다음과 같습니다.

  1. run_sql_query(sql: str) - Databricks SQL Warehouse에서 SQL 쿼리를 실행합니다.
  2. list_jobs() - 작업 공간의 모든 Databricks 작업을 나열합니다.
  3. get_job_status(job_id: int) - ID로 특정 Databricks 작업의 상태를 가져옵니다.
  4. get_job_details(job_id: int) - 특정 Databricks 작업에 대한 자세한 정보를 가져옵니다.

LLM을 사용한 예시 사용

MCP 프로토콜을 지원하는 LLM과 함께 사용하면 이 서버는 Databricks 환경과 자연어 상호 작용을 가능하게 합니다.

  • "데이터베이스의 모든 테이블을 보여주세요"
  • "고객 테이블의 레코드 수를 계산하는 쿼리를 실행합니다"
  • "내 모든 Databricks 작업 나열"
  • "작업 #123의 상태를 확인하세요"
  • "456번 작업에 대한 세부 정보를 보여주세요"

문제 해결

연결 문제

  • Databricks 호스트가 올바르고 https:// 접두사가 포함되지 않았는지 확인하세요.
  • SQL 웨어하우스가 실행 중이고 액세스 가능한지 확인하세요.
  • 개인 액세스 토큰에 필요한 권한이 있는지 확인하세요.
  • 포함된 테스트 스크립트를 실행합니다: python test_connection.py

보안 고려 사항

  • Databricks 개인 액세스 토큰은 작업 공간에 직접 액세스할 수 있도록 해줍니다.
  • .env 파일을 보호하고 버전 제어에 커밋하지 마십시오.
  • 적절한 권한 범위만 있는 Databricks 토큰을 사용하는 것을 고려하세요.
  • 이 서버를 안전한 환경에서 실행하세요
-
security - not tested
F
license - not found
-
quality - not tested

LLM이 자연어를 통해 Databricks 작업 공간과 상호 작용하고 SQL 쿼리 실행 및 작업 관리 작업을 수행할 수 있도록 하는 모델 컨텍스트 프로토콜 서버입니다.

  1. Features
    1. Prerequisites
      1. Setup
        1. Obtaining Databricks Credentials
      2. Running the Server
        1. Available MCP Tools
          1. Example Usage with LLMs
            1. Troubleshooting
              1. Connection Issues
            2. Security Considerations
              ID: gslv6zuxt9