데이터브릭스 MCP 서버
Databricks API에 연결하는 MCP(Model Context Protocol) 서버로, LLM이 SQL 쿼리를 실행하고, 작업을 나열하고, 작업 상태를 가져올 수 있습니다.
특징
Databricks SQL 웨어하우스에서 SQL 쿼리 실행
모든 Databricks 채용 공고를 나열하세요
특정 Databricks 작업의 상태 가져오기
Databricks 채용에 대한 자세한 정보를 얻으세요
Related MCP server: Databricks MCP Server
필수 조건
파이썬 3.7 이상
Databricks 작업 공간:
개인 액세스 토큰
SQL 웨어하우스 엔드포인트
쿼리 실행 및 작업 액세스 권한
설정
이 저장소를 복제하세요
가상 환경을 만들고 활성화합니다(권장):
지엑스피1
종속성 설치:
pip install -r requirements.txt다음 변수를 사용하여 루트 디렉토리에
.env파일을 만듭니다.DATABRICKS_HOST=your-databricks-instance.cloud.databricks.com DATABRICKS_TOKEN=your-personal-access-token DATABRICKS_HTTP_PATH=/sql/1.0/warehouses/your-warehouse-id연결을 테스트하세요(선택 사항이지만 권장):
python test_connection.py
Databricks 자격 증명 얻기
호스트 : Databricks 인스턴스 URL(예:
your-instance.cloud.databricks.com)토큰 : Databricks에서 개인 액세스 토큰을 생성합니다.
사용자 설정으로 이동하세요(오른쪽 상단의 사용자 이름을 클릭하세요)
"개발자" 탭을 선택하세요
"액세스 토큰"에서 "관리"를 클릭합니다.
새로운 토큰을 생성하고 즉시 저장하세요
HTTP 경로 : SQL 웨어하우스의 경우:
Databricks에서 SQL Warehouse로 이동
창고를 선택하세요
연결 세부 정보를 찾아 HTTP 경로를 복사합니다.
서버 실행
MCP 서버를 시작합니다.
검사기를 실행하여 MCP 서버를 테스트할 수 있습니다.
사용 가능한 MCP 도구
사용 가능한 MCP 도구는 다음과 같습니다.
run_sql_query(sql: str) - Databricks SQL Warehouse에서 SQL 쿼리를 실행합니다.
list_jobs() - 작업 공간의 모든 Databricks 작업을 나열합니다.
get_job_status(job_id: int) - ID로 특정 Databricks 작업의 상태를 가져옵니다.
get_job_details(job_id: int) - 특정 Databricks 작업에 대한 자세한 정보를 가져옵니다.
LLM을 사용한 예시 사용
MCP 프로토콜을 지원하는 LLM과 함께 사용하면 이 서버는 Databricks 환경과 자연어 상호 작용을 가능하게 합니다.
"데이터베이스의 모든 테이블을 보여주세요"
"고객 테이블의 레코드 수를 계산하는 쿼리를 실행합니다"
"내 모든 Databricks 작업 나열"
"작업 #123의 상태를 확인하세요"
"456번 작업에 대한 세부 정보를 보여주세요"
문제 해결
연결 문제
Databricks 호스트가 올바르고
https://접두사가 포함되지 않았는지 확인하세요.SQL 웨어하우스가 실행 중이고 액세스 가능한지 확인하세요.
개인 액세스 토큰에 필요한 권한이 있는지 확인하세요.
포함된 테스트 스크립트를 실행합니다:
python test_connection.py
보안 고려 사항
Databricks 개인 액세스 토큰은 작업 공간에 직접 액세스할 수 있도록 해줍니다.
.env파일을 보호하고 버전 제어에 커밋하지 마십시오.적절한 권한 범위만 있는 Databricks 토큰을 사용하는 것을 고려하세요.
이 서버를 안전한 환경에서 실행하세요