트리노 MCP 서버

Trino의 모델 컨텍스트 프로토콜 서버로, AI 모델에 Trino의 분산 SQL 쿼리 엔진에 대한 구조화된 액세스를 제공합니다.

⚠️ 베타 릴리스(v0.1.2) ⚠️
이 프로젝트는 핵심 기능이 작동하고 테스트되어 안정화되고 있습니다. 자유롭게 포크하고 기여해 주세요!

특징

✅ Docker 컨테이너 API 초기화 문제가 해결되었습니다! (안정적인 서버 초기화)
✅ MCP 프로토콜을 통해 Trino 리소스를 노출합니다.
✅ AI 도구가 Trino에서 데이터를 쿼리하고 분석할 수 있도록 합니다.
✅ 전송 옵션 제공(STDIO 전송은 안정적으로 작동하고 SSE 전송에는 문제가 있음)
✅ 적절한 Trino 쿼리 실행을 위한 고정 카탈로그 처리
✅ Docker 컨테이너 API와 독립형 Python API 서버 옵션 모두

빠른 시작

지엑스피1

컨테이너화되지 않은 버전이 필요하신가요? 독립형 API를 실행하세요.

# Run the standalone API server on port 8008
python llm_trino_api.py

LLM 통합

LLM에게 Trino 인스턴스에 대한 직접 쿼리 권한을 부여하고 싶으신가요? 저희가 바로 그런 분들을 위한 간단한 도구를 준비했습니다!

명령줄 LLM 인터페이스

LLM이 Trino에 쿼리를 보내는 가장 간단한 방법은 명령줄 도구를 사용하는 것입니다.

# Simple direct query (perfect for LLMs)
python llm_query_trino.py "SELECT * FROM memory.bullshit.real_bullshit_data LIMIT 5"

# Specify a different catalog or schema
python llm_query_trino.py "SELECT * FROM information_schema.tables" memory information_schema

LLM을 위한 REST API

LLM 애플리케이션과 통합하기 위한 두 가지 API 옵션을 제공합니다.

1. Docker 컨테이너 API(포트 9097)

Docker 컨테이너는 포트 9097에서 REST API를 노출합니다.

# Execute a query against the Docker container API
curl -X POST "http://localhost:9097/api/query" \
     -H "Content-Type: application/json" \
     -d '{"query": "SELECT 1 AS test"}'

2. 독립형 Python API(포트 8008)

더욱 유연한 배포를 위해 독립 실행형 API 서버를 실행하세요.

# Start the API server on port 8008
python llm_trino_api.py

이렇게 하면 다음 위치에 종단점이 생성됩니다.

GET http://localhost:8008/ - API 사용 정보
POST http://localhost:8008/query - SQL 쿼리 실행

그런 다음 LLM이 이 엔드포인트에 HTTP 요청을 하도록 할 수 있습니다.

# Example code an LLM might generate
import requests

def query_trino(sql_query):
    response = requests.post(
        "http://localhost:8008/query",
        json={"query": sql_query}
    )
    return response.json()

# LLM-generated query
results = query_trino("SELECT job_title, AVG(salary) FROM memory.bullshit.real_bullshit_data GROUP BY job_title ORDER BY AVG(salary) DESC LIMIT 5")
print(results["formatted_results"])

이 접근 방식을 사용하면 LLM은 SQL 생성에 집중할 수 있고, 당사 도구는 모든 MCP 프로토콜의 복잡성을 처리합니다!

데모 및 검증 스크립트 🚀

우리는 AI 모델이 MCP 프로토콜을 사용하여 Trino에 대한 복잡한 쿼리를 실행하는 방법을 보여주는 멋진 데모 스크립트를 만들었습니다.

1. 헛소리 데이터 생성 및 로딩

tools/create_bullshit_data.py 스크립트는 터무니없는 직함, 부풀려진 급여, "헛소리 요소" 평가(1~10)를 가진 직원 10,000명의 데이터 세트를 생성합니다.

# Generate the bullshit data
python tools/create_bullshit_data.py

# Load the bullshit data into Trino's memory catalog
python load_bullshit_data.py

2. MCP를 통한 복잡한 쿼리 실행

test_bullshit_query.py 스크립트는 종단 간 MCP 상호 작용을 보여줍니다.

STDIO 전송을 사용하여 MCP 서버에 연결합니다.
MCP 사양에 따라 프로토콜을 초기화합니다.
WHERE, GROUP BY, HAVING, ORDER BY를 사용하여 복잡한 SQL 쿼리를 실행합니다.
결과를 처리하고 포맷합니다.

# Run a complex query against the bullshit data through MCP
python test_bullshit_query.py

높은 급여를 제공하는 최고의 BS 직업을 보여주는 예시 출력:

🏆 TOP 10 BULLSHIT JOBS (high salary, high BS factor):
----------------------------------------------------------------------------------------------------
JOB_TITLE             | COUNT                | AVG_SALARY           | MAX_SALARY           | AVG_BS_FACTOR        
----------------------------------------------------------------------------------------------------
Advanced Innovation Jedi | 2                    |            241178.50 |            243458.00 |                 7.50
VP of Digital Officer | 1                    |            235384.00 |            235384.00 |                 7.00
Innovation Technical Architect | 1                    |            235210.00 |            235210.00 |                 9.00
...and more!

3. API 테스트

test_llm_api.py 스크립트는 API 기능을 검증합니다.

# Test the Docker container API 
python test_llm_api.py

이는 다음에 대한 포괄적인 검사를 수행합니다.

API 엔드포인트 검색
문서 가용성
유효한 쿼리 실행
잘못된 쿼리에 대한 오류 처리

용법

# Start the server with docker-compose
docker-compose up -d

서버는 다음 위치에서 사용할 수 있습니다.

클라이언트 연결

✅ 중요 : 클라이언트 스크립트는 로컬 머신(Docker 외부)에서 실행되며 Docker 컨테이너에 연결됩니다. 스크립트는 docker exec 명령을 사용하여 자동으로 이를 처리합니다. MCP를 사용하기 위해 컨테이너 내부에 있을 필요는 없습니다!

로컬 머신에서 테스트 실행:

# Generate and load data into Trino
python tools/create_bullshit_data.py  # Generates data locally
python load_bullshit_data.py          # Loads data to Trino in Docker

# Run MCP query through Docker
python test_bullshit_query.py         # Queries using MCP in Docker

운송 옵션

이 서버는 두 가지 전송 방법을 지원하지만 현재는 STDIO만 안정적입니다.

STDIO Transport(권장 및 작동 중)

STDIO 전송은 안정적으로 작동하며 현재 테스트 및 개발을 위해 권장되는 유일한 방법입니다.

# Run with STDIO transport inside the container
docker exec -i trino_mcp_trino-mcp_1 python -m trino_mcp.server --transport stdio --debug --trino-host trino --trino-port 8080 --trino-user trino --trino-catalog memory

SSE 운송(권장하지 않음 - 심각한 문제가 있음)

SSE는 MCP의 기본 전송 방식이지만, 현재 MCP 1.3.0 버전에서는 심각한 문제가 발생하여 클라이언트 연결 해제 시 서버 충돌을 유발합니다. 다음 문제가 해결될 때까지 사용하지 않는 것이 좋습니다 .

# NOT RECOMMENDED: Run with SSE transport (crashes on disconnection)
docker exec trino_mcp_trino-mcp_1 python -m trino_mcp.server --transport sse --host 0.0.0.0 --port 8000 --debug

알려진 문제 및 수정 사항

수정됨: Docker 컨테이너 API 초기화

✅ 수정됨 : Docker 컨테이너의 API가 503 서비스를 사용할 수 없음 응답을 반환하는 문제를 해결했습니다. 문제는 app_lifespan 함수가 app_context_global 및 Trino 클라이언트 연결을 제대로 초기화하지 못하는 것이었습니다. 이 수정을 통해 다음 사항이 보장됩니다.

Trino 클라이언트는 시작 중에 명시적으로 연결됩니다.
AppContext 전역 변수가 올바르게 초기화되었습니다.
이제 건강 검진이 정상적으로 작동합니다.

503 오류가 발생하면 컨테이너가 최신 코드로 다시 빌드되었는지 확인하세요.

# Rebuild and restart the container with the fix
docker-compose stop trino-mcp
docker-compose rm -f trino-mcp
docker-compose up -d trino-mcp

MCP 1.3.0 SSE 전송 충돌

MCP 1.3.0의 SSE 전송에 심각한 문제가 있어 클라이언트 연결이 끊어지면 서버가 충돌합니다. 최신 MCP 버전이 통합될 때까지 STDIO 전송만 사용하세요. 오류는 다음과 같습니다.

RuntimeError: generator didn't stop after athrow()
anyio.BrokenResourceError

트리노 카탈로그 처리

Trino 클라이언트에서 카탈로그 처리 관련 문제를 해결했습니다. 원래 구현에서는 USE catalog 문을 사용하려고 했는데, 이 명령문은 안정적으로 작동하지 않았습니다. 이번 수정에서는 연결 매개변수에 카탈로그를 직접 설정합니다.

프로젝트 구조

이 프로젝트는 다음과 같이 구성됩니다.

src/ - Trino MCP 서버의 주요 소스 코드
examples/ - 서버 사용 방법을 보여주는 간단한 예제
scripts/ - 유용한 진단 및 테스트 스크립트
tools/ - 데이터 생성 및 설정을 위한 유틸리티 스크립트
tests/ - 자동화된 테스트

주요 파일:

llm_trino_api.py - LLM 통합을 위한 독립형 API 서버
test_llm_api.py - API 서버용 테스트 스크립트
test_mcp_stdio.py - STDIO 전송을 사용하는 기본 테스트 스크립트(권장)
test_bullshit_query.py - 헛소리 데이터를 사용한 복잡한 쿼리 예제
load_bullshit_data.py - 생성된 데이터를 Trino에 로드하는 스크립트
tools/create_bullshit_data.py - 재밌는 테스트 데이터를 생성하는 스크립트
run_tests.sh - 자동화된 테스트를 실행하는 스크립트
examples/simple_mcp_query.py - MCP를 사용하여 데이터를 쿼리하는 간단한 예

개발

중요 : 모든 스크립트는 로컬 머신에서 실행할 수 있습니다. 스크립트는 docker exec 명령을 통해 Docker 컨테이너와 자동으로 통신합니다!

# Install development dependencies
pip install -e ".[dev]"

# Run automated tests 
./run_tests.sh

# Test MCP with STDIO transport (recommended)
python test_mcp_stdio.py

# Simple example query
python examples/simple_mcp_query.py "SELECT 'Hello World' AS message"

테스트

Trino 쿼리가 올바르게 작동하는지 테스트하려면 STDIO 전송 테스트 스크립트를 사용하세요.

# Recommended test method (STDIO transport)
python test_mcp_stdio.py

헛소리 데이터를 사용하여 더 복잡한 테스트를 수행하려면:

# Load and query the bullshit data (shows the full power of Trino MCP!)
python load_bullshit_data.py
python test_bullshit_query.py

LLM API 엔드포인트를 테스트하려면 다음을 수행하세요.

# Test the Docker container API
python test_llm_api.py 

# Test the standalone API (make sure it's running first)
python llm_trino_api.py
curl -X POST "http://localhost:8008/query" \
     -H "Content-Type: application/json" \
     -d '{"query": "SELECT 1 AS test"}'

LLM이 이것을 어떻게 활용할 수 있는가

LLM은 Trino MCP 서버를 사용하여 다음을 수행할 수 있습니다.

데이터베이스 스키마 정보 가져오기 :
# Example prompt to LLM: "What schemas are available in the memory catalog?" # LLM can generate code to query: query = "SHOW SCHEMAS FROM memory"
복잡한 분석 쿼리 실행 :
# Example prompt: "Find the top 5 job titles with highest average salaries" # LLM can generate complex SQL: query = """ SELECT job_title, AVG(salary) as avg_salary FROM memory.bullshit.real_bullshit_data GROUP BY job_title ORDER BY avg_salary DESC LIMIT 5 """
데이터 분석 수행 및 결과 제시 :
# LLM can parse the response, extract insights and present to user: "The highest paying job title is 'Advanced Innovation Jedi' with an average salary of $241,178.50"

실제 LLM 분석 예: 회사별 쓸모없는 직업

"엉터리 직업에 종사하는 직원이 가장 많은 회사를 찾아 인어 차트를 만들어라"라는 과제를 받았을 때 LLM이 무엇을 만들어낼 수 있는지에 대한 실제 사례는 다음과 같습니다.

1단계: LLM이 쿼리를 생성하고 실행합니다.

SELECT 
  company, 
  COUNT(*) as employee_count, 
  AVG(bullshit_factor) as avg_bs_factor 
FROM 
  memory.bullshit.real_bullshit_data 
WHERE 
  bullshit_factor > 7 
GROUP BY 
  company 
ORDER BY 
  employee_count DESC, 
  avg_bs_factor DESC 
LIMIT 10

2단계: LLM은 결과를 수집하고 분석합니다.

COMPANY | EMPLOYEE_COUNT | AVG_BS_FACTOR
----------------------------------------
Unknown Co | 2 | 9.0
BitEdge | 1 | 10.0
CyberWare | 1 | 10.0
BitLink | 1 | 10.0
AlgoMatrix | 1 | 10.0
CryptoHub | 1 | 10.0
BitGrid | 1 | 10.0
MLStream | 1 | 10.0
CloudCube | 1 | 10.0
UltraEdge | 1 | 10.0

3단계: LLM이 인어 차트 시각화를 생성합니다.

대체 막대 차트:

4단계: LLM은 핵심 통찰력을 제공합니다

LLM은 데이터를 분석하고 통찰력을 제공할 수 있습니다.

"알려지지 않은 회사"는 헛소리 역할에 가장 많은 직원을 보유하고 있지만(2), 다른 모든 회사는 단 한 명만 보유하고 있습니다.
대부분의 회사는 완벽한 10.0의 헛소리 요인 점수를 달성했습니다.
기술 중심 기업(BitEdge, CyberWare 등)은 특히 무의미한 역할을 만드는 것으로 보입니다.
헛소리 역할은 임원이나 전문 직위 수준에 집중되어 있는 것으로 나타났습니다.

이 예에서는 LLM이 다음을 수행할 수 있는 방법을 보여줍니다.

자연어 질문에 따라 적절한 SQL 쿼리를 생성합니다.
Trino의 결과를 처리하고 해석합니다.
데이터의 시각적 표현을 만듭니다
의미 있는 통찰력과 분석 제공

API에 접근하기

Trino MCP 서버에는 이제 데이터 액세스를 위한 두 가지 API 옵션이 포함되었습니다.

1. Docker 컨테이너 API(포트 9097)

import requests
import json

# API endpoint (default port 9097 in Docker setup)
api_url = "http://localhost:9097/api/query"

# Define your SQL query
query_data = {
    "query": "SELECT * FROM memory.bullshit.real_bullshit_data LIMIT 5",
    "catalog": "memory",
    "schema": "bullshit"
}

# Send the request
response = requests.post(api_url, json=query_data)
results = response.json()

# Process the results
if results["success"]:
    print(f"Query returned {results['results']['row_count']} rows")
    for row in results['results']['rows']:
        print(row)
else:
    print(f"Query failed: {results['message']}")

2. 독립형 Python API(포트 8008)

# Same code as above, but with different port
api_url = "http://localhost:8008/query"

두 API 모두 다음과 같은 엔드포인트를 제공합니다.

GET /api - API 문서 및 사용 예
POST /api/query - Trino에 대한 SQL 쿼리 실행

이러한 API를 사용하면 래퍼 스크립트가 필요 없으며 LLM이 REST 호출을 사용하여 Trino에 직접 쿼리를 보낼 수 있으므로 Claude, GPT 및 기타 AI 시스템과의 통합이 훨씬 간편해집니다.

문제 해결

API가 503 서비스를 사용할 수 없음을 반환합니다.

Docker 컨테이너 API가 503 오류를 반환하는 경우:

최신 코드로 컨테이너를 다시 빌드했는지 확인하세요.
docker-compose stop trino-mcp docker-compose rm -f trino-mcp docker-compose up -d trino-mcp
컨테이너 로그에서 오류를 확인하세요.
docker logs trino_mcp_trino-mcp_1
Trino가 제대로 실행되는지 확인하세요.
curl -s http://localhost:9095/v1/info | jq

독립 실행형 API와의 포트 충돌

독립형 API는 충돌을 방지하기 위해 기본적으로 8008 포트를 사용합니다. "주소가 이미 사용 중입니다" 오류가 표시되는 경우:

llm_trino_api.py 편집하고 마지막 줄의 포트 번호를 변경합니다.
uvicorn.run(app, host="127.0.0.1", port=8008)
명령줄을 통해 사용자 정의 포트로 실행:
python -c "import llm_trino_api; import uvicorn; uvicorn.run(llm_trino_api.app, host='127.0.0.1', port=8009)"

미래의 작업

이 기능은 현재 베타 버전이며 다음과 같은 개선 사항이 계획되어 있습니다.

[ ] SSE 전송 문제를 해결하기 위해 사용 가능한 최신 MCP 버전과 통합합니다.
[ ] Hive, JDBC 및 기타 커넥터에 대한 지원 추가/검증
[ ] 다양한 유형과 복잡성에 걸쳐 보다 포괄적인 쿼리 검증을 추가합니다.
[ ] 더 많은 데이터 유형과 고급 Trino 기능에 대한 지원을 구현합니다.
[ ] 오류 처리 및 복구 메커니즘 개선
[ ] 사용자 인증 및 권한 제어 추가
[ ] 보다 포괄적인 예제와 문서를 작성합니다.
[ ] 관리자 모니터링 및 관리 인터페이스 개발
[ ] 성능 측정 항목 및 쿼리 최적화 힌트 추가
[ ] 장기 실행 쿼리 및 결과 스트리밍에 대한 지원 구현

Stink Labs에서 개발, 2025

You must be authenticated.

security – no known vulnerabilities

license - permissive license

quality - confirmed to work

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Tools

AI 모델에 Trino의 분산 SQL 쿼리 엔진에 대한 구조화된 액세스를 제공하여 LLM이 Trino 데이터베이스에 저장된 데이터를 직접 쿼리하고 분석할 수 있도록 합니다.

Related Resources

Reddit Discussion about this server

Related MCP Servers

MySQL MCP Server
designcomputer
A
security
A
license
A
quality
Allows AI assistants to list tables, read data, and execute SQL queries through a controlled interface, making database exploration and analysis safer and more structured.
Last updated -
1
556
Python
MIT License
Microsoft SQL Server MCP Server (MSSQL)
dperussina
-
security
A
license
-
quality
An easy-to-use bridge that lets AI assistants like Claude and Cursor IDE directly query and explore Microsoft SQL Server databases. No coding experience required!
Last updated -
27
JavaScript
GPL 3.0
Trino MCP Server
Dataring-engineering
-
security
A
license
-
quality
An MCP server that enables listing and querying Trino tables using Python, providing access to data resources through the Model-Control-Protocol.
Last updated -
13
Python
MIT License
Metabase Server MCP
berry-street
-
security
F
license
-
quality
Enables AI assistants to interact with Metabase, providing access to dashboards, questions, databases, and tools for executing queries and viewing data through natural language.
Last updated -
JavaScript

View all related MCP servers

Appeared in Searches

An MCP server that does not require API configuration