GraphQL Schema Embedder MCP Server

server.py•22.2 KiB

""" GraphQL MCP server exposing `list_types` and `run_query` tools over a schema file or live endpoint. What it does: - Builds and caches an embedding index of `type.field` signatures for fuzzy search. - Exposes `list_types` for discovery and `run_query` for validation/execution. How `list_types` works: - Embed the user query and search the persisted index. - Re-rank hits: Query fields first; if the query looks like aggregation, prefer count/aggregate fields; then fall back to embedding similarity. - Parse each signature to build a ready-to-run `query_template`. - Generate selection sets for object returns and add hints for connection pagination or aggregate fields. How `run_query` works: - Local mode: validates against the SDL schema (no resolvers, so data is null-only). - Endpoint mode: proxies the query to the remote URL using introspection-derived SDL for indexing. Startup notes: - Can auto-index in a background thread. - Supports stdio/SSE/HTTP transports configured via env or CLI flags. """ import os import json import logging import threading from pathlib import Path from typing import Literal from urllib.error import HTTPError from urllib.request import Request, urlopen from dotenv import load_dotenv from graphql import ( build_client_schema, build_schema, get_introspection_query, graphql_sync, print_schema, ) from mcp.server.fastmcp import FastMCP from config import load_embedder_config from embedding_client import EmbeddingClient from schema_indexer import ( DEFAULT_DATA_DIR, DEFAULT_SCHEMA_PATH, EmbeddingStore, ensure_index, ensure_index_text, ) APP_NAME = "graphql-mcp" _REPO_ROOT = Path(__file__).resolve().parent.parent _ENV_PATHS = [Path.cwd() / ".env", _REPO_ROOT / ".env"] for _path in _ENV_PATHS: if _path.exists(): load_dotenv(_path, override=True) DEFAULT_TRANSPORT = os.environ.get("MCP_TRANSPORT", os.environ.get("FASTMCP_TRANSPORT", "sse")) DEFAULT_INSTRUCTIONS = ( "You are an information lookup assistant. Treat this MCP server as an abstraction layer for GraphQL " "For any user question, first call list_types with a focused query. Prefer Query fields " "and their query_template. Then call run_query with a single, valid query. Avoid unnecessary tool calls." ) MCP_INSTRUCTIONS = os.environ.get("MCP_INSTRUCTIONS", DEFAULT_INSTRUCTIONS) SCHEMA_PATH = Path(os.environ.get("GRAPHQL_SCHEMA_PATH", str(DEFAULT_SCHEMA_PATH))) ENDPOINT_URL = os.environ.get("GRAPHQL_ENDPOINT_URL") DATA_DIR = Path(os.environ.get("GRAPHQL_EMBEDDER_DATA_DIR", str(DEFAULT_DATA_DIR))) EMBEDDER_CONFIG = load_embedder_config() EMBED_MODEL = EMBEDDER_CONFIG.model embedder = EmbeddingClient(config=EMBEDDER_CONFIG, model=EMBED_MODEL) store = EmbeddingStore(data_dir=DATA_DIR, embedding_model=embedder.model) SCHEMA_SOURCE: dict = {"kind": "file", "path": str(SCHEMA_PATH)} SCHEMA_TEXT: str | None = None def _load_endpoint_headers_from_env() -> dict[str, str]: raw = os.environ.get("GRAPHQL_ENDPOINT_HEADERS") if not raw: return {} try: parsed = json.loads(raw) except json.JSONDecodeError as exc: raise ValueError("GRAPHQL_ENDPOINT_HEADERS must be valid JSON") from exc if not isinstance(parsed, dict): raise ValueError("GRAPHQL_ENDPOINT_HEADERS must be a JSON object") return {str(key): str(val) for key, val in parsed.items()} _REMOTE_HEADERS: dict[str, str] = _load_endpoint_headers_from_env() _REMOTE_TIMEOUT_S: float = 30.0 _INDEX_LOCK = threading.Lock() _SCALAR_TYPES = {"String", "Int", "Float", "Boolean", "ID"} _AGGREGATE_KEYWORDS = {"count", "total", "sum", "avg", "average", "how many", "number of"} _AGGREGATE_FIELD_PATTERNS = {"count", "total", "sum", "avg", "aggregate"} mcp = FastMCP(APP_NAME, instructions=MCP_INSTRUCTIONS) mcp.dependencies = ["graphql-core", "numpy", "aiohttp"] logger = logging.getLogger(APP_NAME) def _run_with_default_transport( self, transport: Literal["stdio", "sse", "streamable-http"] | None = None, mount_path: str | None = None, ): chosen = transport or DEFAULT_TRANSPORT return FastMCP.run(self, transport=chosen, mount_path=mount_path) mcp.run = _run_with_default_transport.__get__(mcp, FastMCP) def _run_indexing_or_exit() -> None: try: ensure_schema_indexed(force=False) except Exception as exc: logger.error("Schema indexing failed: %s", exc) os._exit(1) def configure_runtime(*, schema_path: Path, data_dir: Path, embed_model: str) -> None: global SCHEMA_PATH, ENDPOINT_URL, DATA_DIR, EMBED_MODEL, embedder, store, SCHEMA_SOURCE, SCHEMA_TEXT SCHEMA_PATH = schema_path ENDPOINT_URL = None DATA_DIR = data_dir EMBED_MODEL = embed_model embedder = EmbeddingClient(config=EMBEDDER_CONFIG, model=EMBED_MODEL) store = EmbeddingStore(data_dir=DATA_DIR, embedding_model=embedder.model) SCHEMA_SOURCE = {"kind": "file", "path": str(SCHEMA_PATH)} SCHEMA_TEXT = None def configure_runtime_endpoint( *, endpoint_url: str, data_dir: Path, embed_model: str, schema_text: str, schema_source: dict, ) -> None: global SCHEMA_PATH, ENDPOINT_URL, DATA_DIR, EMBED_MODEL, embedder, store, SCHEMA_SOURCE, SCHEMA_TEXT SCHEMA_PATH = Path("<endpoint>") ENDPOINT_URL = endpoint_url DATA_DIR = data_dir EMBED_MODEL = embed_model embedder = EmbeddingClient(config=EMBEDDER_CONFIG, model=EMBED_MODEL) store = EmbeddingStore(data_dir=DATA_DIR, embedding_model=embedder.model) SCHEMA_SOURCE = schema_source SCHEMA_TEXT = schema_text def _parse_headers(raw_headers: list[str] | None) -> dict[str, str]: headers: dict[str, str] = {} for raw in raw_headers or []: if ":" not in raw: raise ValueError(f"Invalid header (expected 'Name: Value'): {raw}") name, value = raw.split(":", 1) name = name.strip() value = value.strip() if not name: raise ValueError(f"Invalid header name in: {raw}") headers[name] = value return headers def _post_json(url: str, payload: dict, headers: dict[str, str] | None = None, timeout_s: float = 30.0) -> dict: body = json.dumps(payload).encode("utf-8") req = Request(url, data=body, method="POST") req.add_header("Content-Type", "application/json") req.add_header("Accept", "application/json") for k, v in (headers or {}).items(): req.add_header(k, v) try: with urlopen(req, timeout=timeout_s) as resp: raw = resp.read().decode("utf-8") return json.loads(raw) if raw else {} except HTTPError as exc: raw = exc.read().decode("utf-8") if exc.fp else "" if raw: try: return json.loads(raw) except json.JSONDecodeError: return {"errors": [{"message": raw}]} raise def _introspect_schema_sdl(endpoint_url: str, headers: dict[str, str], timeout_s: float) -> str: payload = { "query": get_introspection_query(descriptions=True), "operationName": "IntrospectionQuery", "variables": {}, } result = _post_json(endpoint_url, payload, headers=headers, timeout_s=timeout_s) if result.get("errors"): raise RuntimeError(f"Introspection failed: {result['errors']}") data = result.get("data") if not data: raise RuntimeError("Introspection response missing 'data'.") schema = build_client_schema(data) return print_schema(schema) def _parse_signature(signature: str) -> tuple[str, str, list[tuple[str, str]], str]: left, _, return_type = signature.partition(" -> ") args: list[tuple[str, str]] = [] if "(" in left and left.endswith(")"): base, args_str = left[:-1].split("(", 1) for part in args_str.split(", "): if not part: continue name, _, type_str = part.partition(": ") if name and type_str: args.append((name, type_str)) else: base = left type_name, _, field_name = base.partition(".") return type_name, field_name, args, return_type def _base_type(type_str: str) -> str: base = type_str.strip() while True: base = base.rstrip("!") if base.startswith("[") and base.endswith("]"): base = base[1:-1].strip() continue return base.rstrip("!") def _tokenize(text: str) -> list[str]: tokens = [] current = [] for ch in text.lower(): if ch.isalnum(): current.append(ch) else: if current: token = "".join(current) if token: tokens.append(token) current = [] if current: token = "".join(current) if token: tokens.append(token) return tokens def _token_score(tokens: list[str], *values: str) -> int: score = 0 haystack = " ".join(values).lower() for token in tokens: if token and token in haystack: score += 1 return score def _is_aggregate_query(query: str) -> bool: """Check if the query is asking for aggregate/count operations.""" query_lower = query.lower() return any(kw in query_lower for kw in _AGGREGATE_KEYWORDS) def _is_aggregate_field(field_name: str) -> bool: """Check if a field name looks like an aggregate operation.""" field_lower = field_name.lower() return any(pattern in field_lower for pattern in _AGGREGATE_FIELD_PATTERNS) def _is_connection_field(field_name: str) -> bool: """Check if a field name is a Connection (cursor-based pagination) field.""" return field_name.lower().endswith("connection") def _parse_field_info(meta: dict) -> dict[str, list[dict]]: fields_by_type: dict[str, list[dict]] = {} for item in meta.get("items", []): summary = item.get("summary", "") signature = summary.split(" | ", 1)[0] type_name, field_name, args, return_type = _parse_signature(signature) if not type_name or not field_name or not return_type: continue info = { "type_name": type_name, "field_name": field_name, "args": args, "return_type": return_type, "summary": summary, } fields_by_type.setdefault(type_name, []).append(info) return fields_by_type def _format_args(args: list[tuple[str, str]]) -> str: if not args: return "" rendered = ", ".join(f"{name}: <{arg_type}>" for name, arg_type in args) return f"({rendered})" def _render_selection_set( type_name: str, fields_by_type: dict[str, list[dict]], tokens: list[str], depth: int = 1, max_fields: int = 6, ) -> str | None: fields = list(fields_by_type.get(type_name, [])) if not fields: return None def rank(field: dict) -> tuple[int, int, str]: base = _token_score(tokens, field["field_name"], field.get("summary", "")) if field["field_name"] in {"id", "name"}: base += 2 return_type = field.get("return_type", "") if _base_type(return_type) in _SCALAR_TYPES: return (base + 1, 1, field["field_name"]) return (base, 0, field["field_name"]) fields.sort(key=rank, reverse=True) selections: list[str] = [] for field in fields: if len(selections) >= max_fields: break return_type = field.get("return_type", "") base_type = _base_type(return_type) if base_type in _SCALAR_TYPES: selections.append(field["field_name"]) continue if depth <= 0: continue nested = _render_selection_set( base_type, fields_by_type, tokens, depth=depth - 1, max_fields=max(2, max_fields // 2), ) if nested: selections.append(f"{field['field_name']} {nested}") if not selections: return None return "{ " + " ".join(selections) + " }" def ensure_schema_indexed(*, force: bool = False) -> dict: try: with _INDEX_LOCK: if ENDPOINT_URL: if not SCHEMA_TEXT: raise RuntimeError("Endpoint mode requires schema introspection text.") logger.info("Indexing schema from endpoint %s...", ENDPOINT_URL) meta = ensure_index_text( SCHEMA_TEXT, schema_source=SCHEMA_SOURCE, data_dir=DATA_DIR, embed_model=EMBED_MODEL, embedder=embedder, store=store, force=force, ) if meta.get("indexed"): logger.info("Indexed %s fields from endpoint schema.", meta.get("count", 0)) return meta logger.info("Indexing schema from file %s...", SCHEMA_PATH) meta = ensure_index( schema_path=SCHEMA_PATH, data_dir=DATA_DIR, embed_model=EMBED_MODEL, embedder=embedder, store=store, force=force, ) if meta.get("indexed"): logger.info("Indexed %s fields from schema %s.", meta.get("count", 0), SCHEMA_PATH) return meta except Exception as exc: raise RuntimeError(f"Schema index not available for {SCHEMA_PATH}: {exc}") @mcp.tool() def list_types(query: str, limit: int = 20) -> list: """ Fuzzy search the schema for matching type.field signatures. Uses the persisted embedding index (auto-builds if missing/outdated). """ meta = ensure_schema_indexed(force=False) fields_by_type = _parse_field_info(meta) tokens = _tokenize(query) is_aggregate = _is_aggregate_query(query) capped_limit = max(1, min(limit, 20)) query_vec = embedder.embed_one(query) results = store.search(query_vec, limit=capped_limit) def sort_key(item: dict) -> tuple: """ Sort results with smart prioritization: - Query fields first - For aggregate queries: count/aggregate fields first - Then by embedding similarity score """ field_name = item.get("field", "") is_query_type = item.get("type") == "Query" is_agg_field = _is_aggregate_field(field_name) is_conn_field = _is_connection_field(field_name) score = item.get("score", 0.0) if is_aggregate: # For aggregate queries: prioritize count fields, then connections return ( not is_query_type, # Query type first not is_agg_field, # Aggregate fields first not is_conn_field, # Connection fields second -score, # Then by score ) else: # For non-aggregate queries: standard ordering return ( not is_query_type, -score, ) results.sort(key=sort_key) formatted = [] for item in results: summary = item.get("summary", "") signature = summary.split(" | ", 1)[0] type_name, field_name, args, return_type = _parse_signature(signature) entry = { "type": item.get("type"), "field": item.get("field"), "summary": summary, } if type_name == "Query": selection = None base_return = _base_type(return_type) # For Connection types, provide a complete pagination template if _is_connection_field(field_name): selection = _render_selection_set( base_return, fields_by_type, tokens, depth=2, max_fields=8, ) selection_part = f" {selection}" if selection else "" entry["query_template"] = f"query {{ {field_name}{_format_args(args)}{selection_part} }}" elif _is_aggregate_field(field_name): # Count fields return scalars, no selection needed entry["query_template"] = f"query {{ {field_name}{_format_args(args)} }}" elif base_return not in _SCALAR_TYPES: selection = _render_selection_set( base_return, fields_by_type, tokens, depth=2, max_fields=6, ) selection_part = f" {selection}" if selection else "" entry["query_template"] = f"query {{ {field_name}{_format_args(args)}{selection_part} }}" else: entry["query_template"] = f"query {{ {field_name}{_format_args(args)} }}" elif _base_type(return_type) not in _SCALAR_TYPES: selection = _render_selection_set( _base_type(return_type), fields_by_type, tokens, depth=1, max_fields=5, ) if selection: entry["selection_hint"] = f"{field_name} {selection}" formatted.append(entry) return formatted @mcp.tool() def run_query(query: str) -> dict: """ Validate and run a GraphQL query against the static schema. Note: No resolvers are provided, so fields resolve to null; this is mainly for validation and shape checking. """ if ENDPOINT_URL: try: payload = {"query": query} result = _post_json(ENDPOINT_URL, payload, headers=_REMOTE_HEADERS, timeout_s=_REMOTE_TIMEOUT_S) except Exception as exc: raise RuntimeError(f"Endpoint query failed: {exc}") output: dict = {"valid": not bool(result.get("errors"))} if "errors" in result: output["errors"] = result["errors"] if "data" in result: output["data"] = result["data"] if "extensions" in result: output["extensions"] = result["extensions"] return output schema = build_schema(SCHEMA_PATH.read_text()) result = graphql_sync(schema, query) output = {"valid": not bool(result.errors)} if result.errors: output["errors"] = [str(err) for err in result.errors] if result.data is not None: output["data"] = result.data return output if __name__ == "__main__": import argparse parser = argparse.ArgumentParser( description="Run the GraphQL embedder MCP server." ) parser.add_argument( "--transport", choices=["stdio", "sse", "streamable-http"], default=DEFAULT_TRANSPORT, help="MCP transport to run (default: sse; override with --transport or MCP_TRANSPORT env).", ) source_group = parser.add_mutually_exclusive_group() source_group.add_argument( "--schema", type=Path, default=SCHEMA_PATH, help="Path to a GraphQL schema file (SDL).", ) source_group.add_argument( "--endpoint", default=ENDPOINT_URL, help="GraphQL endpoint URL (uses introspection for indexing and proxies queries).", ) parser.add_argument( "--data-dir", type=Path, default=DATA_DIR, help="Directory for the persisted embedding index (default: data/ next to this server).", ) parser.add_argument( "--model", default=EMBED_MODEL, help="Embedding model to use for indexing/search queries.", ) parser.add_argument( "--header", action="append", default=[], help="Add an HTTP header for endpoint mode, like 'Authorization: Bearer ...' (repeatable).", ) parser.add_argument( "--timeout", type=float, default=30.0, help="HTTP timeout (seconds) for endpoint introspection/querying.", ) parser.add_argument( "--host", default=mcp.settings.host, help="Host for SSE/HTTP transports (default: 127.0.0.1).", ) parser.add_argument( "--port", type=int, default=mcp.settings.port, help="Port for SSE/HTTP transports (default: 8000).", ) parser.add_argument( "--log-level", default=mcp.settings.log_level, help="Log level (DEBUG, INFO, WARNING, ERROR).", ) parser.add_argument( "--mount-path", default=mcp.settings.mount_path, help="Mount path for SSE transport (default: /).", ) args = parser.parse_args() logging.basicConfig(level=getattr(logging, str(args.log_level).upper(), logging.INFO)) _REMOTE_HEADERS = _load_endpoint_headers_from_env() _REMOTE_HEADERS.update(_parse_headers(args.header)) _REMOTE_TIMEOUT_S = float(args.timeout) endpoint_url = args.endpoint or os.environ.get("GRAPHQL_ENDPOINT_URL") if endpoint_url is not None: endpoint_url = endpoint_url.strip() if endpoint_url: try: schema_text = _introspect_schema_sdl( endpoint_url, headers=_REMOTE_HEADERS, timeout_s=_REMOTE_TIMEOUT_S ) except Exception as exc: raise SystemExit( "Failed to introspect endpoint for schema indexing. " "Check GRAPHQL_ENDPOINT_URL and optional GRAPHQL_ENDPOINT_HEADERS.\n" f"Error: {exc}" ) from exc configure_runtime_endpoint( endpoint_url=endpoint_url, data_dir=args.data_dir, embed_model=args.model, schema_text=schema_text, schema_source={"kind": "endpoint", "url": endpoint_url, "headers": sorted(_REMOTE_HEADERS.keys())}, ) else: if not args.schema.exists(): checked = ", ".join(str(path) for path in _ENV_PATHS) raise SystemExit( "Schema file not found and GRAPHQL_ENDPOINT_URL not set. " "Provide --schema or set GRAPHQL_SCHEMA_PATH, or set GRAPHQL_ENDPOINT_URL " f"in one of: {checked}" ) configure_runtime(schema_path=args.schema, data_dir=args.data_dir, embed_model=args.model) mcp.settings.host = args.host mcp.settings.port = args.port mcp.settings.log_level = args.log_level mcp.settings.mount_path = args.mount_path print( f"Starting {APP_NAME} with transport={args.transport}, " f"host={mcp.settings.host}, port={mcp.settings.port}, " f"schema={SCHEMA_PATH}", flush=True, ) threading.Thread( target=lambda: _run_indexing_or_exit(), daemon=True, name="graphql-mcp-indexer", ).start() mcp.run(transport=args.transport, mount_path=args.mount_path)

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/ThoreKoritzius/graphql-mcp-server'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

server.py•22.2 KiB