Custom MCP Server on Databricks Apps

mcp-mmolony-waf
src
custom_server

app.py•14.7 kB

from pathlib import Path from mcp.server.fastmcp import FastMCP from fastapi import FastAPI from fastapi.responses import FileResponse from databricks.sdk.core import Config from .prompts import load_prompts from .services.sql_service import get_sql_service, QueryFormatter from .services.query_repository import get_query_repository from .services.waf_hierarchy_service import get_waf_hierarchy_service import os from dotenv import load_dotenv from fastapi import Header from typing import Optional from pydantic import Field # Load environment variables from .env file load_dotenv() cfg = Config() user_token = Header(None, alias="X-Forwarded-Access-Token") # Initialize services sql_service = get_sql_service() query_repo = get_query_repository() waf_service = get_waf_hierarchy_service() STATIC_DIR = Path(__file__).parent / "static" # Create an MCP server mcp = FastMCP("Custom MCP Server on Databricks Apps for creating") # Load prompts and tools load_prompts(mcp) # WAF (Well-Architected Framework) Tools @mcp.tool() def get_waf_pillar(pillar_id: str) -> str: """ Get information about a specific WAF pillar by ID. Args: pillar_id: The WAF pillar ID (e.g., 'DG', 'CO', 'RE', 'SE', 'PE', 'SU', 'IU', 'OE') Returns: Pillar information with associated principles and measures count. """ pillar = waf_service.get_pillar(pillar_id) if not pillar: available_pillars = [p.pillar_id for p in waf_service.get_all_pillars()] return f"WAF pillar '{pillar_id}' not found. Available pillar IDs: {', '.join(available_pillars)}" principles = waf_service.get_principles_by_pillar(pillar_id) measures = waf_service.get_measures_by_pillar(pillar_id) result = f"**WAF Pillar: {pillar.pillar_id}**\n" result += f"**Name:** {pillar.pillar_name}\n\n" result += f"**Principles:** {len(principles)}\n" result += f"**Measures:** {len(measures)}\n\n" if principles: result += "**Principles in this pillar:**\n" for principle in principles: principle_measures = waf_service.get_measures_by_principle(principle.principle_id) result += f"- **{principle.principle_id}**: {principle.principle_description} ({len(principle_measures)} measures)\n" result += f"\nUse `get_waf_principle(principle_id)` to explore specific principles." return result @mcp.tool() def get_waf_principle(principle_id: str) -> str: """ Get information about a specific WAF principle by ID. Args: principle_id: The WAF principle ID (e.g., 'DG-01', 'CO-01', 'RE-01') Returns: Principle information with associated measures. """ principle = waf_service.get_principle(principle_id) if not principle: return f"WAF principle '{principle_id}' not found. Use `list_waf_principles()` to see all available principles." measures = waf_service.get_measures_by_principle(principle_id) result = f"**WAF Principle: {principle.principle_id}**\n" result += f"**Pillar:** {principle.pillar_name}\n" result += f"**Description:** {principle.principle_description}\n\n" result += f"**Measures:** {len(measures)}\n\n" if measures: result += "**Measures in this principle:**\n" for measure in measures: result += f"- **{measure.measure_id}**: {measure.best_practice}\n" if measure.databricks_capabilities: result += f" *Capabilities: {measure.databricks_capabilities}*\n" result += f"\nUse `get_waf_measure(measure_id)` to get detailed information about any measure." return result @mcp.tool() def get_waf_measure(measure_id: str) -> str: """ Get detailed information about a specific WAF measure by ID. Args: measure_id: The WAF measure ID (e.g., 'DG-01-01', 'CO-01-01') Returns: Complete measure details including best practices, Databricks capabilities, and implementation guidance. """ measure = waf_service.get_measure(measure_id) if not measure: return f"WAF measure '{measure_id}' not found. Use `search_waf_measures(search_term)` to find relevant measures." # Get the principle for context principle = waf_service.get_principle(measure.principle_id) principle_desc = principle.principle_description if principle else "Unknown" result = f"**WAF Measure: {measure.measure_id}**\n\n" result += f"**Pillar:** {measure.pillar_id}\n" result += f"**Principle:** {measure.principle_id} - {principle_desc}\n" result += f"**Best Practice:** {measure.best_practice}\n\n" if measure.databricks_capabilities: result += f"**Databricks Capabilities:** {measure.databricks_capabilities}\n\n" result += f"**Implementation Details:**\n{measure.details}" return result @mcp.tool() def list_waf_pillars() -> str: """ List all WAF pillars with their principles and measures count. Returns: A comprehensive overview of all WAF pillars. """ pillars = waf_service.get_all_pillars() stats = waf_service.get_stats() result = "**Databricks Well-Architected Framework Pillars:**\n\n" for pillar in pillars: principles = waf_service.get_principles_by_pillar(pillar.pillar_id) measures = waf_service.get_measures_by_pillar(pillar.pillar_id) result += f"**{pillar.pillar_id}** - {pillar.pillar_name}\n" result += f" - {len(principles)} principles, {len(measures)} measures\n\n" result += f"**Total:** {stats['total_pillars']} pillars, {stats['total_principles']} principles, {stats['total_measures']} measures\n\n" result += "Use `get_waf_pillar(pillar_id)` to explore any pillar in detail." return result @mcp.tool() def list_waf_principles() -> str: """ List all WAF principles organized by pillar. Returns: A comprehensive list of all WAF principles grouped by pillar. """ pillars = waf_service.get_all_pillars() result = "**WAF Principles by Pillar:**\n\n" for pillar in pillars: principles = waf_service.get_principles_by_pillar(pillar.pillar_id) result += f"**{pillar.pillar_name}:**\n" for principle in principles: measures = waf_service.get_measures_by_principle(principle.principle_id) result += f" - **{principle.principle_id}**: {principle.principle_description} ({len(measures)} measures)\n" result += "\n" result += "Use `get_waf_principle(principle_id)` to explore any principle in detail." return result @mcp.tool() def search_waf_measures(search_term: str) -> str: """ Search for WAF measures containing the specified term. Args: search_term: The term to search for (searches in measure ID, best practice, capabilities, and details) Returns: A list of matching WAF measures with their key information. """ matches = waf_service.search_measures(search_term) if not matches: return f"No WAF measures found containing '{search_term}'. Use `list_waf_pillars()` to explore available content." result = f"**WAF Measures matching '{search_term}' ({len(matches)} found):**\n\n" for measure in matches[:15]: # Limit to first 15 results result += f"**{measure.measure_id}** - {measure.best_practice}\n" if measure.databricks_capabilities: result += f" *Capabilities: {measure.databricks_capabilities}*\n" result += "\n" if len(matches) > 15: result += f"... and {len(matches) - 15} more results.\n\n" result += "Use `get_waf_measure(measure_id)` for complete details on any measure." return result @mcp.tool() def COST_OPTIMISATION_C0_01_01_TABLE_TYPES() -> str: """ CO-01-01 | Use Performance-Optimised Data Formats - Analyzes table formats in workspace to identify cost optimization opportunities """ query = query_repo.get_query("CO-01-01-table-formats") return sql_service.execute_query_with_formatting(query, QueryFormatter.format_table_formats) @mcp.tool() def COST_OPTIMISATION_C0_01_01_MANAGED_TABLES() -> str: """ CO-01-01 | Use Performance-Optimised Data Formats - Analyzes table types in workspace to identify cost optimization opportunities from managed tables, showing the percentage distribution of table types across your data estate """ query = query_repo.get_query("CO-01-01-managed-tables") return sql_service.execute_query_with_formatting(query, QueryFormatter.format_table_types_distribution) @mcp.tool() def COST_OPTIMISATION_C0_01_02_JOBS_ON_ALL_PURPOSE_CLUSTERS() -> str: """ CO-01-02 | Use Job Clusters for Non-Interactive Workloads - Analyse jobs running on all purpose clusters to identify cost optimization opportunities by switching to dedicated clusters compute """ query = query_repo.get_query("CO-01-02") return sql_service.execute_query_with_formatting(query, QueryFormatter.format_jobs_on_all_purpose_clusters) # @mcp.tool() # def COST_OPTIMISATION_CO_01_03_SQL_VS_ALLPURPOSE() -> str: # """ # CO-01-03 | Use SQL Compute for SQL Workloads - Compares SQL vs All Purpose compute usage to identify cost optimization opportunities # """ # query = query_repo.get_query("CO-01-03") # return sql_service.execute_query_with_formatting(query, QueryFormatter.format_sql_vs_all_purpose) # @mcp.tool() # def COST_OPTIMISATION_CO_01_03_SQL_ON_ALLPURPOSE() -> str: # """ # CO-01-03 | Use SQL Compute for SQL Workloads - Shows SQL workloads running on All Purpose clusters (Coming Soon) # """ # return "Coming Soon... - SQL workloads running on All Purpose clusters analysis will be available in a future update" @mcp.tool() def COST_OPTIMISATION_CO_01_04_LATEST_DBR() -> str: """ CO-01-04 | Use Latest Databricks Runtime - Analyzes DBR versions across clusters to identify upgrade opportunities """ query = query_repo.get_query("CO-01-04") return sql_service.execute_query_with_formatting(query, QueryFormatter.format_dbr_versions) # @mcp.tool() # def COST_OPTIMISATION_CO_01_05_GPU() -> str: # """ # CO-01-05 | Optimize GPU Usage - Analyzes GPU usage patterns (Coming Soon) # """ # return "Coming Soon... - GPU usage optimization analysis will be available in a future update" @mcp.tool() def COST_OPTIMISATION_CO_01_06_SERVERLESS() -> str: """ CO-01-06 | Use Serverless Compute - Shows percentage of serverless compute usage vs total compute """ query = query_repo.get_query("CO-01-06-serverless") return sql_service.execute_query_with_formatting(query, QueryFormatter.format_serverless_percentage) @mcp.tool() def COST_OPTIMISATION_CO_01_06_SERVERLESS_SQL() -> str: """ CO-01-06 | Use Serverless Compute - Compares SQL Serverless vs Classic SQL compute costs """ query = query_repo.get_query("CO-01-06-sql") return sql_service.execute_query_with_formatting(query, QueryFormatter.format_sql_compute_costs) # @mcp.tool() # def COST_OPTIMISATION_CO_01_07_INSTANCE_TYPE() -> str: # """ # CO-01-07 | Optimize Instance Types - Analyzes instance type usage patterns (Coming Soon) # """ # return "Coming Soon... - Instance type optimization analysis will be available in a future update" # @mcp.tool() # def COST_OPTIMISATION_CO_01_08_CLUSTER_SIZE() -> str: # """ # CO-01-08 | Right-size Clusters - Analyzes cluster sizing patterns (Coming Soon) # """ # return "Coming Soon... - Cluster sizing analysis will be available in a future update" @mcp.tool() def COST_OPTIMISATION_CO_01_08_CLUSTER_UTILISATION() -> str: """ CO-01-08 | Right-size Clusters - Analyzes cluster utilization patterns to identify optimization opportunities """ query = query_repo.get_query("CO-01-08") return sql_service.execute_query_with_formatting(query, QueryFormatter.format_cluster_utilization) # @mcp.tool() # def COST_OPTIMISATION_CO_01_09_PHOTON() -> str: # """ # CO-01-09 | Use Photon for SQL Workloads - Analyzes Photon usage patterns (Coming Soon) # """ # return "Coming Soon... - Photon usage analysis will be available in a future update" @mcp.tool() def COST_OPTIMISATION_CO_02_01_AUTO_SCALING() -> str: """ CO-02-01 | Enable Autoscaling - Shows percentage of clusters with autoscaling enabled """ query = query_repo.get_query("CO-02-01") return sql_service.execute_query_with_formatting(query, QueryFormatter.format_autoscaling_percentage) @mcp.tool() def COST_OPTIMISATION_CO_02_02_AUTO_TERMINATION() -> str: """ CO-02-02 | Configure Auto-termination - Analyzes auto-termination settings across clusters """ query = query_repo.get_query("CO-02-02") return sql_service.execute_query_with_formatting(query, QueryFormatter.format_auto_termination_analysis) # @mcp.tool() # def COST_OPTIMISATION_CO_02_03_CLUSTER_POLICIES() -> str: # """ # CO-02-03 | Use Cluster Policies - Analyzes cluster policy usage patterns (Coming Soon) # """ # return "Coming Soon... - Cluster policy usage analysis will be available in a future update" @mcp.tool() def COST_OPTIMISATION_CO_03_01_BILLING_TABLES() -> str: """ CO-03-01 | Monitor Billing Tables Usage - Shows how frequently billing tables are accessed """ query = query_repo.get_query("CO-03-01") return sql_service.execute_query_with_formatting(query, QueryFormatter.format_billing_table_access) @mcp.tool() def COST_OPTIMISATION_CO_03_02_TAGGING_COMPUTE() -> str: """ CO-03-02 | Use Tags for Cost Allocation - Analyzes tagging patterns on compute resources """ query = query_repo.get_query("CO-03-02-tagging") return sql_service.execute_query_with_formatting(query, QueryFormatter.format_cluster_tagging_distribution) @mcp.tool() def COST_OPTIMISATION_CO_03_02_POPULAR_TAGS() -> str: """ CO-03-02 | Use Tags for Cost Allocation - Shows most popular tags used across clusters """ query = query_repo.get_query("CO-03-02-popular") return sql_service.execute_query_with_formatting(query, QueryFormatter.format_popular_tags) mcp_app = mcp.streamable_http_app() app = FastAPI( lifespan=lambda _: mcp.session_manager.run(), ) @app.get("/", include_in_schema=False) async def serve_index(): return FileResponse(STATIC_DIR / "index.html") app.mount("/", mcp_app) if __name__ == "__main__": import uvicorn uvicorn.run( "custom_server.app:app", host="0.0.0.0", port=8000, reload=True )

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/db-mattmolony/mcp-mmolony-waf'

If you have feedback or need assistance with the MCP directory API, please join our Discord server