Genkit MCP

Official

Overview Schema Related Servers Score Discussions

overview.md•8.99 KiB

# Architecture Overview ## System overview The sample runs two parallel servers — REST and gRPC — that both delegate to the same Genkit flows. A shared middleware stack handles security, rate limiting, and observability. ```mermaid graph TB subgraph CLI["python -m src"] CONFIG["config.py Settings + CLI args"] MAIN["main.py Entry point"] CONFIG --> MAIN subgraph REST["REST (ASGI) :8080"] direction TB FW_SELECT{"--framework"} FASTAPI["FastAPI (default)"] LITESTAR["Litestar"] QUART["Quart"] FW_SELECT --> FASTAPI FW_SELECT --> LITESTAR FW_SELECT --> QUART SRV_SELECT{"--server"} GRANIAN["granian (Rust)"] UVICORN["uvicorn"] HYPERCORN["hypercorn"] SRV_SELECT --> GRANIAN SRV_SELECT --> UVICORN SRV_SELECT --> HYPERCORN end subgraph GRPC["gRPC :50051"] SERVICER["GenkitServiceServicer"] REFLECT["Reflection (grpcui / grpcurl)"] end MAIN --> REST MAIN --> GRPC end subgraph FLOWS["Genkit Flows (flows.py)"] JOKE["tell_joke"] TRANSLATE["translate_text"] IMAGE["describe_image"] CHAR["generate_character"] CHAT["pirate_chat"] STORY["tell_story"] CODE["generate_code"] REVIEW["review_code"] end REST --> FLOWS GRPC --> FLOWS subgraph GENKIT["Genkit Runtime"] AI["ai = Genkit(...)"] PLUGINS["Plugin loading"] TELEMETRY_DETECT["Platform telemetry auto-detection"] end FLOWS --> GENKIT GEMINI["Gemini API (Google AI / Vertex AI)"] GENKIT --> GEMINI ``` ### ASCII variant ``` ┌─────────────────────────────────────────────────────────────────────┐ │ python -m src │ │ │ │ ┌─────────────┐ ┌───────────────────────────────────────────┐ │ │ │ CLI + Config│──▶│ main.py (entry point) │ │ │ │ config.py │ │ │ │ │ └─────────────┘ │ _create_app() _serve_both() │ │ │ │ │ │ │ │ │ │ └────────┼───────────────────┼────┼──────────┘ │ │ ▼ ▼ ▼ │ │ ┌──────────── REST (ASGI) ──────────┐ ┌──── gRPC ────────────┐ │ │ │ │ │ │ │ │ │ --framework selects one: │ │ grpc_server.py │ │ │ │ ┌───────────┐ ┌──────────┐ │ │ GenkitServiceServicer│ │ │ │ │ FastAPI │ │ Litestar │ │ │ grpc.aio.server() │ │ │ │ │ (default) │ │ │ │ │ │ │ │ │ └─────┬─────┘ └────┬─────┘ │ │ Reflection enabled │ │ │ │ │ ┌────────┘ │ │ (grpcui / grpcurl) │ │ │ │ │ │ ┌──────────┐ │ │ │ │ │ │ │ │ │ Quart │ │ └───────────┬───────────┘ │ │ │ │ │ └────┬─────┘ │ │ │ │ │ └────┴───────┘ │ │ │ │ │ │ │ │ │ │ │ --server selects one: │ │ │ │ │ granian (Rust) │ uvicorn │ hyper │ │ │ │ │ :8080 │ │ :50051 │ │ └───────────────┬───────────────────┘ │ │ │ │ │ │ │ ▼ ▼ │ │ ┌──────────────────────────────────────────────────────────────┐ │ │ │ Genkit flows (flows.py) │ │ │ │ │ │ │ │ tell_joke translate_text describe_image generate_character│ │ │ │ pirate_chat tell_story generate_code review_code │ │ │ │ │ │ │ │ Shared: @ai.flow() + @ai.tool() + Pydantic schemas │ │ │ └──────────────────────────┬───────────────────────────────────┘ │ │ │ │ │ ┌──────────────────────────┼───────────────────────────────────┐ │ │ │ Genkit runtime (ai = Genkit(...)) │ │ │ │ app_init.py — singleton, plugin loading, telemetry detect │ │ │ └──────────────────────────┬───────────────────────────────────┘ │ │ │ │ └─────────────────────────────┼───────────────────────────────────────┘ │ ▼ ┌──────────────────────────┐ │ Gemini API │ │ (Google AI / Vertex AI) │ └──────────────────────────┘ ``` ## Middleware stack Every HTTP request passes through a layered middleware stack before reaching a framework route handler. The gRPC server applies equivalent interceptors. ```mermaid graph LR REQ["Incoming Request"] --> RID["RequestIdMiddleware X-Request-ID"] RID --> SEC["SecurityHeadersMiddleware OWASP headers"] SEC --> BODY["MaxBodySizeMiddleware 413 if too large"] BODY --> RL["RateLimitMiddleware 429 if over limit"] RL --> CORS["CORSMiddleware Cross-origin policy"] CORS --> TRUST["TrustedHostMiddleware Host header check"] TRUST --> FW["Framework Route Handler"] FW --> FLOW["Genkit Flow"] ``` ### gRPC interceptor chain ``` gRPC Request │ ▼ ┌──────────────────────────┐ │ GrpcLoggingInterceptor │ Log method, duration, status ├──────────────────────────┤ │ GrpcRateLimitInterceptor│ Token bucket per peer IP ├──────────────────────────┤ │ Max message size (1 MB) │ grpc.max_receive_message_length └──────────┬───────────────┘ │ ▼ GenkitServiceServicer (delegates to Genkit flow) ``` ## Key design decisions | Decision | Choice | Rationale | |----------|--------|-----------| | Framework pattern | Factory function `create_app(ai)` | Swap frameworks without touching flows | | Server pattern | `asyncio.gather(rest, grpc)` | Both servers share one event loop | | Config precedence | CLI > env > dotenv > defaults | Standard 12-factor app layering | | Middleware approach | Pure ASGI (no framework deps) | Works identically across FastAPI, Litestar, Quart | | gRPC mapping | 1:1 with REST endpoints | Same Genkit flows serve both protocols | | Telemetry | Auto-detect cloud platform | Zero-config for GCP, AWS, Azure |

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/firebase/genkit'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

overview.md•8.99 KiB