The MCP Datadog Server is a comprehensive Model Context Protocol (MCP) compatible server that provides LLMs with 351 tools for complete Datadog integration through schema auto-discovery and validation.
Core Capabilities:
Full CRUD Operations: Create, read, update, delete, and list all Datadog resources including monitors, dashboards, downtimes, users, teams, and organizations
Data Analytics & Aggregation: Process and aggregate data from CI pipelines, logs, RUM events, spans, network connections, and DNS traffic
Infrastructure Monitoring: Configure diverse monitor types (metric, logs, APM, synthetics, SLO, audit, database, network performance, cost) with automated alerting
Cloud Integrations: Manage AWS, Azure, GCP integrations plus third-party services like Slack, PagerDuty, Opsgenie, Microsoft Teams, Cloudflare, and Okta
Security & Compliance: Handle WAF rules, workload protection policies, agentless AWS scanning, and resource restriction policies
Log Management: Configure archives, pipelines, indexes, custom destinations, and log-based metrics
User Administration: Manage users, roles, permissions, authentication mappings, API keys, and child organizations
Incident Management: Handle cases, priorities, status updates, on-call schedules, and escalation policies
Performance Monitoring: Create span-based metrics, retention filters, RUM applications, and DORA metrics
Advanced Features:
LLM-Native Design: Automatic tool discovery with JSON schemas, type safety, and robust validation
Smart Filtering: Categorize tools by service type to reduce complexity
Real-time Tracking: Monitor long-running operations with progress updates
CLI Interface: Comprehensive command-line tools for management, debugging, and troubleshooting
Error Handling: Automatic retry mechanisms with configurable timeout and retry settings
Provides comprehensive tools for interacting with Datadog's API, enabling management of monitors, logs, metrics, dashboards, and incidents. Supports creating and updating monitors, sending logs, submitting metrics, querying timeseries data, and performing analytics operations.
MCP Datadog Server
Servidor MCP (Model Context Protocol) completo e robusto para integração com APIs do Datadog
Um servidor MCP de produção que oferece 351 tools para interagir com todas as APIs do Datadog através de LLMs, incluindo operações CRUD completas, tools curadas e ferramentas geradas automaticamente do schema.
🚀 Características Principais
📊 Tools Disponíveis (351 total)
9 Tools Curadas 🎯 - Handcrafted, otimizadas para casos específicos
25 Tools CRUD ⚡ - Operações CREATE, READ, UPDATE, DELETE para recursos principais
319 Tools Geradas 🔧 - Geradas automaticamente do schema oficial do Datadog
🔍 Recursos Avançados
✅ Autodescoberta de Schema - LLMs descobrem parâmetros automaticamente
✅ Validação Robusta - Zod schemas com validação completa
✅ Progress Tracking - Acompanhamento em tempo real para operações longas
✅ Error Handling - Tratamento inteligente de erros e retry automático
✅ CLI Rica - Interface completa para gestão e debugging
🛡️ Conformidade MCP
✅ 100% Compatível com TypeScript SDK oficial
✅ JSON Schema completo para todas as tools
✅ Metadata Annotations detalhadas
✅ Type Safety com validação Zod
📦 Instalação
Requisitos
Node.js 18+
Chaves de API do Datadog (API Key + Application Key)
Instalação via npm
Instalação Local
⚙️ Configuração
1. Variáveis de Ambiente
Obrigatórias
Opcionais
2. Arquivo .env (Recomendado)
3. Sites Datadog Suportados
datadoghq.com
(US1)datadoghq.eu
(EU)us3.datadoghq.com
(US3)us5.datadoghq.com
(US5)ap1.datadoghq.com
(AP1)ddog-gov.com
(US Gov)
🎮 Uso
Servidor MCP (Padrão)
Interface CLI
Listar Tools
Inspeção de Tools
Validação e Análise
🔧 Tools CRUD Disponíveis
⚡ Monitors (5 operações)
📊 Dashboards (5 operações)
⏰ Downtimes (5 operações)
👥 Users (5 operações)
🏗️ Teams (5 operações)
📋 Como o LLM Descobre os Parâmetros
🔍 Autodescoberta Automática
O LLM NÃO precisa saber os parâmetros antecipadamente. Através do protocolo MCP, ele:
Lista todas as tools disponíveis
Obtém o schema JSON Schema completo de cada tool
Entende todos os parâmetros, tipos e validações
Constrói chamadas válidas automaticamente
📄 Schema Exemplo - create_monitor
🎯 Exemplo de Uso pelo LLM
Input do usuário:
"Create a monitor to alert when CPU usage is above 90%"
Chamada automática do LLM:
O LLM automaticamente:
✅ Descobriu todos os parâmetros disponíveis
✅ Preencheu campos obrigatórios (name, type, query)
✅ Adicionou campos opcionais relevantes
✅ Estruturou objetos complexos (options.thresholds)
✅ Validou tipos e constraints
🎯 Tools Curadas Especiais
🎯 Dashboards
🎯 Logs
🎯 Metrics
🎯 Incidents
🎯 Synthetics
🏗️ Integração com LLMs
Claude Desktop (Recomendado)
Adicione ao arquivo de configuração do Claude:
Via npx (Global)
Local Development
🛠️ Desenvolvimento
Scripts Disponíveis
Makefile
Estrutura do Projeto
🔍 Debugging e Troubleshooting
Verificar Tools Carregadas
Validar Configuração
Testar Conectividade
Logs e Debugging
🚨 Solução de Problemas Comuns
1. "Tool não encontrada"
2. "API Key inválida"
3. "Schema não carregado"
4. "Muitas tools carregadas"
📈 Performance e Limites
Rate Limiting
✅ Automático - Respeita headers
retry-after
✅ Configurável - Ajuste via
MCP_DD_MAX_RETRIES
✅ Inteligente - Backoff exponencial
Timeouts
✅ Padrão: 30 segundos por requisição
✅ Configurável via
MCP_DD_TIMEOUT_MS
✅ Progress Tracking para operações longas
Memory Usage
✅ Otimizado - Schema carregado uma vez na inicialização
✅ Streaming - Não mantém responses grandes em memória
✅ Filtros - Use
MCP_DD_FOLDERS
para reduzir footprint
🔐 Segurança
Credentials
✅ Environment Only - Chaves apenas via variáveis de ambiente
✅ No Logging - Credentials nunca aparecem em logs
✅ Validation - Formato das chaves validado na inicialização
Network
✅ TLS Only - Todas as chamadas via HTTPS
✅ Corporate Proxy - Suporte via
NODE_EXTRA_CA_CERTS
✅ Headers Security - User-Agent e headers apropriados
Input Validation
✅ Zod Schemas - Validação rigorosa de entrada
✅ Sanitization - Limpeza automática de inputs
✅ Type Safety - TypeScript + runtime validation
📊 Monitoramento
Health Checks
Metrics Disponíveis
✅ Tools Count - Total de tools carregadas
✅ API Calls - Tracking de chamadas por tool
✅ Error Rate - Rate de erros por categoria
✅ Response Time - Tempos de resposta médios
🎓 Exemplos Práticos
Criar Monitor de CPU
O LLM pode automaticamente executar:
Listar Dashboards Filtrados
Criar Downtime para Manutenção
📚 Documentação Adicional
🔍 SCHEMA_DISCOVERY.md - Como o LLM descobre parâmetros
📋 REFACTOR_CHECKPOINT.md - Histórico da refatoração
⚙️ TOOLS.md - Documentação completa das tools
🤝 Contribuição
Reportar Bugs
Adicionar Tools Curadas
Edite
src/tools/curated-tools.js
Adicione schema Zod completo
Implemente função
execute
Teste com
npm test
Melhorar Tools CRUD
Edite
src/tools/crud-tools.js
Adicione novos recursos ao
DATADOG_RESOURCES
Defina schemas e operações
Teste todas as operações CRUD
📝 Changelog
v0.3.0 - Current
✅ 351 tools (9 curadas + 25 CRUD + 319 geradas)
✅ CRUD completo para recursos principais
✅ Schema autodescoberta via MCP
✅ Progress tracking para operações longas
✅ CLI rica com comandos de debugging
✅ 100% conformidade com padrões MCP
v0.2.x - Previous
✅ Refatoração completa da arquitetura
✅ Validação robusta com Zod
✅ Cliente HTTP com retry automático
✅ Sistema de configuração limpo
📄 Licença
Apache License 2.0 - Veja LICENSE para detalhes.
🙏 Agradecimentos
Model Context Protocol - Framework base
Datadog - APIs e documentação
Zod - Schema validation
Undici - HTTP client
🎉 Pronto para usar com qualquer LLM compatível com MCP!
Para suporte e discussões, veja as Issues do repositório.
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Tools
Enables interaction with Datadog APIs through automatically generated tools from Postman collections. Supports monitoring operations, log management, metrics submission, and other Datadog functionality through natural language.
- 🚀 Características Principais
- 📦 Instalação
- ⚙️ Configuração
- 🎮 Uso
- 🔧 Tools CRUD Disponíveis
- 📋 Como o LLM Descobre os Parâmetros
- 🎯 Tools Curadas Especiais
- 🏗️ Integração com LLMs
- 🛠️ Desenvolvimento
- 🔍 Debugging e Troubleshooting
- 🚨 Solução de Problemas Comuns
- 📈 Performance e Limites
- 🔐 Segurança
- 📊 Monitoramento
- 🎓 Exemplos Práticos
- 📚 Documentação Adicional
- 🤝 Contribuição
- 📝 Changelog
- 📄 Licença
- 🙏 Agradecimentos