Skip to main content
Glama
temurkhan13

silentwatch-mcp

by temurkhan13

silentwatch-mcp

捕获那些监控系统无法察觉的 cron 失败。 一个 MCP 服务器,用于向任何 Claude 或支持 MCP 的代理展示定时任务状态——包括运行情况、逾期任务以及退出代码为 0 但未产生任何有效输出的静默失败。开箱即用,支持 OpenClaw 调度程序、系统 cron 和 systemd 定时器。

Status: v0.3 beta Tests: 74 passing License: MIT MCP


功能概述

每个运行定时任务的团队都至少遇到过以下情况之一:

  • 静默失败 — 任务运行了,返回退出代码 0,但没有产生任何有效输出(例如:返回空结果的网页搜索 cron、写入 0 字节文件的备份、正文中包含 <no rows> 的摘要邮件)。传统监控显示为绿色勾选,但数据实际上已经损坏。

  • 逾期无警报 — 任务已经 3 天没有运行;因为没人关注,所以没人发现。

  • 最后成功时间漂移 — 任务每小时运行一次,但在过去 12 次尝试中仅成功了一次;每个人都认为它很健康,因为最近一次运行是绿色的。

  • 审计追踪缺失 — 你需要知道某个特定任务最后一次完成的时间以进行合规性检查,而唯一的“日志”是上周已经轮转的 journalctl 输出。

silentwatch-mcp 将这些可见性作为 MCP 工具暴露出来,供你的 AI 代理直接查询。无需指标管道,无需单独的仪表板,无需 SaaS 订阅。

> claude: which of my cron jobs have silent failures in the last 24 hours?
[MCP tool: find_silent_failures]
3 jobs flagged:
  • web-search-refresh — ran 12× successfully but output empty in 8 (66% silent fail rate)
  • daily-summary — ran 1× successfully (24× expected); output normal
  • audit-snapshot — last success 5 days ago, all subsequent runs returned exit 0 with empty body

为什么选择 silentwatch-mcp

现有工具(Cronitor、Healthchecks.io、Datadog、Prometheus)无法做到以下三点:

  1. 检测静默失败,而不仅仅是退出代码。 传统的 cron 监控假设 exit 0 = 成功。我们根据可配置的规则检查输出:空输出、长度相对于历史中位数的异常、尽管退出代码为 0 但 stdout 中仍包含错误关键字、持续时间异常。那些“运行成功”但没有返回任何有效内容的任务——这正是隐藏数周的失败模式。我们能捕捉到它。

  2. MCP 原生,无需集成层。 Claude Desktop、Cline、Continue、OpenClaw 代理——任何支持 MCP 的客户端都可以直接查询。无需 Grafana 插件,无需 API 包装器,无需手动解析 JSON。

  3. 开箱即用的多源支持。 OpenClaw 原生 JSONL 日志、系统 crontab (/etc/crontab + /etc/cron.d/* + 用户级 crontab -l) 以及 systemd 定时器 (systemctl list-timers + journalctl)——所有四个后端都在 v0.3 中提供,因此你可以针对你拥有的任何调度程序运行 silentwatch-mcp。没有供应商锁定。

专为运行 40 美元 VPS 的 SMB 自托管用户打造,对于他们来说 Datadog 太过昂贵,而“0 美元/月的开源 MCP”是合适的切入点——但静默失败检测在企业基础设施中同样具有价值。


工具界面

服务器注册了以下 MCP 工具(完整规范见 SPEC.md):

工具

功能

list_jobs

枚举所有已知的 cron 任务及最后运行摘要

get_job_status(job_id)

单个任务的详细状态:最后运行、最后成功、窗口期内的成功率

get_job_runs(job_id, limit)

近期运行历史,包含时间、状态和输出片段

find_overdue_jobs

按照计划应该运行但尚未运行的任务

find_silent_failures(window_hours)

“成功”运行但输出看起来可疑的任务

tail_job_logs(job_id, lines)

单个任务的近期日志输出

资源:

  • cron://jobs — 所有任务列表(清单)

  • cron://job/{id} — 单个任务清单 + 近期运行记录

  • cron://run/{id} — 带有完整输出的单个运行实例

提示词:

  • diagnose-overdue — 用于逾期任务的诊断提示词模板

  • summarize-cron-health — cron 活动 + 异常的每日摘要


快速入门

v0.3 beta — 已发布全部 4 个后端 + 通过 cron 计划解析 (croniter) 实现真正的逾期检测。 Mock、OpenClaw JSONL、crontab 和 systemd 后端均已达到生产就绪状态。74 个测试通过。v1.0 现已进入完善阶段:PyPI 发布 + GitHub Actions CI + MCP 注册表提交。

安装

pip install silentwatch-mcp  # not yet on PyPI; install from source for now:
pip install -e .

配置 Claude Desktop

添加到 ~/Library/Application Support/Claude/claude_desktop_config.json (macOS) 或 %APPDATA%\Claude\claude_desktop_config.json (Windows):

{
  "mcpServers": {
    "silentwatch": {
      "command": "python",
      "args": ["-m", "silentwatch_mcp"],
      "env": {
        "SILENTWATCH_BACKEND": "mock"
      }
    }
  }
}

后端(v0.3 已发布全部四个):

  • SILENTWATCH_BACKEND=mock — 返回示例数据(开发默认值)

  • SILENTWATCH_BACKEND=openclaw-jsonl — 解析 OpenClaw 的原生 cron 运行 JSONL 文件(设置 SILENTWATCH_OPENCLAW_LOGS 为目录,默认为 ~/.openclaw/cron-runs/);数据最丰富——包含完整运行历史 + 静默失败检测

  • SILENTWATCH_BACKEND=crontab — 解析 /etc/crontab + /etc/cron.d/* + 用户 crontabs (crontab -l);最后运行时间从 /var/log/syslog/var/log/cron 推断(设置 SILENTWATCH_SYSLOG 可覆盖)

  • SILENTWATCH_BACKEND=systemd — 解析 systemctl list-timers --all --output=json + journalctl -u <unit> 以获取运行历史;将 OnCalendar= 提取到计划字段中

所有非 mock 后端在底层工具不存在的平台/主机上会优雅地返回空结果,因此在不同环境中保留配置是安全的。

重启 Claude Desktop

服务器注册为 silentwatch。测试:

显示我所有的 cron 任务及其最后运行状态。


路线图

版本

范围

状态

v0.1

协议连接,mock 后端,所有 6 个工具注册存根数据,测试通过

✅ 完成

v0.2

实现 OpenClaw JSONL 后端(真正的 cron 运行解析,格式错误行处理,静默失败增强)

✅ 完成 (2026-05-02)

v0.3

Crontab + systemd 后端;用于真正逾期检测的 cron 计划解析 (croniter);35 个新测试

✅ 完成 (2026-05-02)

v1.0

完善:PyPI 发布,GitHub Actions CI,MCP 注册表提交 (Glama + PulseMCP),细化静默失败规则配置

⏳ 第一阶段发布目标 (5月18日当周)

v1.x

附加后端(Cowork 调度程序,Claude Code 后台任务,通用 JSON 配置),用于警报的 webhook 发射器

⏳ 第二阶段及以后


需要适配你的技术栈?

silentwatch-mcp 附带 4 个后端(mock、OpenClaw JSONL、crontab、systemd)。如果你的调度程序是其他工具——AWS EventBridge、GCP Cloud Scheduler、Hangfire、Sidekiq、Temporal、Apache Airflow、Prefect、Dagster 或自定义任务运行器——并且你希望为其获得相同的静默失败检测 MCP 可见性,那属于 自定义 MCP 构建 服务。

层级

范围

投资

时间线

简单

为具有记录 API 的现有调度程序(例如 GCP Cloud Scheduler)提供单个后端适配器

$8,000–$10,000

1–2 周

标准

自定义后端 + 自定义静默失败规则 + 与现有警报系统(PagerDuty、Slack 等)集成

$15,000–$20,000

2–4 周

复杂

多后端(跨区域/集群/租户的联合 cron)+ RBAC + 审计日志集成 + 值班工作流

$25,000–$35,000

4–8 周

参与方式:

  1. 发送邮件至 admin@pixelette.tech,主题为 Custom MCP Build inquiry

  2. 包括:一段关于你的调度程序技术栈的描述 + 你正在考虑的层级

  3. 在 2 个工作日内回复,预约 30 分钟的发现通话

此服务器也是 AI 生产纪律框架 的一部分——这是我进行生产 AI 审计所依据的方法论。


生产 AI 审计

如果你正在运行生产级 AI,并希望外部从业者评估就绪情况、发现已存在的失败模式并编写纠正行动计划——这正是此 MCP 所支持的内容。独立审计服务:

层级

范围

投资

时间线

审计 Lite

一个系统,前 5 大发现,书面报告

$1,500

1 周

审计标准

全面审计,所有 14 种模式,5C 发现,90 天跟进

$3,000

2–3 周

审计 + 工作坊

标准审计 + 2 天团队工作坊 + 包含首次月度审计

$7,500

3–4 周

相同邮件渠道:admin@pixelette.tech,主题为 AI audit inquiry


贡献

欢迎提交 PR。结构特意保持扁平,以便轻松添加自定义后端——请参阅 src/silentwatch_mcp/backends/ 获取现有示例。

添加新后端:

  1. backends/<your_backend>.py 中继承 CronBackend

  2. 实现 list_jobsget_job_runstail_logs

  3. backends/__init__.py 中注册

  4. tests/test_backend_<your_backend>.py 中添加测试

错误报告 + 功能请求:请开启 GitHub Issue。


许可证

MIT — 请参阅 LICENSE


相关


Temur Khan 构建 — 生产 AI 系统独立从业者。 联系方式:admin@pixelette.tech

Install Server
A
license - permissive license
A
quality
B
maintenance

Maintenance

Maintainers
Response time
0dRelease cycle
3Releases (12mo)

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/temurkhan13/silentwatch-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server