ConKurrence

一条命令。找出你的 AI 是否与自身达成一致。

ConKurrence 是一个用于 AI 评估流水线的统计验证一致性测量工具包。它使用多个 AI 模型作为独立评估者，通过 Fleiss' kappa 和自助法置信区间衡量评估者间的一致性，并将有争议的项目路由给人类专家。

安装

npm install -g conkurrence

在 Claude Desktop 或任何兼容 MCP 的客户端中将 ConKurrence 用作 MCP 服务器：

npx conkurrence mcp

添加到你的 claude_desktop_config.json：

{
  "mcpServers": {
    "conkurrence": {
      "command": "npx",
      "args": ["-y", "conkurrence", "mcp"]
    }
  }
}

/plugin marketplace add AlligatorC0der/conkurrence

工具	描述
`conkurrence_run`	在多个 AI 评估者之间执行评估
`conkurrence_report`	生成详细的 Markdown 报告
`conkurrence_compare`	两次运行的并排比较
`conkurrence_trend`	跟踪多次运行的一致性
`conkurrence_suggest`	基于你的数据的 AI 驱动模式建议
`conkurrence_validate_schema`	在运行前验证模式
`conkurrence_estimate`	估算成本和 Token 使用量