ConKurrence

コマンド一つで、AIが自己と合意しているかを確認できます。

ConKurrenceは、AI評価パイプラインのための統計的に検証された合意測定ツールキットです。複数のAIモデルを独立した評価者として使用し、Fleiss' kappaとブートストラップ信頼区間を用いて評価者間信頼性を測定し、意見が分かれた項目を人間の専門家にルーティングします。

インストール

npm install -g conkurrence

Claude DesktopやMCP互換クライアントでConKurrenceをMCPサーバーとして使用します：

npx conkurrence mcp

claude_desktop_config.json に以下を追加します：

{
  "mcpServers": {
    "conkurrence": {
      "command": "npx",
      "args": ["-y", "conkurrence", "mcp"]
    }
  }
}

/plugin marketplace add AlligatorC0der/conkurrence

ツール	説明
`conkurrence_run`	複数のAI評価者間で評価を実行
`conkurrence_report`	詳細なMarkdownレポートを生成
`conkurrence_compare`	2つの実行結果を並べて比較
`conkurrence_trend`	複数の実行にわたる合意度を追跡
`conkurrence_suggest`	データからAIがスキーマを提案
`conkurrence_validate_schema`	実行前にスキーマを検証
`conkurrence_estimate`	コストとトークン使用量を見積もり

BUSL-1.1 — Business Source License 1.1