Code Intelligence MCP Server

DESIGN_ja.md•39.1 KiB

# Code Intelligence MCP Server - 設計ドキュメント v1.16 > このドキュメントは v1.16 時点の完全なシステム仕様を記述しています。 > バージョン履歴については [CHANGELOG](#changelog) を参照してください。 --- ## 目次 1. [概要](#概要) 2. [設計思想](#設計思想) 3. [アーキテクチャ](#アーキテクチャ) 4. [フェーズ契約](#フェーズ契約) 5. [Complete Flow (19 Steps)](#complete-flow-19-steps) 6. [セッション管理と復元](#セッション管理と復元) 7. [フェーズマトリクス](#フェーズマトリクス) 8. [submit_phase API](#submit_phase-api) 9. [タスクオーケストレーション](#タスクオーケストレーション) 10. [安全弁（ループ防止）](#安全弁ループ防止) 11. [2層コンテキスト](#2層コンテキスト) 12. [ツールリファレンス](#ツールリファレンス) 13. [プロジェクト構成](#プロジェクト構成) 14. [設定](#設定) 15. [内部リファレンス](#内部リファレンス) 16. [CHANGELOG](#changelog) --- ## 概要 ### 狙い LLM エージェントが「コードベースを正確に理解してから実装する」ワークフローを強制する。 LLM に判断を委ねず、サーバー側でフェーズ遷移・検証・復元を制御することで、実装品質と再現性を担保する。 ### 実現していること | 機能 | 内容 | |------|------| | **フェーズ強制** | 探索 → 検証 → 実装 → レビューの順序をサーバーが強制。ショートカット不可 | | **フェーズ契約** | 各フェーズの指示・期待 payload・必須ツールを明文化。契約違反は弾く | | **コード探索** | ctags / ripgrep / tree-sitter / ChromaDB による構造化探索 | | **セッション永続化** | CLI 再起動後もチェックポイントから復元可能 | | **コンパクト耐性** | LLM の文脈喪失を検知し、サマリーを自動復元 | | **書き込み制限** | 探索済みファイルのみ修正可能 | ### 技術概要 ``` ┌─────────────────────────────────────────────────────┐ │ LLM Agent (Claude Code / Codex) │ │ /code skill │ └─────────────────────┬───────────────────────────────┘ │ MCP Protocol ▼ ┌─────────────────────────────────────────────────────┐ │ Code Intelligence Server │ │ ・フェーズ契約 (phase_contract.yml) │ │ ・チェックポイント永続化 (sessions/*.json) │ │ ・ChromaDB (Forest/Map 2層ベクトル検索) │ └─────────────────────┬───────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────┐ │ Tool Layer │ │ ctags │ ripgrep │ tree-sitter │ AST Chunker │ └─────────────────────────────────────────────────────┘ ``` | コンポーネント | 役割 | |---------------|------| | **MCP Server** | フェーズ遷移、ペイロード検証、チェックポイント保存 | | **Phase Contract** | 各フェーズの instruction / expected_payload / required_tools を定義 | | **ChromaDB** | Forest（コード全体）と Map（成功パターン）の 2 層ベクトル検索 | | **Tool Layer** | ctags（シンボル定義）、ripgrep（検索）、tree-sitter（構造分析） | ### 対応クライアント | クライアント | 対応状況 | |-------------|---------| | **Claude Code** | `/code` スキルで利用 | | **Codex** | `/code` スキルで利用 | --- ## 設計思想 ``` LLM に決めさせない。従わないと進めない設計にする。そして失敗から学ぶ仕組みを持つ。 ``` ### コア原則 | 原則 | 実装 | |------|------| | **フェーズ強制** | フェーズごとのツール制限（ショートカット不可） | | **サーバー評価** | サーバーが信頼度を計算（LLM 自己申告ではない） | | **Quote 検証** | LLM が抽出した引用を元のクエリと照合 | | **Embedding 検証** | ベクトル類似度による客観的な NL→Symbol 関連性評価 | | **書き込み制限** | 探索済みファイルのみ修正可能 | | **並列実行ガード** | セッション中は他の /code 呼び出しをブロック（1プロジェクト1セッション） | | **改善サイクル** | DecisionLog + OutcomeLog による失敗からの学習 | | **2層コンテキスト** | 静的プロジェクトルール + 動的タスク固有ルール | | **submit_phase 統一** | 全フェーズの出口を1ツールに統一（コンパクト耐性） | | **サーバー強制タスク管理** | タスク完了をサーバーが検証（LLM のスキップ防止） | | **安全弁** | 無限ループをサーバー側カウンターで防止 | | **実装チェックリスト (v1.16)** | タスク完了時に全項目の evidence/reason 検証、空実装検出 | --- ## アーキテクチャ ### システム概要 ``` ┌─────────────────────────────────────────────────────┐ │ LLM Agent │ │ (/code skill) │ └─────────────────────┬───────────────────────────────┘ │ MCP Protocol ▼ ┌─────────────────────────────────────────────────────┐ │ Code Intelligence Server │ │ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ │ │ Router │ │ Session │ │ QueryFrame │ │ │ │ │ │ Manager │ │ Decomposer │ │ │ └─────────────┘ └─────────────┘ └─────────────┘ │ │ ┌─────────────┐ ┌─────────────────────────────────┐│ │ │ Phase │ │ Checkpoint ││ │ │ Contract │ │ sessions/{session_id}.json ││ │ │ │ │ ││ │ └─────────────┘ └─────────────────────────────────┘│ │ ┌─────────────────────────────────────────────────┐│ │ │ ChromaDB Manager ││ │ │ ┌─────────────────┐ ┌─────────────────────┐ ││ │ │ │ Forest (森) │ │ Map (地図) │ ││ │ │ │ 全コードチャンク │ │ 成功パターン │ ││ │ │ └─────────────────┘ └─────────────────────┘ ││ │ └─────────────────────────────────────────────────┘│ └─────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────┐ │ Tool Layer │ │ ctags │ ripgrep │ tree-sitter │ AST Chunker │ └─────────────────────────────────────────────────────┘ ``` ### オーケストレーター → LLM → submit_phase の責務分離 - **オーケストレーター（サーバー）**: 現在フェーズを特定し、`instruction` + `expected_payload` を返す - **LLM**: 指示を実行し、`expected_payload` 形式で **`submit_phase` のみ**を呼ぶ - **サーバー**: ペイロードを検証し、次フェーズを決定するフェーズ契約（`instruction` / `expected_payload` / 必須ツール）は `.code-intel/phase_contract.yml` に集約されており、**契約に沿わない送信は弾く**。契約の最小単位は **summary + tools_used**（READY 完了 / MERGE など一部例外あり）。詳細は [フェーズ契約](#フェーズ契約) セクションを参照。 ### Forest/Map 2層構造 | 名前 | 目的 | 内容 | 更新タイミング | |------|------|------|---------------| | **Forest** | コードベース全体を検索 | AST チャンキングされたコード断片 | 増分同期（SHA256） | | **Map** | 成功パターンを再利用 | NL→Symbol ペア、合意事項 | `/outcome success` 時 | **ショートカットロジック**: Map スコア ≥ 0.7 → Forest 探索をスキップ --- ## フェーズ契約フェーズ契約は、フローの実現方法を形式化する仕組み。 ### 契約の3層構造 ``` ┌─────────────────────────────────────────────────────────────────┐ │ ①オーケストレーター │ │ ↓ instruction + expected_payload + required_tools │ ├─────────────────────────────────────────────────────────────────┤ │ ②LLM（作業実行） │ │ ↓ submit_phase(data={summary, tools_used, ...}) │ ├─────────────────────────────────────────────────────────────────┤ │ ③サーバー（検証） │ │ → ペイロード検証 → 次フェーズ決定 → チェックポイント保存 │ └─────────────────────────────────────────────────────────────────┘ ``` ### 契約の定義場所 `.code-intel/phase_contract.yml` に以下を集約: | 要素 | 説明 | |------|------| | `instruction` | LLM が実行すべき作業の指示 | | `expected_payload` | submit_phase に送る payload の構造（擬似スキーマ） | | `required_tools` | 必須ツール（未使用なら弾く） | ### 契約の最小単位 | フェーズ種別 | 最小 payload | |-------------|-------------| | 通常フェーズ | `summary` + `tools_used` | | 完了フェーズ（READY 完了 / MERGE） | `summary` のみ | ### サーバー側検証 1. **必須ツールの使用確認**: `tools_used` に必須ツールが含まれているか 2. **summary の存在確認**: 全フェーズで summary 必須 3. **契約違反時**: `payload_mismatch` エラーで再指示 ### 契約のレスポンス形式 ```json { "phase": "EXPLORATION", "step": 5, "instruction": "code-intel ツールを最低2種類使って探索し...", "expected_payload": { "explored_files": "list[str]", "findings": "list[str]", "tools_used": "list[str] (at least 2 types)", "summary": "str" }, "call": "submit_phase" } ``` 詳細は [templates/code-intel/phase_contract.yml](../templates/code-intel/phase_contract.yml) を参照。 --- ## Complete Flow (19 Steps) LLM 側前処理（サーバー呼び出しなし）: - Flag Check: コマンドオプション解析 - Intent Classification: IMPLEMENT / MODIFY / INVESTIGATE / QUESTION 全ステップの出口は `submit_phase`（Step 1 のみ `start_session`）。 ### セッション開始 | Step | Phase | LLM処理内容 | 備考 | |------|-------|------------|------| | 1 | — | Intent 判定（実装/調査）→ `start_session` で初期化 | | | 2 | BRANCH_INTERVENTION | ユーザーに選択肢を提示 | stale ブランチ検出時のみ | | 3 | DOCUMENT_RESEARCH | Sub-agent で設計文書調査 | | | 4 | QUERY_FRAME | NL → 構造化スロット抽出 | | ### 探索フェーズ | Step | Phase | LLM処理内容 | 備考 | |------|-------|------------|------| | 5 | EXPLORATION | code-intel ツールで探索 | | | 6 | Q1 | SEMANTIC 必要性を評価 | サーバー判定で 7 をスキップ可 | | 7 | SEMANTIC | semantic_search で追加情報収集 | Q1=false 時スキップ | | 8 | Q2 | VERIFICATION 必要性を評価 | サーバー判定で 9 をスキップ可 | | 9 | VERIFICATION | 仮説検証 | Q2=false 時スキップ | | 10 | Q3 | IMPACT_ANALYSIS 必要性を評価 | サーバー判定で 11 をスキップ可 | | 11 | IMPACT_ANALYSIS | 影響分析 | Q3=false 時スキップ / 調査: SESSION_COMPLETE | ### 実装フェーズ | Step | Phase | LLM処理内容 | 備考 | |------|-------|------------|------| | 12 | READY | タスク分解・計画 | ブランチ作成 | | 13 | READY | Edit/Write で実装 | タスク数分繰り返し (×N) | | 14 | READY | 全タスク完了を確認 | 未完了時ブロック | | 15 | POST_IMPL_VERIFY | verifier プロンプト実行 | fail 時 Step 12 差戻し | | 16 | VERIFY_INTERVENTION | 介入プロンプト読み取り・実行 | タスク failure_count ≥ 3 時のみ | | 17 | PRE_COMMIT | review_changes でレビュー | | | 18 | QUALITY_REVIEW | 品質チェック | quality_revert_count ≥ 3 → forced_completion | | 19 | MERGE | — | SESSION_COMPLETE | --- ## セッション管理と復元 ### 課題 | シナリオ | MCP プロセス | SessionState | 課題 | |----------|-------------|-------------|------| | 自動コンパクト（同一セッション） | 生存 | 保持 | LLM の文脈喪失 | | `/clear`（同一 CLI） | 生存 | 保持 | LLM の文脈喪失 | | CLI 終了 → `--continue` | 再起動 | **消滅** | サーバー状態も消滅 | | コンテキスト枯渇 → 新規会話 | 再起動 | **消滅** | サーバー状態も消滅 | ``` LLM 会話 ← コンパクト対象（会話履歴が要約される） ↕ MCP プロトコル MCP サーバー ← インメモリ保持（CLI 終了で消滅） ``` ### 対策の全体像 | 対策 | 対象シナリオ | 仕組み | |------|-------------|--------| | **チェックポイント永続化** | CLI 跨ぎ | ファイル保存 → 復元 | | **compaction_count 方式** | 同一セッション内コンパクト | 値のずれで検知 → サマリー復元 | | **get_session_status** | 任意の状態喪失 | リカバリ用 API | ### チェックポイント永続化 ``` submit_phase 成功 → SessionState.to_dict() でシリアライズ → .code-intel/sessions/{session_id}.json に保存 CLI 再起動 → /code --resume → get_session_status がチェックポイントを検出 → SessionState.from_dict() で復元 ``` | 項目 | 内容 | |------|------| | **保存先** | `.code-intel/sessions/{session_id}.json` | | **保存タイミング** | `submit_phase` 成功後（毎フェーズ） | | **復元方法** | `/code --resume` → `get_session_status` | | **完了時** | MERGE（SESSION_COMPLETE）でチェックポイント削除 | | **掃除** | `--clean` で stale ブランチ削除 + チェックポイント全削除 | ### 復元の2つの経路 | 経路 | トリガー | 動作 | |------|---------|------| | **明示的再開** | `/code --resume` | code.md 読み込み + get_session_status で復元 | | **通常実行時の検出** | `/code <query>` | start_session が `recovery_available` を返し、ユーザーに選択を提示 | > 注意: `get_session_status` 単体で復元すると、LLM 側の文脈が不足するため > 原則 `/code --resume` で **LLM 文脈 + サーバー状態**を同時に確保する。 ### compaction_count 方式同一セッション内でコンパクト発生を検知し、サマリーを自動復元する仕組み。 **原理**: サーバーと LLM が `compaction_count`（整数）を共有し、**値のずれ**でコンパクト発生を検知する。 ``` 1. セッション開始: compaction_count = 0 2. 通常の submit: LLM は count をエコーバック → サーバーと一致 → 通常応答 3. コンパクト発生: LLM がコンテキスト喪失を検知 → count を +1 して送信 4. サーバー: 値のずれを検知 → phase_summaries をレスポンスに付与 + count を更新 5. LLM: サマリーを読んで文脈を復元 ``` レスポンス例（ずれ検知時）: ```json { "success": true, "phase": "Q1", "step": 6, "compaction_count": 1, "phase_summaries": { "step_03_DOCUMENT_RESEARCH": "要点の短い要約", "step_05_EXPLORATION": "探索結果の要約" } } ``` ### コンパクト耐性の4層構造 | 層 | 対策 | 効果 | |----|------|------| | ツール設計 | `submit_phase` 一本 | 「何を呼ぶか」を忘れない | | レスポンス設計 | `expected_payload` 付き | 「何を返すか」を忘れない | | リカバリ | `get_session_status` | 完全復元手段 | | 防御 | ペイロード不整合検知 | サイレント障害防止 | **ペイロード不整合検知**: LLM がフェーズと無関係なペイロードを送った場合、サーバーが現在フェーズの再指示を返す。 ### 永続化の粒度 | カテゴリ | 永続化対象 | |---------|-----------| | オーケストレーター状態 | session_id, flags, phase_state, counters, tasks | | LLM 向けサマリー | 各フェーズの `summary` フィールドのみ | **方針**: 詳細情報は保存せず、`summary` に圧縮して永続化。再開時は要約に落ちることを許容する。 --- ## フェーズマトリクスサーバーが各 submit_phase レスポンスで次フェーズを決定。LLM はフラグを知る必要がない。 | Step | Phase | 実装 | -e | -v | --no-verify | --no-quality | --fast | --quick | --no-doc | -ni | 備考 | |------|-------|:----:|:--:|:--:|:-----------:|:------------:|:------:|:-------:|:--------:|:---:|------| | 1 | start_session | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | | | 2 | BRANCH_INTERVENTION | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | stale 検出時のみ | | 3 | DOCUMENT_RESEARCH | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | | | 4 | QUERY_FRAME | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | | | 5 | EXPLORATION | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ | ✅ | | | 6 | Q1 | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ | ✅ | | | 7 | SEMANTIC | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ | ✅ | Q1=false 時スキップ | | 8 | Q2 | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ | ✅ | | | 9 | VERIFICATION | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ | ✅ | Q2=false 時スキップ | | 10 | Q3 | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ | ✅ | | | 11 | IMPACT_ANALYSIS | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ | ✅ | Q3=false 時スキップ | | 12 | READY (計画) | ✅ | ❌ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ブランチ作成 | | 13 | READY (実装) | ✅ | ❌ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ×N | | 14 | READY (完了) | ✅ | ❌ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | 未完了時ブロック | | 15 | POST_IMPL_VERIFY | ✅ | ❌ | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ | fail→Step 12 差戻し | | 16 | VERIFY_INTERVENTION | ✅ | ❌ | ❌ | ❌ | ✅ | ✅ | ❌ | ✅ | ❌ | タスク failure_count ≥ 3 時のみ | | 17 | PRE_COMMIT | ✅ | ❌ | ❌ | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | | | 18 | QUALITY_REVIEW | ✅ | ❌ | ❌ | ✅ | ❌ | ❌ | ❌ | ✅ | ✅ | | | 19 | MERGE | ✅ | ❌ | ❌ | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | | **凡例**: - **実装**: IMPLEMENT / MODIFY intent（デフォルト） - **-e**: `--only-explore`（探索のみ、Step 11 で SESSION_COMPLETE） - **-v**: `--only-verify`（検証のみ、Step 15 のみ実行） - **-ni**: `--no-intervention`（Step 16 VERIFY_INTERVENTION をスキップ） - フラグ列は実装 intent に対する修飾。`-e` では Step 12 以降が存在しない。 ### コマンドオプション | Long | Short | 説明 | |------|-------|------| | `--gate=LEVEL` | `-g=LEVEL` | ゲートレベル: f(ull), a(uto) [default: auto] | | `--no-verify` | — | POST_IMPL_VERIFY をスキップ（Step 15） | | `--no-quality` | — | QUALITY_REVIEW をスキップ（Step 18） | | `--only-verify` | `-v` | 検証のみ実行 | | `--only-explore` | `-e` | 探索のみ実行（SESSION_COMPLETE after Step 11） | | `--fast` | `-f` | 探索スキップ（Steps 5-11）、ブランチあり | | `--quick` | `-q` | 探索スキップ（Steps 5-11）、ブランチなし、PRE_COMMIT/QUALITY_REVIEW/MERGE もスキップ | | `--no-doc-research` | — | DOCUMENT_RESEARCH をスキップ（Step 3） | | `--no-intervention` | `-ni` | VERIFY_INTERVENTION をスキップ（Step 16） | | `--resume` | `-r` | チェックポイントからセッション再開 | | `--clean` | `-c` | stale ブランチ削除 + チェックポイント全削除 | | `--rebuild` | — | 全インデックスを強制再構築 | --- ## submit_phase API ### 概要 ``` start_session → submit_phase (×N) → SESSION_COMPLETE ↑ ↑ get_session_status (recovery at any point) ``` - LLM が呼ぶフェーズ遷移ツールは `submit_phase` のみ - サーバーが `SessionState.phase` から現在フェーズを特定し、ペイロードをバリデーション - サーバーが次フェーズを決定してレスポンスを返す - `phase_contract.yml` の契約に従い、**必須ツールの使用証跡**を要求する ### レスポンス形式（自己完結型）全フェーズ共通のレスポンス構造: ```json { "phase": "EXPLORATION", "step": 5, "instruction": "code-intel ツールでコードベースを探索してください", "expected_payload": { "explored_files": "list[str]", "findings": "list[str]" }, "call": "submit_phase" } ``` LLM はレスポンスの `instruction` に従い処理を実行し、`expected_payload` の形式で `submit_phase` を呼ぶ。 ### フェーズ別ペイロード | Step | Phase | LLM → サーバー (`data`) | サーバー判定 | |------|-------|------------------------|------------| | 2 | BRANCH_INTERVENTION | `{choice: "delete" \| "merge" \| "continue", tools_used, summary}` | 処理実行 → 次フェーズ | | 3 | DOCUMENT_RESEARCH | `{documents_reviewed: [...], tools_used, summary}` | → 次フェーズ | | 4 | QUERY_FRAME | `{action_type, target_symbols, scope, constraints, tools_used, summary}` | → 次フェーズ | | 5 | EXPLORATION | `{explored_files: [...], findings: [...], tools_used, summary}` | → 次フェーズ | | 6 | Q1 | `{needs_more_information: bool, reason}` | true→SEMANTIC / false→Q2 | | 7 | SEMANTIC | `{search_results: [...], tools_used, summary}` | → 次フェーズ | | 8 | Q2 | `{has_unverified_hypotheses: bool, reason}` | true→VERIFICATION / false→Q3 | | 9 | VERIFICATION | `{hypotheses_verified: [...], tools_used, summary}` | → 次フェーズ | | 10 | Q3 | `{needs_impact_analysis: bool, reason}` | true→IMPACT / false(実装)→READY / false(調査)→SESSION_COMPLETE | | 11 | IMPACT_ANALYSIS | `{impact_summary: {...}, tools_used, summary}` | 実装→READY / 調査→SESSION_COMPLETE | | 12 | READY (計画) | `{tasks: [{id, description, status, checklist: [{item, status}]}], tools_used, summary}` | タスク登録（冪等） | | 13 | READY (実装) | `{task_id, checklist: [{item, status, evidence?, reason?}], summary, tools_used}` | checklist 検証、×N | | 14 | READY (完了) | `{summary}` | 全タスク完了チェック → 次フェーズ | | 15 | POST_IMPL_VERIFY | `{passed: bool, failed_tasks?, details, tools_used, summary}` | pass→17 / fail→12 | | 16 | VERIFY_INTERVENTION | `{prompt_used, action_taken, tools_used, summary}` | failure_count リセット → 12 | | 17 | PRE_COMMIT | `{reviewed_files: [...], commit_message, tools_used, summary}` | コミット → 次フェーズ | | 18 | QUALITY_REVIEW | `{quality_score, issues: [...], tools_used, summary}` | 問題なし→MERGE / 問題あり→12 | | 19 | MERGE | `{summary}` | マージ → SESSION_COMPLETE | **注**: `gate_level="full"` の場合、サーバーは Q1/Q2/Q3 の評価を無視し全フェーズ強制実行。 --- ## タスクオーケストレーション READY フェーズは内部的に 3 サブステップ（計画 → 実装 → 完了）を持つ。全て `submit_phase` で送信し、サーバーが内部状態で判別する。 ### Step 12: タスク計画タスクモデル: `{id, description, status, checklist, failure_count?, revert_reason?}` チェックリスト項目: `{item, status, evidence?, reason?}` | status | evidence | reason | 説明 | |--------|----------|--------|------| | `pending` | - | - | 初期状態 | | `done` | **必須** | - | 実装完了（`file:line` で証拠を示す） | | `skipped` | - | **必須** | 実装しない（理由を明記、10文字以上） | ```python # 初回 submit_phase(data={ "tasks": [ { "id": "task_1", "description": "認証機能を実装", "status": "pending", "checklist": [ {"item": "auth.py に login() メソッドを追加", "status": "pending"}, {"item": "auth.py に logout() メソッドを追加", "status": "pending"}, {"item": "auth.py に validate_password() を追加", "status": "pending"} ] } ] }) # 差戻し時（完了済み + 修正タスクの完全なリスト） submit_phase(data={ "tasks": [ {"id": "task_1", "description": "...", "status": "completed", "checklist": [...]}, {"id": "fix_1", "description": "テスト失敗箇所の修正", "status": "pending", "checklist": [...], "failure_count": 1, "revert_reason": "テストX失敗"} ] }) ``` **冪等設計**: Step 12 は常に完全なタスクリストを受け取る。同じペイロードを再送しても同じ結果。 ### Step 13: タスク完了報告 (×N) ```python submit_phase(data={ "task_id": "task_1", "summary": "認証機能実装完了", "checklist": [ {"item": "auth.py に login() メソッドを追加", "status": "done", "evidence": "auth.py:42-58"}, {"item": "auth.py に logout() メソッドを追加", "status": "done", "evidence": "auth.py:60-75"}, {"item": "auth.py に validate_password() を追加", "status": "skipped", "reason": "既存の PasswordValidator クラスを再利用するため"} ] }) ``` **検証ロジック（サーバー側）**: 1. **全項目報告チェック**: 登録時の checklist 項目と一致するか 2. **status チェック**: 全項目が `done` または `skipped`（`pending` 残存は不可） 3. **evidence 検証** (`done` の場合): - フォーマット: `file.py:42` または `file.py:42-58` - ファイル存在チェック - 行番号範囲チェック - 空実装検出（pass/TODO/NotImplementedError のみの場合はエラー） 4. **reason 検証** (`skipped` の場合): 10文字以上の理由が必須登録順に完了報告。サーバーが進捗を追跡し次タスクを返す。 ### Step 14: 実装完了 ```python submit_phase(data={}) ``` サーバーが全タスクの完了を検証。未完了がある場合はブロック。 ### 差戻し時の動作 POST_IMPL_VERIFY / VERIFY_INTERVENTION / QUALITY_REVIEW から Step 12 に差し戻された場合: 1. サーバー: 差戻し理由 + 既存タスク一覧を instruction に含める 2. LLM: 既存タスク（completed）+ 修正タスク（pending）の完全なリストを submit_phase で送信 3. LLM: pending タスクのみ実装（Step 13 ×N） 4. → Step 15 POST_IMPL_VERIFY へ再進行 --- ## 安全弁（ループ防止） LLM はコンパクト後にループを認識できないため、全てのループ制限はサーバー側で強制する。 ### サーバー管理カウンター ```python class SessionState: intervention_count: int = 0 # VERIFY_INTERVENTION の実行回数 quality_revert_count: int = 0 # QUALITY_REVIEW からの差戻し回数 # failure_count はタスク別（Task.failure_count） ``` ### ループパスと制限 | ループパス | トリガー | 制限 | 超過時の動作 | |-----------|---------|------|-------------| | POST_IMPL_VERIFY → Step 12 | 検証失敗 | タスク failure_count ≥ 3 | → VERIFY_INTERVENTION | | VERIFY_INTERVENTION → Step 12 | 介入実行後 | intervention_count ≥ 2 | → user_escalation（AskUserQuestion） | | QUALITY_REVIEW → Step 12 | 品質問題あり | quality_revert_count ≥ 3 | → forced_completion（warning 付き MERGE） | --- ## 2層コンテキスト ``` ┌─────────────────────────────────────────────────────────────────┐ │ Layer 1: project_rules（セッション開始時） │ │ └── 常に必要なベースラインルール（軽量、キャッシュ済み） │ │ ソース: CLAUDE.md / 内容: DO/DON'T リスト │ └─────────────────────────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────────────────────────┐ │ Layer 2: mandatory_rules（DOCUMENT_RESEARCH フェーズ） │ │ └── タスク固有の詳細ルール（動的、タスクごと） │ │ ソース: docs/**/*.md（サブエージェント調査） │ └─────────────────────────────────────────────────────────────────┘ ``` | 観点 | project_rules | mandatory_rules | |------|---------------|-----------------| | ソース | CLAUDE.md | docs/**/*.md | | タイミング | セッション開始時 | DOCUMENT_RESEARCH (Step 3) | | 内容 | 汎用 DO/DON'T | タスク固有の制約 | | スキップ可能 | 不可 | 可能（`--no-doc`） | --- ## ツールリファレンス ### セッション管理 | ツール | 説明 | |--------|------| | `start_session` | intent, query, flags でセッション開始 | | `submit_phase` | **全フェーズの唯一の出口** — サーバーが次フェーズを決定 | | `get_session_status` | 現在のフェーズ + instruction + expected_payload を取得（リカバリ用） | ### コード探索 | ツール | 説明 | |--------|------| | `search_text` | テキストパターン検索（並列対応） | | `find_definitions` | シンボル定義検索（ctags） | | `find_references` | 参照検索（ripgrep） | | `analyze_structure` | コード構造分析（tree-sitter） | | `get_symbols` | ファイルのシンボル一覧取得 | | `search_files` | ファイル名パターン検索 | | `semantic_search` | Forest/Map のベクトル検索（SEMANTIC フェーズ） | | `query` | 汎用自然言語クエリ | ### 実装制御 | ツール | 説明 | |--------|------| | `check_write_target` | ファイル修正可能か検証 | | `add_explored_files` | 探索済みリストにファイル追加 | | `review_changes` | PRE_COMMIT で全ファイル変更を表示 | ### ブランチ管理 | ツール | 説明 | |--------|------| | `cleanup_stale_branches` | 全 `llm_task_*` ブランチを削除 | ### インデックス | ツール | 説明 | |--------|------| | `sync_index` | ChromaDB インデックスを同期 | | `update_context` | context.yml の要約を更新 | --- ## プロジェクト構成 `init-project.sh` 実行後のプロジェクト構造: ``` your-project/ ├── .claude/ │ ├── CLAUDE.md (プロジェクトルールテンプレート) │ └── commands/ (スキル: code.md 等) └── .code-intel/ ├── config.json (インデックス設定) ├── context.yml (コンテキスト & doc_research 設定) ├── phase_contract.yml (フェーズ契約定義) ├── task_planning.md (タスク分割ガイド) ├── user_escalation.md (ユーザーエスカレーション手順) ├── agreements/ (NL→Symbol ペア) ├── chroma/ (ChromaDB) ├── logs/ (DecisionLog, OutcomeLog) ├── sessions/ (チェックポイント保存先) ├── verifiers/ (検証プロンプト) ├── doc_research/ (ドキュメント調査プロンプト) ├── review_prompts/ (ゴミ検出, 品質レビュー) └── interventions/ (介入プロンプト) ``` --- ## 設定 ### config.json ```json { "version": "1.0", "embedding_model": "multilingual-e5-small", "source_dirs": ["src", "lib"], "exclude_patterns": ["**/node_modules/**", "**/__pycache__/**"], "chunk_strategy": "ast", "chunk_max_tokens": 512, "sync_ttl_hours": 1, "sync_on_start": true } ``` ### context.yml ```yaml project_rules: source: "CLAUDE.md" summary: | DO: - Service 層でビジネスロジック DON'T: - Controller に複雑なロジック doc_research: enabled: true docs_path: - "docs/" default_prompts: - "default.md" document_search: include_patterns: - "**/*.md" exclude_patterns: - "node_modules/**" ``` --- ## 内部リファレンス ### コアモジュール | モジュール | ファイル | 責務 | |-----------|---------|------| | SessionState | `tools/session.py` | セッション状態、フェーズ遷移、タスク管理 | | QueryFrame | `tools/query_frame.py` | NL → 構造化クエリ | | ChromaDB Manager | `tools/chromadb_manager.py` | Forest/Map 管理 | | ImpactAnalyzer | `tools/impact_analyzer.py` | 変更影響分析 | | ContextProvider | `tools/context_provider.py` | プロジェクトルール & ドキュメント調査 | | BranchManager | `tools/branch_manager.py` | Gitブランチ分離 | ### 主要データ構造 ```python class Phase(Enum): BRANCH_INTERVENTION = auto() # Step 2 DOCUMENT_RESEARCH = auto() # Step 3 QUERY_FRAME = auto() # Step 4 EXPLORATION = auto() # Step 5 Q1 = auto() # Step 6 SEMANTIC = auto() # Step 7 Q2 = auto() # Step 8 VERIFICATION = auto() # Step 9 Q3 = auto() # Step 10 IMPACT_ANALYSIS = auto() # Step 11 READY = auto() # Steps 12-14 POST_IMPL_VERIFY = auto() # Step 15 VERIFY_INTERVENTION = auto() # Step 16 PRE_COMMIT = auto() # Step 17 QUALITY_REVIEW = auto() # Step 18 MERGE = auto() # Step 19 class SessionState: session_id: str intent: str # IMPLEMENT/MODIFY/INVESTIGATE/QUESTION phase: Phase # 現在のフェーズ query_frame: QueryFrame gate_level: str # full/auto # フラグ fast_mode: bool quick_mode: bool no_doc: bool no_verify: bool no_quality: bool no_intervention: bool # タスク管理 tasks: list[TaskModel] # 安全弁カウンター intervention_count: int quality_revert_count: int @dataclass class ChecklistItem: item: str status: str # pending/done/skipped evidence: str | None = None # done 時必須（file.py:42 形式） reason: str | None = None # skipped 時必須（10文字以上） @dataclass class TaskModel: id: str description: str status: str # pending/completed checklist: list[ChecklistItem] # 実装項目一覧 failure_count: int = 0 revert_reason: str = "" ``` --- ## CHANGELOG | Version | Description | Link | |---------|-------------|------| | v1.16 | タスク実装チェックリスト（evidence 検証、空実装検出、reason 必須化） | [v1.16](updates/v1.16_ja.md) | | v1.14 | 配付構成の再整理（private/public 2 リポジトリ方式、テンプレート集約） | [v1.14](updates/v1.14_ja.md) | | v1.13-1 | フェーズ失敗時のエラーハンドリング監査（契約違反の検知強化） | [v1.13-1](updates/v1.13-1_phase_failure_handling_audit.md) | | v1.13 | フェーズ契約形式化（instruction/expected_payload/tools_used の明文化） | [v1.13](updates/v1.13_ja.md) | | v1.12 | チェックポイント永続化 & レガシーツール削除 | [v1.12](updates/v1.12_ja.md) | | v1.11 | submit_phase 統一 & タスクオーケストレーション（17個のツール→1個、コンパクト耐性、サーバー強制タスク管理） | [v1.11](updates/v1.11_ja.md) | | v1.10 | Individual Phase Checks（各フェーズ前の個別チェック、VERIFICATION/IMPACT分離、gate_level再編） | [v1.10](updates/v1.10_ja.md) | | v1.9 | Performance Optimization（sync_index バッチ処理 - 15-20秒削減） | [v1.9](updates/v1.9_ja.md) | | v1.8 | Exploration-Only Mode（探索のみモード - --only-explore） | [v1.8](updates/v1.8_ja.md) | | v1.7 | Parallel Execution（並列実行 - 27-35秒削減） | [v1.7](updates/v1.7_ja.md) | | v1.6 | Branch Lifecycle（stale 警告、begin_phase_gate） | [v1.6](updates/v1.6_ja.md) | | v1.5 | Quality Review（品質レビュー） | [v1.5](updates/v1.5_ja.md) | | v1.4 | Intervention System（介入システム） | [v1.4](updates/v1.4_ja.md) | | v1.3 | Document Research, Markup Cross-Reference | [v1.3](updates/v1.3_ja.md) | | v1.2 | Git Branch Isolation | [v1.2](updates/v1.2_ja.md) | | v1.1 | Impact Analysis, Context Provider | [v1.1](updates/v1.1_ja.md) | ドキュメント管理ルールは [DOCUMENTATION_RULES.md](DOCUMENTATION_RULES.md) を参照。

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/tech-spoke/llm-helper'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

DESIGN_ja.md•39.1 KiB