hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Integrations
Provides compatibility with OpenAI API clients, serving as a drop-in replacement for standard OpenAI interfaces while implementing the Chain of Draft approach.
チェーン・オブ・ドラフト(CoD)MCPサーバー
概要
このMCPサーバーは、研究論文「Chain of Draft:より少ない文章でより速く考える」で説明されているChain of Draft(CoD)推論アプローチを実装しています。CoDは、LLMがタスクを解決しながら最小限ながらも有益な中間推論出力を生成することを可能にする新しいパラダイムであり、トークンの使用量を大幅に削減しながら精度を維持します。
主なメリット
- 効率性: トークン使用量が大幅に削減されます (標準 CoT のわずか 7.6%)
- 速度: 生成時間が短いため応答が速い
- コスト削減: LLM呼び出しのAPIコストの削減
- 維持された精度: CoTと比較して同等またはそれ以上の精度
- 柔軟性:さまざまな推論タスクやドメインに適用可能
特徴
- ドラフト実装のコアチェーン
- 簡潔な推論手順(通常 5 語以下)
- フォーマットの強制
- 回答抽出
- パフォーマンス分析
- トークン使用状況の追跡
- ソリューション精度の監視
- 実行時間の測定
- ドメイン固有のパフォーマンスメトリック
- 適応型単語制限
- 自動複雑度推定
- 単語数制限の動的調整
- ドメイン固有のキャリブレーション
- 包括的なサンプルデータベース
- CoTからCoDへの変換
- 分野固有の例(数学、コード、生物学、物理学、化学、パズル)
- 問題の類似性に基づく例の検索
- フォーマットの強制
- 文字数制限を遵守するための後処理
- ステップ構造の保存
- 遵守分析
- ハイブリッド推論アプローチ
- CoDとCoTの自動選択
- ドメイン固有の最適化
- 過去の実績に基づく選抜
- OpenAI APIの互換性
- 標準の OpenAI クライアントの代替品
- 補完とチャットインターフェースの両方をサポート
- 既存のワークフローへの簡単な統合
セットアップとインストール
前提条件
- Python 3.10+ (Python実装用)
- Node.js 18+(JavaScript実装用)
- アントロピックAPIキー
Pythonのインストール
- リポジトリをクローンする
- 依存関係をインストールします:Copy
.env
ファイルで API キーを設定します。Copy- サーバーを実行します。Copy
JavaScriptのインストール
- リポジトリをクローンする
- 依存関係をインストールします:Copy
.env
ファイルで API キーを設定します。Copy- サーバーを実行します。Copy
クロードデスクトップ統合
Claude Desktop と統合するには:
- claude.ai/downloadからClaude Desktopをインストールします。
- Claude Desktop 構成ファイルを作成または編集します。Copy
- サーバー構成を追加します (Python バージョン):または JavaScript バージョンの場合:CopyCopy
- Claudeデスクトップを再起動します
Claude CLI を使用してサーバーを追加することもできます。
利用可能なツール
Chain of Draft サーバーは次のツールを提供します。
道具 | 説明 |
---|---|
chain_of_draft_solve | ドラフトの連鎖推論を使って問題を解決する |
math_solve | CoDで数学の問題を解く |
code_solve | CoDでコーディングの問題を解決する |
logic_solve | CoDで論理問題を解く |
get_performance_stats | CoDとCoTのパフォーマンス統計を取得する |
get_token_reduction | トークン削減統計を取得する |
analyze_problem_complexity | 問題の複雑さを分析する |
開発者の使用
Pythonクライアント
Chain of Draft クライアントを Python コード内で直接使用する場合:
JavaScriptクライアント
JavaScript/Node.js アプリケーションの場合:
実装の詳細
サーバーは Python と JavaScript の両方の実装で利用可能で、どちらもいくつかの統合コンポーネントで構成されています。
Python実装
- AnalyticsService : さまざまな問題領域と推論アプローチにわたるパフォーマンス指標を追跡します
- ComplexityEstimator : 問題を分析して適切な単語数制限を決定する
- ExampleDatabase : CoT の例を CoD 形式に変換して、例を管理および取得します。
- FormatEnforcer : 推論ステップが単語数制限を遵守していることを確認する
- ReasoningSelector : 問題の特性に基づいて CoD と CoT をインテリジェントに選択します
JavaScript実装
- analyticsDb : パフォーマンスメトリックを追跡するためのインメモリデータベース
- 複雑さ推定器: 問題を分析して複雑さと適切な単語制限を決定します
- formatEnforcer : 推論ステップが単語数制限を遵守していることを確認する
- 推論セレクター: 問題の特性と過去のパフォーマンスに基づいて、CoD と CoT を自動的に選択します。
どちらの実装も同じコア原則に従い、同一の MCP ツールを提供するため、ほとんどのユースケースで互換性があります。
ライセンス
このプロジェクトはオープンソースであり、MIT ライセンスの下で利用できます。
You must be authenticated.
Tools
Chain of Draft 推論アプローチを実装して、タスクを解決しながら最小限の中間推論出力を生成し、精度を維持しながらトークンの使用を大幅に削減します。
- Overview
- Key Benefits
- Features
- Setup and Installation
- Claude Desktop Integration
- Available Tools
- Developer Usage
- Implementation Details
- License