MCP推論者
Claude Desktop の推論実装では、ビーム検索とモンテ カルロ ツリー検索 (MCTS) の両方を使用できます。正直に言うと、これは、Claude の複雑な問題解決能力をさらに向上できるかどうかを確認する方法として始まりました... 確かに可能であることがわかりました。
現在のバージョン:
バージョン2.0.0
新着情報:
2つの実験的推論アルゴリズムを追加しました:
- `mcts-002-alpha` - Uses the A* Search Method along with an early *alpha* implementation of a Policy Simulation Layer - Also includes an early *alpha* implementation of Adaptive Exploration Simulator & Outcome Based Reasoning Simulator *NOTE* the implementation of these alpha simulators is not complete and is subject to change - `mcts-002alt-alpha` - Uses the Bidirectional Search Method along with an early *alpha* implementation of a Policy Simulation Layer - Also includes an early *alpha* implementation of Adaptive Exploration Simulator & Outcome Based Reasoning Simulator *NOTE* the implementation of these alpha simulators is not complete and is subject to change
mcts-001-alphaとmcts-001alt-alphaはどうなったのでしょうか?
簡単に言えば、それは役に立たず、基本的な
mcts法とほぼ同様でした。最初のテストの後、基本的な思考プロセスで得られた結果はほぼ同様であり、単に政策シミュレーションを追加しても効果がない可能性があることを示しました。
では、なぜ今、ポリシーシミュレーションレイヤーを追加するのでしょうか?
ほとんどのアルゴリズムがポリシーと検索を実装する方法なので、ポリシーと検索を連携して組み込むことが重要だと思います。
以前のバージョン:
バージョン1.1.0
検索パラメータに対するモデル制御を追加しました:
beamWidth - クロードが追跡するパスの数を調整できるようにします(1〜10)
numSimulations - MCTSシミュレーション回数を微調整する(1~150)
特徴
切り替え可能な 2 つの検索戦略:
ビームサーチ(単純なものに適しています)
MCTS(物事が複雑になったとき)とアルファバリエーション(上記参照)
さまざまな推論パスがどれだけ優れているかを追跡します
クロードが問題をどのように考えるか、さまざまな方法を図示する
推論プロセスがどのように行われたかを分析する
MCPプロトコルに従う(当然のことながら)
Related MCP server: MCP Think Tool
インストール
構成
Claude Desktop 設定に追加:
テスト
[さらなるテストは近日中に実施予定]
ベンチマーク
[ベンチマークは近日追加予定]
テスト対象の主要なベンチマーク:
数学500
GPQA-ダイヤモンド
GMSK8
おそらくポリグロットとSWEベンチ
ライセンス
このプロジェクトは MIT ライセンスに基づいてライセンスされています - 詳細についてはLICENSEファイルを参照してください。