エンティティ識別
2 つのデータセットが同じエンティティからのものであるかどうかを識別します。 2 つのグループのデータが同じ本体からのものかどうかを確認する
これは、MCP (Model Context Protocol) サーバーです。 これは、MCP プロトコルをサポートするサーバーです。
データ比較ツール
このツールは、2つのデータセットを比較する包括的な方法を提供し、値の正確性と意味的等価性の両方を評価します。テキスト正規化と言語モデルを活用して、データが同じエンティティに由来するかどうかを判断します。
特徴
テキストの正規化: テキストを小文字に変換し、句読点を削除し、空白を正規化します。
値の比較: 値を直接かつ意味的に比較します (リストの順序は無視されます)。
JSON トラバーサル: JSON オブジェクト内の各キーを反復処理し、対応する値を比較します。
言語モデルの統合: 生成言語モデルを使用して意味の類似性を評価し、データが同じエンティティからのものであるかどうかの最終的な判断を提供します。
Related MCP server: MCP-MultilspyLSP
インストール
このツールを使用するには、必要な依存関係がインストールされていることを確認してください。pipを使ってインストールできます。
使用法
機能
normalize_text(テキスト) :
入力テキストを小文字に変換し、句読点を削除し、空白を正規化することで正規化します。
compare_values(val1, val2) :
2 つの値を正確に、また意味的に比較します。
値がリストの場合、意味的な比較では要素の順序は無視されます。
compare_json(json1, json2) :
2 つの JSON オブジェクトをキーごとに比較します。
compare_valuesを使用して各キーの値を評価します。言語モデルを統合して意味の類似性を評価し、最終的な判断を下します。
例
貢献
貢献を歓迎します!問題を報告したり、プルリクエストを送信してください。
ライセンス
このプロジェクトはMITライセンスの下で提供されています。詳細はLICENSEファイルをご覧ください。
接触
ご質問やご提案がございましたら、下記までご連絡ください。
メールアドレス: u3588064@connect.hku.hk
GitHub: u3588064@connect.hku.hk 。
微信