实体识别

识别两组数据是否来自同一实体。识别数据是否来自同一主体

这是一个 MCP（模型上下文协议）服务器。这是一个支持MCP协议的服务器。

数据比较工具

此工具提供了一种全面的方法，可以比较两组数据，评估其值的精确性和语义相等性。它利用文本规范化和语言模型来确定数据是否来自同一实体。

特征

文本规范化：将文本转换为小写，删除标点符号，并规范化空格。
值比较：直接和语义上比较值（忽略列表的顺序）。
JSON 遍历：遍历 JSON 对象中的每个键并比较相应的值。
语言模型集成：使用生成语言模型评估语义相似度，并对数据是否来自同一实体做出最终判断。

安装

要使用此工具，请确保已安装必要的依赖项。您可以使用 pip 安装它们：

pip install genai

用法

功能

规范化文本（文本） ：
- 通过将输入文本转换为小写、删除标点符号和规范化空格来规范化输入文本。
比较值（val1，val2） ：
- 精确且语义地比较两个值。
- 如果值是列表，它会忽略元素的顺序以进行语义比较。
比较json（json1，json2） ：
- 按键比较两个 JSON 对象。
- 使用compare_values来评估每个键的值。
- 集成语言模型评估语义相似度并给出最终判断。

例子

import json
import genai
import re

# Define your JSON objects
json1 = {
    "name": "John Doe",
    "address": "123 Main St, Anytown, USA",
    "hobbies": ["reading", "hiking", "coding"]
}

json2 = {
    "name": "john doe",
    "address": "123 Main Street, Anytown, USA",
    "hobbies": ["coding", "hiking", "reading"]
}

# Compare the JSON objects
comparison_results = compare_json(json1, json2)

# Generate final matching result
model1 = genai.GenerativeModel("gemini-2.0-flash-thinking-exp")
result_matching = model1.generate_content("综合这些信息，你认为可以判断两个数据来自同一主体吗？"+json.dumps(comparison_results, ensure_ascii=False, indent=4))
print(result_matching.text)

贡献

欢迎贡献！请打开一个问题或提交一个拉取请求。

执照

本项目遵循 MIT 许可证。详情请参阅LICENSE文件。

接触

如果您有任何问题或建议，请联系我：

邮箱： u3588064@connect.hku.hk
GitHub: u3588064@connect.hku.hk 。

微信 $qrcode\_for\_gh\_643efb7db5bc\_344(1)$

EntityIdentification

实体识别

数据比较工具

特征

安装

用法

功能

例子

贡献

执照

接触

Related MCP Servers

PowerPlatform MCP

MCP-MultilspyLSP

Zanny's Persistent Memory Manager

AgentModeofficial

New MCP Servers

MCP directory API