Идентификация сущности
Определите, относятся ли два набора данных к одному и тому же объекту. 识别两组数据是否来自同一主体
Это сервер MCP (Model Context Protocol). 这是一个支持MCP или 议的服务器。
Инструмент сравнения данных
Этот инструмент предоставляет комплексный способ сравнения двух наборов данных, оценивая как точное, так и семантическое равенство их значений. Он использует нормализацию текста и языковую модель, чтобы определить, происходят ли данные из одной и той же сущности.
Функции
- Нормализация текста : преобразует текст в нижний регистр, удаляет знаки препинания и нормализует пробелы.
- Сравнение значений : сравнивает значения напрямую и семантически (игнорируя порядок списков).
- Обход JSON : выполняет итерацию по каждому ключу в объектах JSON и сравнивает соответствующие значения.
- Интеграция языковой модели : использует генеративную языковую модель для оценки семантического сходства и вынесения окончательного суждения о том, принадлежат ли данные одному и тому же субъекту.
Установка
Чтобы использовать этот инструмент, убедитесь, что у вас установлены необходимые зависимости. Вы можете установить их с помощью pip:
Использование
Функции
- нормализовать_текст(текст) :
- Нормализует входной текст, преобразуя его в нижний регистр, удаляя знаки препинания и нормализуя пробелы.
- сравнить_значения(знач1, значение2) :
- Сравнивает два значения как точно, так и семантически.
- Если значения представляют собой списки, порядок элементов для семантического сравнения игнорируется.
- сравнить_json(json1, json2) :
- Сравнивает два объекта JSON по ключу.
- Использует
compare_values
для оценки значений каждого ключа. - Интегрирует языковую модель для оценки семантического сходства и выносит окончательное решение.
Пример
Внося вклад
Вклады приветствуются! Пожалуйста, откройте тему или отправьте запрос на извлечение.
Лицензия
Этот проект лицензирован по лицензии MIT. Подробности см. в файле LICENSE .
Контакт
Если у вас есть вопросы или предложения, свяжитесь со мной:
- Электронная почта: u3588064@connect.hku.hk
- GitHub: u3588064@connect.hku.hk 。
Wechat
This server cannot be installed
Сервер MCP, который помогает определить, принадлежат ли два набора данных одной и той же сущности, сравнивая как точное, так и семантическое равенство посредством нормализации текста и интеграции языковой модели.
Related MCP Servers
- -securityAlicense-qualityA Model Context Protocol (MCP) server that enables semantic search and retrieval of documentation using a vector database (Qdrant). This server allows you to add documentation from URLs or local files and then search through them using natural language queries.Last updated -1474JavaScriptApache 2.0
- -securityAlicense-qualityAn MCP server aimed to be portable, local, easy and convenient to support semantic/graph based retrieval of txtai "all in one" embeddings database. Any txtai embeddings db in tar.gz form can be loadedLast updated -26PythonMIT License
- -securityFlicense-qualityA MCP server that fetches and renders Baidu Baike (Chinese Wikipedia) discussion content, allowing users to access encyclopedia article discussions and generate readable analysis of the structured data.Last updated -TypeScript
- -securityFlicense-qualityA custom MCP server that allows storage, retrieval, and management of text-based information with natural language commands and keyword detection.Last updated -TypeScript