Skip to main content
Glama

EntityIdentification

by u3588064

Идентификация сущности

Определите, относятся ли два набора данных к одному и тому же объекту. 识别两组数据是否来自同一主体

Это сервер MCP (Model Context Protocol). 这是一个支持MCP или 议的服务器。

Инструмент сравнения данных

Этот инструмент предоставляет комплексный способ сравнения двух наборов данных, оценивая как точное, так и семантическое равенство их значений. Он использует нормализацию текста и языковую модель, чтобы определить, происходят ли данные из одной и той же сущности.

Функции

  • Нормализация текста : преобразует текст в нижний регистр, удаляет знаки препинания и нормализует пробелы.
  • Сравнение значений : сравнивает значения напрямую и семантически (игнорируя порядок списков).
  • Обход JSON : выполняет итерацию по каждому ключу в объектах JSON и сравнивает соответствующие значения.
  • Интеграция языковой модели : использует генеративную языковую модель для оценки семантического сходства и вынесения окончательного суждения о том, принадлежат ли данные одному и тому же субъекту.

Установка

Чтобы использовать этот инструмент, убедитесь, что у вас установлены необходимые зависимости. Вы можете установить их с помощью pip:

pip install genai

Использование

Функции

  1. нормализовать_текст(текст) :
    • Нормализует входной текст, преобразуя его в нижний регистр, удаляя знаки препинания и нормализуя пробелы.
  2. сравнить_значения(знач1, значение2) :
    • Сравнивает два значения как точно, так и семантически.
    • Если значения представляют собой списки, порядок элементов для семантического сравнения игнорируется.
  3. сравнить_json(json1, json2) :
    • Сравнивает два объекта JSON по ключу.
    • Использует compare_values для оценки значений каждого ключа.
    • Интегрирует языковую модель для оценки семантического сходства и выносит окончательное решение.

Пример

import json import genai import re # Define your JSON objects json1 = { "name": "John Doe", "address": "123 Main St, Anytown, USA", "hobbies": ["reading", "hiking", "coding"] } json2 = { "name": "john doe", "address": "123 Main Street, Anytown, USA", "hobbies": ["coding", "hiking", "reading"] } # Compare the JSON objects comparison_results = compare_json(json1, json2) # Generate final matching result model1 = genai.GenerativeModel("gemini-2.0-flash-thinking-exp") result_matching = model1.generate_content("综合这些信息,你认为可以判断两个数据来自同一主体吗?"+json.dumps(comparison_results, ensure_ascii=False, indent=4)) print(result_matching.text)

Внося вклад

Вклады приветствуются! Пожалуйста, откройте тему или отправьте запрос на извлечение.

Лицензия

Этот проект лицензирован по лицензии MIT. Подробности см. в файле LICENSE .

Контакт

Если у вас есть вопросы или предложения, свяжитесь со мной:

Wechat qrкод\_для\_gh\_643efb7db5bc\_344(1)

-
security - not tested
A
license - permissive license
-
quality - not tested

Сервер MCP, который помогает определить, принадлежат ли два набора данных одной и той же сущности, сравнивая как точное, так и семантическое равенство посредством нормализации текста и интеграции языковой модели.

  1. Инструмент сравнения данных
    1. Функции
    2. Установка
    3. Использование
    4. Внося вклад
    5. Лицензия
    6. Контакт

Related MCP Servers

  • -
    security
    A
    license
    -
    quality
    A Model Context Protocol (MCP) server that enables semantic search and retrieval of documentation using a vector database (Qdrant). This server allows you to add documentation from URLs or local files and then search through them using natural language queries.
    Last updated -
    14
    74
    JavaScript
    Apache 2.0
    • Apple
  • -
    security
    A
    license
    -
    quality
    An MCP server aimed to be portable, local, easy and convenient to support semantic/graph based retrieval of txtai "all in one" embeddings database. Any txtai embeddings db in tar.gz form can be loaded
    Last updated -
    26
    Python
    MIT License
    • Linux
    • Apple
  • -
    security
    F
    license
    -
    quality
    A MCP server that fetches and renders Baidu Baike (Chinese Wikipedia) discussion content, allowing users to access encyclopedia article discussions and generate readable analysis of the structured data.
    Last updated -
    TypeScript
  • -
    security
    F
    license
    -
    quality
    A custom MCP server that allows storage, retrieval, and management of text-based information with natural language commands and keyword detection.
    Last updated -
    TypeScript
    • Linux
    • Apple

View all related MCP servers

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/u3588064/Entity-Resolution'

If you have feedback or need assistance with the MCP directory API, please join our Discord server