EntityIdentification

by u3588064
MIT License
1

Integrations

  • Provides contact information through WeChat for support and inquiries related to the entity identification service.

Identificación de entidad

Identificar si dos conjuntos de datos pertenecen a la misma entidad. 识别两组数据是否来自同一主体

Este es un servidor MCP (Protocolo de contexto modelo). 这是一个支持MCP协议的服务器.

Herramienta de comparación de datos

Esta herramienta ofrece una forma integral de comparar dos conjuntos de datos, evaluando la igualdad exacta y semántica de sus valores. Utiliza la normalización de texto y un modelo de lenguaje para determinar si los datos provienen de la misma entidad.

Características

  • Normalización de texto : convierte el texto a minúsculas, elimina la puntuación y normaliza los espacios en blanco.
  • Comparación de valores : compara valores de forma directa y semántica (ignorando el orden de las listas).
  • Recorrido JSON : itera a través de cada clave en los objetos JSON y compara los valores correspondientes.
  • Integración del modelo de lenguaje : utiliza un modelo de lenguaje generativo para evaluar la similitud semántica y proporcionar un juicio final sobre si los datos provienen de la misma entidad.

Instalación

Para usar esta herramienta, asegúrese de tener instaladas las dependencias necesarias. Puede instalarlas con pip:

pip install genai

Uso

Funciones

  1. normalizar_texto(texto) :
    • Normaliza el texto de entrada convirtiéndolo a minúsculas, eliminando la puntuación y normalizando los espacios en blanco.
  2. comparar_valores(val1, val2) :
    • Compara dos valores de forma exacta y semántica.
    • Si los valores son listas, ignora el orden de los elementos para la comparación semántica.
  3. comparar_json(json1, json2) :
    • Compara dos objetos JSON clave por clave.
    • Utiliza compare_values para evaluar los valores de cada clave.
    • Integra un modelo de lenguaje para evaluar la similitud semántica y proporciona un juicio final.

Ejemplo

import json import genai import re # Define your JSON objects json1 = { "name": "John Doe", "address": "123 Main St, Anytown, USA", "hobbies": ["reading", "hiking", "coding"] } json2 = { "name": "john doe", "address": "123 Main Street, Anytown, USA", "hobbies": ["coding", "hiking", "reading"] } # Compare the JSON objects comparison_results = compare_json(json1, json2) # Generate final matching result model1 = genai.GenerativeModel("gemini-2.0-flash-thinking-exp") result_matching = model1.generate_content("综合这些信息,你认为可以判断两个数据来自同一主体吗?"+json.dumps(comparison_results, ensure_ascii=False, indent=4)) print(result_matching.text)

Contribuyendo

¡Agradecemos sus contribuciones! Abra un problema o envíe una solicitud de incorporación de cambios.

Licencia

Este proyecto está licenciado bajo la Licencia MIT. Consulte el archivo de LICENCIA para más detalles.

Contacto

Si tienes alguna pregunta o sugerencia, por favor ponte en contacto conmigo:

WeChat

-
security - not tested
A
license - permissive license
-
quality - not tested

Un servidor MCP que ayuda a determinar si dos conjuntos de datos pertenecen a la misma entidad comparando la igualdad exacta y semántica a través de la normalización de texto y la integración del modelo de lenguaje.

  1. Data Comparison Tool
    1. Features
    2. Installation
    3. Usage
    4. Contributing
    5. License
    6. Contact

Related MCP Servers

  • -
    security
    A
    license
    -
    quality
    A Model Context Protocol (MCP) server that enables semantic search and retrieval of documentation using a vector database (Qdrant). This server allows you to add documentation from URLs or local files and then search through them using natural language queries.
    Last updated -
    14
    74
    JavaScript
    Apache 2.0
    • Apple
  • -
    security
    A
    license
    -
    quality
    An MCP server aimed to be portable, local, easy and convenient to support semantic/graph based retrieval of txtai "all in one" embeddings database. Any txtai embeddings db in tar.gz form can be loaded
    Last updated -
    23
    Python
    MIT License
    • Linux
    • Apple
  • -
    security
    F
    license
    -
    quality
    A MCP server that fetches and renders Baidu Baike (Chinese Wikipedia) discussion content, allowing users to access encyclopedia article discussions and generate readable analysis of the structured data.
    Last updated -
    TypeScript
  • -
    security
    F
    license
    -
    quality
    A custom MCP server that allows storage, retrieval, and management of text-based information with natural language commands and keyword detection.
    Last updated -
    TypeScript
    • Linux
    • Apple

View all related MCP servers

ID: z9wi2cajre