Entitätsidentifikation
Identifizieren Sie, ob zwei Datensätze von derselben Entität stammen. 识别两组数据是否来自同一主体
Dies ist ein MCP-Server (Model Context Protocol). 这是一个支持MCP协议的服务器.
Datenvergleichstool
Dieses Tool bietet eine umfassende Möglichkeit, zwei Datensätze zu vergleichen und sowohl die exakte als auch die semantische Übereinstimmung ihrer Werte zu bewerten. Es nutzt Textnormalisierung und ein Sprachmodell, um festzustellen, ob die Daten von derselben Entität stammen.
Merkmale
- Textnormalisierung : Wandelt Text in Kleinbuchstaben um, entfernt Satzzeichen und normalisiert Leerzeichen.
- Wertevergleich : Vergleicht Werte direkt und semantisch (ohne Berücksichtigung der Reihenfolge bei Listen).
- JSON-Traversierung : Durchläuft jeden Schlüssel in den JSON-Objekten und vergleicht die entsprechenden Werte.
- Sprachmodellintegration : Verwendet ein generatives Sprachmodell, um semantische Ähnlichkeiten zu bewerten und eine endgültige Beurteilung darüber abzugeben, ob die Daten von derselben Entität stammen.
Installation
Um dieses Tool zu verwenden, stellen Sie sicher, dass Sie die erforderlichen Abhängigkeiten installiert haben. Sie können diese mit pip installieren:
Verwendung
Funktionen
- normalize_text(text) :
- Normalisiert den Eingabetext, indem er in Kleinbuchstaben umgewandelt, Satzzeichen entfernt und Leerzeichen normalisiert werden.
- Vergleichswerte(Wert1, Wert2) :
- Vergleicht zwei Werte sowohl exakt als auch semantisch.
- Wenn es sich bei den Werten um Listen handelt, wird die Reihenfolge der Elemente beim semantischen Vergleich ignoriert.
- compare_json(json1, json2) :
- Vergleicht zwei JSON-Objekte Schlüssel für Schlüssel.
- Verwendet
compare_values
, um die Werte jedes Schlüssels auszuwerten. - Integriert ein Sprachmodell zur Bewertung semantischer Ähnlichkeiten und liefert ein endgültiges Urteil.
Beispiel
Beitragen
Beiträge sind willkommen! Bitte melden Sie ein Problem oder senden Sie einen Pull Request.
Lizenz
Dieses Projekt ist unter der MIT-Lizenz lizenziert. Weitere Informationen finden Sie in der Datei LICENSE .
Kontakt
Bei Fragen und Anregungen kontaktieren Sie mich gerne:
- E-Mail: u3588064@connect.hku.hk
- GitHub: u3588064@connect.hku.hk 。
Wechat
This server cannot be installed
Ein MCP-Server, der dabei hilft, festzustellen, ob zwei Datensätze zur selben Entität gehören, indem er durch Textnormalisierung und Sprachmodellintegration sowohl die exakte als auch die semantische Gleichheit vergleicht.
Related MCP Servers
- -securityAlicense-qualityA Model Context Protocol (MCP) server that enables semantic search and retrieval of documentation using a vector database (Qdrant). This server allows you to add documentation from URLs or local files and then search through them using natural language queries.Last updated -1474JavaScriptApache 2.0
- -securityAlicense-qualityAn MCP server aimed to be portable, local, easy and convenient to support semantic/graph based retrieval of txtai "all in one" embeddings database. Any txtai embeddings db in tar.gz form can be loadedLast updated -26PythonMIT License
- -securityFlicense-qualityA MCP server that fetches and renders Baidu Baike (Chinese Wikipedia) discussion content, allowing users to access encyclopedia article discussions and generate readable analysis of the structured data.Last updated -TypeScript
- -securityFlicense-qualityA custom MCP server that allows storage, retrieval, and management of text-based information with natural language commands and keyword detection.Last updated -TypeScript