extract_entities
Extract named entities from text in 35+ languages. Automatically detects language or selects Czech or multilingual model to identify persons, organizations, locations, and more.
Instructions
Rozpozná pojmenované entity pomocí NameTag 3 — CZ i 30+ dalších jazyků.
Pro **češtinu** používá bohatý CNEC 2.0 tagset (osoba/firma/instituce/
PSČ/telefon/datum/…). Pro ostatní jazyky (SK, EN, DE, FR, IT, ES, PT,
NL, PL, HU, UK, RU, RO, SL, BG, EL, HR, SR, FI, LT, LV, ET, DA, SV,
NO, ZH, AR, TR, VI, HI a další) přepne na multilingvální UNER model
s tagsetem PER/ORG/LOC.
Args:
text: Vstupní text (UTF-8).
model: ``auto`` (default) — automatická detekce CZ vs non-CZ.
``czech`` vynutí CNEC 2.0 (bohatý CZ tagset). ``multilingual``
vynutí UNER PER/ORG/LOC pro non-CZ. Lze zadat i plné jméno
modelu (např. ``nametag3-multilingual-onto-250203``).
fix_romance: Default True. Pro PT/ES texty oprava typického
UNER bugu, kdy se "X de Place" zaeviduje celé jako PER —
wrapper rozdělí na PER + LOC a generuje warning.
include_xml: Default ``False``. Inline XML s ``<ne type="...">`` tagy
pro HTML highlighting (extra API call).
include_vertical: Default ``False``. Tabulkový formát ``id\ttype\ttext``
(extra API call).
Returns:
``entities`` (list s ``type``, ``label``, ``text``, ``tokens``,
``nested``), ``model``, ``count``, ``warnings``,
``detected_language`` (jen u ``auto``),
``xml`` (jen pokud ``include_xml``),
``vertical`` (jen pokud ``include_vertical``).
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| text | Yes | ||
| model | No | auto | |
| fix_romance | No | ||
| include_xml | No | ||
| include_vertical | No |
Output Schema
| Name | Required | Description | Default |
|---|---|---|---|
No arguments | |||